Contenuti duplicati: la guida definitiva per trovare e correggere contenuti duplicati per una migliore SEO
Pubblicato: 2019-10-18Il contenuto duplicato è dannoso. L'utilizzo dello stesso contenuto, in forma totale o parziale, sul tuo sito web porta a un'esperienza utente scadente e attiva una bandiera rossa nell'algoritmo di ricerca di Google. Ai vecchi tempi della SEO, i contenuti duplicati venivano spesso usati come un trucco economico per ottenere più parole chiave e più contenuti sul tuo sito web, quindi Google ha evoluto un sistema per eliminare gli spammer che hanno violato le migliori pratiche in questo modo. Oggi, se vieni sorpreso a utilizzare contenuti duplicati, la tua autorità di dominio potrebbe risentirne e il posizionamento delle tue parole chiave potrebbe diminuire.
Fortunatamente, Google è abbastanza onesto riguardo al problema. L'azienda comprende che la maggior parte dei problemi relativi ai contenuti duplicati non si verifica come un tentativo dannoso di aumentare il rango a basso costo. In realtà, la maggior parte dei casi di contenuti duplicati sono incidenti o vengono trascurati dai webmaster. Tuttavia, avere troppi contenuti ripetuti sul tuo sito può essere dannoso ed è nel tuo interesse eseguire un test per vedere se c'è qualche duplicazione sul tuo sito.
introduzione
Da quando ho iniziato a bagnarmi i piedi nella SEO, questa domanda ha turbinato nei forum e nei blog. Da qualche parte, qualcuno là fuori ha perpetuato l'idea che avere lo stesso contenuto sulla pagina A del tuo sito web della pagina B del tuo sito web avrebbe causato la penalizzazione del tuo sito nelle classifiche dei motori di ricerca. Questa idea ha iniziato a diffondersi nella comunità del marketing su Internet perché un gruppo di spammer si è reso conto che quando avevano un contenuto (ad esempio un articolo) che riceveva molto traffico di ricerca, potevano riempire ogni pagina del loro sito Web con il stesso contenuto per attirare ancora più traffico dai motori di ricerca. Ovviamente, lo stesso articolo palesemente duplicato su centinaia di pagine all'interno di un singolo dominio è un tentativo dannoso di ottenere traffico sui motori di ricerca senza aggiungere alcun valore. Google ha capito abbastanza rapidamente questo metodo e ha corretto i suoi algoritmi per rilevare contenuti duplicati e visualizzarne solo una versione nelle classifiche di ricerca. I siti web che si sono impegnati in questa sfacciata attività sono stati deindicizzati e hanno fatto irruzione nei forum e nei blog della comunità di marketing su Internet. Nasce così il timore della “penalità del contenuto duplicato”.
Tuttavia, nella stragrande maggioranza dei casi, il contenuto duplicato non è dannoso e semplicemente un prodotto di qualsiasi CMS (sistema di gestione dei contenuti) su cui il sito Web è in esecuzione. Ad esempio, WordPress (il CMS standard del settore) crea automaticamente pagine "Categoria" e "tag" che elencano tutti i post del blog all'interno di determinate categorie o tag. Questo crea più URL all'interno del dominio che contengono lo stesso contenuto.
1) Google potrebbe decidere di lasciarmi andare con un "avviso" e semplicemente scegliere di non indicizzare 99 dei miei 100 post duplicati, ma di mantenerne uno indicizzato. NOTA: questo non significa che le classifiche di ricerca del mio sito web ne risentiranno in alcun modo.
2) Google potrebbe decidere che si tratta di un tentativo così sfacciato di ingannare il sistema che de-indicizza completamente il mio intero sito Web da tutti i risultati di ricerca. Ciò significa che, anche se cercassi direttamente "Example.com", Google non troverebbe risultati.
Quindi, uno di questi due scenari è garantito che accada. Quale dipende da quanto egregio Google determina il tuo errore. Nelle parole di Google:
Il contenuto duplicato su un sito non è motivo di azione su quel sito, a meno che non sembri che l'intento del contenuto duplicato sia ingannevole e manipolare i risultati dei motori di ricerca. Se il tuo sito presenta problemi di contenuto duplicato e non segui i consigli sopra elencati, facciamo un buon lavoro nella scelta di una versione del contenuto da mostrare nei nostri risultati di ricerca.
Questo tipo di duplicazione non dannosa è abbastanza comune, soprattutto perché molti CMS non lo gestiscono bene per impostazione predefinita. Quindi, quando le persone dicono che avere questo tipo di contenuto duplicato può influenzare il tuo sito, non è perché potresti essere penalizzato; è semplicemente dovuto al modo in cui funzionano i siti web ei motori di ricerca.
La maggior parte dei motori di ricerca si sforza di raggiungere un certo livello di varietà; vogliono mostrarti dieci risultati diversi in una pagina dei risultati di ricerca, non dieci URL diversi che hanno tutti lo stesso contenuto. A tal fine, Google cerca di filtrare i documenti duplicati in modo che gli utenti sperimentino meno ridondanza.
Quindi, cosa succede quando un crawler di un motore di ricerca rileva contenuti duplicati? (da https://searchengineland.com/search-illustrated-how-a-search-engine-determines-duplicate-content-13980)
In che modo Google penalizza i contenuti duplicati

Google è abbastanza aperto riguardo alle sue politiche sui contenuti duplicati. Secondo i loro rapporti, se Google incontra due versioni diverse della stessa pagina Web o contenuti che sono sensibilmente simili al contenuto del sito altrove, selezionerà casualmente una versione "canonica" da indicizzare. L'esempio che danno è questo: immagina di avere una pagina web standard e una versione stampabile della stessa pagina web, completa di contenuti identici. Google sceglierebbe a caso una di queste pagine da indicizzare e ignorerebbe completamente l'altra versione. Ciò non implica alcuna penalità, ma è nel tuo interesse assicurarti che Google indicizzi e organizzi correttamente il tuo sito.
Il vero problema arriva quando Google sospetta che i tuoi contenuti siano duplicati in modo dannoso o manipolativo. Fondamentalmente, se Google pensa che i tuoi contenuti duplicati siano stati uno sforzo per ingannare il loro algoritmo di ranking, dovrai affrontare un'azione punitiva. È nel tuo interesse chiarire eventuali errori con largo anticipo per evitare un tale destino per il tuo sito.
Syndication: contenuti duplicati tra domini
A volte, lo stesso contenuto può apparire parola per parola su URL diversi. Alcuni esempi di questo includono:
- Articoli di notizie (pensa ad Associated Press)
- Lo stesso articolo da una directory di articoli viene raccolto da diversi webmaster
- Webmaster che inviano lo stesso contenuto a directory di articoli differenti
- Comunicati stampa distribuiti sul Web
- Informazioni sui prodotti di un produttore che appaiono su diversi siti di e-commerce
Tutti questi esempi derivano dalla syndication dei contenuti . Il Web è pieno di contenuti in syndication. Un comunicato stampa può creare contenuti duplicati su migliaia di domini unici. Ma i motori di ricerca si sforzano di offrire una buona esperienza utente agli utenti che effettuano ricerche e fornire una pagina di risultati composta dagli stessi contenuti non renderebbe felici molte persone. Quindi cosa dovrebbe fare un motore di ricerca? In qualche modo, deve decidere quale posizione del contenuto è la più rilevante da mostrare al ricercatore. Quindi come lo fa? Direttamente dalla G grande:
Quando incontriamo tali contenuti duplicati su siti diversi, esaminiamo vari segnali per determinare quale sito è quello originale, che di solito funziona molto bene. Ciò significa anche che non dovresti preoccuparti molto di vedere effetti negativi sulla presenza del tuo sito su Google se noti che qualcuno raschia i tuoi contenuti.
Bene, Google, mi permetto di dissentire. Sfortunatamente, non penso che tu sia molto bravo a decidere quale sito è l'autore del contenuto. Né Michael Gray, che nel suo post sul blog "When Google Gets Duplicate Content Wrong" si lamenta che Google attribuisce spesso i suoi contenuti originali ad altri siti a cui distribuisce i suoi contenuti. Secondo Michele:
Tuttavia, il problema è con Google, il loro algoritmo di ranking IMHO pone un pregiudizio eccessivo sulla fiducia e sull'autorità del dominio.
E sono d'accordo con Michele. Per gran parte della mia carriera di marketing su Internet, ho distribuito articoli completi a varie directory di articoli al fine di espandere la portata dei miei contenuti e allo stesso tempo utilizzarli come "carburante SEO" per ottenere backlink white hat ai miei siti Web. Secondo Google, fintanto che le tue versioni in syndication contengono un backlink al tuo originale, questo aiuterà il tuo caso quando Google deciderà quale pezzo è l'originale. Ecco la prova:
Innanzitutto, un video con Matt Cutts, un noto blogger ed ex ingegnere di algoritmi dei motori di ricerca per Google:
La discussione sulla syndication inizia alle 2:25 circa. A 2:54 dice che puoi dire alla gente che sei il "padrone del contenuto" includendo un link dal pezzo in syndication al tuo pezzo originale.
Altre prove:
Nei casi in cui stai distribuendo i tuoi contenuti ma vuoi anche assicurarti che il tuo sito sia identificato come la fonte originale, è utile chiedere ai tuoi partner di syndication di includere un link al tuo contenuto originale.
E infine:
Distribuisci attentamente : se pubblichi i tuoi contenuti su altri siti, Google mostrerà sempre la versione che riteniamo più appropriata per gli utenti in ogni data ricerca, che potrebbe essere o meno la versione che preferisci. Tuttavia, è utile assicurarsi che ogni sito su cui viene distribuito il contenuto includa un collegamento al tuo articolo originale. Puoi anche chiedere a coloro che utilizzano il tuo materiale in syndication di utilizzare il meta tag noindex per impedire ai motori di ricerca di indicizzare la loro versione del contenuto.
Ora, quello che penso sia interessante da quest'ultima citazione di Google è che in realtà ammettono che il contenuto che scelgono potrebbe non essere quello giusto. Nella mia esperienza, è molto probabile che non scelga quello giusto se il sito che ha originato il contenuto è relativamente giovane o ha un PageRank basso. Quindi questo solleva il prossimo grande problema:
Come posso essere classificato come fonte originale per il contenuto che pubblichi in syndication?

In una vita passata, ho distribuito tonnellate dei miei articoli su EzineArticles solo per vedere Google accreditarli con risultati di ricerca più elevati per i miei contenuti, anche quando mi sono assicurato che Google avesse indicizzato i miei contenuti nella posizione originale prima di inviarli a Ezine. Vanessa Fox, che in precedenza ha lavorato presso Google e ha creato Webmaster Central, tenta di affrontare questa domanda nel suo post sul blog, "Classifica come fonte originale per i contenuti che condividi".
Sfortunatamente, conclude che, fondamentalmente, non c'è niente che puoi fare per assicurarti di farlo. Lei suggerisce:
Crea una versione diversa del contenuto da distribuire rispetto a quella che scrivi per il tuo sito. Questo metodo funziona meglio per cose come i feed di affiliazione del prodotto. Non credo che funzioni altrettanto bene per cose come post di blog o altri tipi di articoli. Invece, potresti fare qualcosa come scrivere un articolo riassuntivo di alto livello per la syndication e un post sul blog con dettagli su quell'argomento per il tuo sito.
Riscrivere un contenuto non è la mia definizione di syndication. Questo è solo riscrivere un articolo con parole diverse e distribuirlo. Quasi tutte le informazioni che circolano sul web sono comunque già state pubblicate altrove; anche questo post sul blog è composto da una tonnellata di informazioni che ho trovato altrove su Internet. Quindi, per me, scrivere un nuovo articolo che dica la stessa cosa con parole diverse e distribuirlo ai partner di syndication non è proprio syndication dell'articolo originale. È la diffusione di un articolo diverso. Quindi siamo rimasti ancora con la questione dei risultati di sindacare esattamente lo stesso contenuto che appare già sul tuo sito web: quali sono gli effetti di farlo? Può danneggiare in qualche modo la mia classifica ?
Per me, questa è la domanda più importante relativa ai contenuti duplicati. Prima di saltare in quell'analisi, consideriamo un'importante domanda fondamentale.
Perché dovrei voler distribuire lo stesso identico contenuto dal mio sito web altrove?
Internet funziona davvero su una semplice economia di dare e avere. Le due materie prime che vengono scambiate sono contenuti unici e backlink . I Contenuti Unici sono definiti come contenuti che Google non identifica come duplicati. Ci sono varie teorie su dove esattamente Google traccia la linea di decisione se il contenuto debba essere considerato duplicato , ma una cifra che ho sentito lanciare molto è del 30%. Fondamentalmente, secondo la teoria del 30%, se Google identifica che più del 30% di un particolare contenuto appare altrove su Internet, verrà classificato come duplicato. Ora, non posso attestare l'accuratezza di questa cifra, quindi prendila per quello che vale. Esistono anche vari software di rilevamento di contenuti duplicati come CopyScape, progettato per aiutare i webmaster a verificare se i loro contenuti sono stati rubati e duplicati su altri domini. Questo è anche un buon strumento da utilizzare per determinare se è probabile che i tuoi contenuti vengano considerati duplicati da Google. Ed è questo che conta davvero.
Ma sono andato un po' fuori strada, quindi torniamo alla discussione sul motivo per cui vorresti distribuire i contenuti. Ho menzionato l'economia di Internet dei backlink e dei contenuti unici. Il contenuto unico è desiderabile perché sarà indicizzato da Google, dando a quel particolare sito Web un'altra istanza del suo "nome nel cappello" per così dire. Fondamentalmente, più contenuti ha indicizzato un sito web, maggiori sono le possibilità che venga restituito nei risultati di ricerca di Google per le query pertinenti.
Ma per quanto riguarda i backlink? I backlink sono semplicemente collegamenti da qualsiasi altro sito Web al tuo. I motori di ricerca considerano un "voto" quando un sito Web si collega a un altro. Questo voto viene utilizzato per determinare l'autorità e la pertinenza nei risultati di ricerca di Google. In effetti, si pensa che i backlink siano il singolo fattore più importante nel determinare il posizionamento del tuo sito Web per una determinata query. Ci sono un sacco di fattori che giocano sui backlink e su quanto conta il loro "voto", ma ne parlerò in un prossimo post sul blog. Per ora, quello che devi sapere è che i backlink sono preziosi perché migliorano il tuo posizionamento nei motori di ricerca e questo significa più traffico sul tuo sito web.
OK, ora abbiamo coperto le materie prime di base della microeconomia del Web. Questo è importante perché quando distribuisci i tuoi contenuti, supponendo che tu abbia incluso un backlink che rimandi alla tua fonte originale, ottieni un backlink da ogni sito Web a cui il tuo contenuto è stato sindacato. Fantastico, vero?
Forse no. La prima domanda è quanto Google apprezzi un backlink da un contenuto che è noto per essere contenuto duplicato. Francamente, non lo so. Da un lato, è facile distribuire contenuti a un gruppo di blog che accettano automaticamente se il tuo unico obiettivo è ottenere collegamenti a ritroso, e questo non dice nulla sulla qualità dei tuoi contenuti o su quanto l'autore del contenuto dovrebbe essere ricompensato. D'altra parte, la syndication può anche essere un ottimo indicatore della qualità di un particolare contenuto. Dopotutto, perché dovrebbe essere sindacato così tanto se non fosse davvero eccezionale?
Alla fine, Google probabilmente ha dei segnali su come risponde a queste due domande, ma le vere risposte sono probabilmente conosciute solo dagli ingegneri del software che hanno codificato l'algoritmo. Molte persone cercano di aumentare il valore dei loro contenuti in syndication impegnandosi in una "rotazione" dei contenuti che è perfettamente legittima finché non è la spazzatura che viene spesso sputata fuori dal software automatizzato. Andrò più in profondità sulla rotazione dei contenuti in un post successivo. Per ora, stiamo ancora cercando di rispondere alla domanda se distribuire il contenuto esattamente come appare sul tuo sito web sia una buona o una cattiva idea. Dopo accurati test sono giunto alla seguente conclusione:
.
…
…….
*rullo di tamburi*
…
……
*più rullo di tamburi*
…..
…
Forse.
Lo so, lo so. Non è la risposta che volevi. Mi permetta di spiegare.
Possiedo più di 50 domini e mi piace fare molti test su di essi. Ieri sera ho trascorso un paio d'ore a eseguire ricerche per i miei contenuti che avevo distribuito in vari altri blog e directory. E quello che ho trovato è stato sia deludente che incoraggiante.
La parte deludente è stata che, in molti casi, il mio contenuto in syndication ha superato il mio contenuto originale. Anche se un sito classificato più in alto del mio per i miei contenuti avesse un backlink al mio sito, il creatore del contenuto, era come se Google ignorasse completamente quel backlink e continuasse a dare più credito agli altri siti. In alcuni casi, la versione del contenuto del mio sito non si trovava da nessuna parte, ovviamente cadendo nel cluster di URL duplicati di Google ed essendo filtrata dai risultati di ricerca. Ciò significa che sindacando i miei contenuti, in effetti, ho de-indicizzato i miei contenuti.
Questo è praticamente lo scenario peggiore possibile, ma è successo. A volte, almeno. E questa è la parte strana; a volte, il mio contenuto è stato riconosciuto come contenuto originale e ha ricevuto il punteggio più alto. Con altri siti e pezzi di contenuto, si è classificato al secondo posto dietro a un sito di alta autorità, di solito EzineArticles. Quindi devo concludere quanto segue:
Quando pubblichi in syndication il tuo contenuto, potrebbe:
- Fai in modo che la tua fonte di contenuto originale (cioè il tuo sito web) sia, in effetti, deindicizzata per quel pezzo di contenuto
- Fai in modo che il tuo sito si posizioni in alto per le query pertinenti ai tuoi contenuti, ma non ai massimi livelli
- Fai in modo che il tuo sito si posizioni al primo posto per i tuoi contenuti
Bene, questo copre praticamente tutte le basi, non è vero? Questi sono tutti i risultati che ho osservato guardando i miei siti e i risultati degli articoli in syndication che hanno avuto origine su quei siti. Fondamentalmente, posso concludere che Google non sempre riesce a farlo bene. E a Google non piace fare nulla con coerenza. L'ultima cosa che vogliono è che noi SEO scopriamo completamente il loro algoritmo, perché una volta che ciò accadrà, l'integrità dei loro risultati di ricerca verrà distrutta mentre la gente li manipola tutti all'inferno.

La parte incoraggiante è stata quando ho scoperto che i backlink dai contenuti in syndication hanno sicuramente aiutato il posizionamento dei miei siti per le mie parole chiave target. Quindi c'è sicuramente almeno un certo valore dei backlink provenienti da contenuti che Google ha etichettato come "duplicato".
Quindi, la domanda rimane: dovrei sindacare i miei contenuti?
Diamo un'occhiata ai vantaggi di farlo:
Vantaggi della diffusione dei tuoi contenuti
- Ottieni backlink da molti siti
- Espandi la tua portata e la consapevolezza del marchio su siti ad alto traffico
- Ottieni traffico diretto tramite referral dai backlink nei tuoi contenuti in syndication
- Modo molto più economico per ottenere backlink rispetto alla scrittura di contenuti nuovi di zecca (o alla riscrittura di contenuti esistenti) per la distribuzione/sindacazione
Svantaggi di sindacare i tuoi contenuti
- I siti a cui ti affidi potrebbero effettivamente superare i tuoi contenuti se hanno un'autorità maggiore del tuo sito, anche se segui i consigli di Google e includi un backlink alla fonte originale del contenuto
- Google potrebbe raggruppare l'URL su cui risiedono i tuoi contenuti con il resto dei duplicati, nascondendolo dalle pagine dei risultati dei motori di ricerca (deindicizzandolo efficacemente)
Quindi, distribuire i tuoi contenuti è rischioso. Puoi sicuramente ottenere il meglio da entrambi i mondi se Google decide che il tuo sito è l'autore del contenuto , premiando così i tuoi contenuti con la prima posizione nei risultati di ricerca e ottenendo anche tutti i succosi backlink che giocano nella tua classifica generale per parole chiave specifiche. Ma se Google si sbaglia (e lo fa, abbastanza spesso, contrariamente a quanto potrebbero pensare), rischi che i tuoi contenuti non vengano mai classificati per le query pertinenti dei motori di ricerca.
E questo mi preoccupa davvero, perché ho sempre ritenuto che non ci fosse nient'altro che qualcun altro possa fare per danneggiare il ranking di un determinato sito web. Dopo aver analizzato questi risultati, temo di aver trovato una scappatoia nella mia argomentazione; se qualcun altro visita il mio sito Web, copia tutti i miei contenuti e li distribuisce in tutto il Web, è possibile che i siti a cui è stato distribuito il mio contenuto siano effettivamente più in alto rispetto al mio sito. Google cerca di risolvere questo problema qui e nel video di Matt Cutts:
Nella maggior parte dei casi, un webmaster non ha alcuna influenza su terze parti che raschiano e ridistribuiscono contenuti senza il consenso del webmaster. Ci rendiamo conto che non è colpa del webmaster interessato, il che a sua volta significa che contenuti identici visualizzati su più siti di per sé non sono considerati intrinsecamente una violazione delle nostre istruzioni per i webmaster. Questo porta semplicemente a ulteriori processi con l'intento di determinare la fonte originale del contenuto, qualcosa in cui Google è abbastanza bravo, poiché nella maggior parte dei casi il contenuto originale può essere identificato correttamente, senza effetti negativi per il sito che ha originato il contenuto.
Ancora una volta, sfortunatamente devo sottolineare che nella mia esperienza, ripetutamente, ho visto il mio contenuto classificarsi peggio dei siti a cui è stato sindacato. Quindi, anche se Google pensa che sia utile identificare la fonte originale del contenuto, i miei dati suggeriscono il contrario. Col tempo, possiamo solo sperare che Google migliori questo aspetto del suo algoritmo; non c'è certamente altro che possiamo fare come Webmaster. Invece, devi solo comprendere i vantaggi e gli svantaggi della syndication e decidere se ti senti a tuo agio nell'assumere i rischi di avere Google che identifica erroneamente la proprietà dei tuoi contenuti.
Ecco un paio di suggerimenti per ridurre al minimo il rischio che Google sbagli (in teoria):
- Pubblica sempre nuovi contenuti sul tuo sito web e quindi attendi di pubblicarli altrove finché Google non ha scansionato e indicizzato i tuoi contenuti. Puoi verificare se una determinata pagina è stata indicizzata eseguendo una query di ricerca del tuo URL esatto, tra virgolette. Se la ricerca restituisce il risultato corretto (cioè non zero risultati), allora è stata indicizzata. Un altro bel trucco che puoi provare è selezionare casualmente 11-12 parole dal tuo contenuto e cercare quella stringa, di nuovo tra virgolette. Non lo penseresti, ma la probabilità che 10-12 parole in una sequenza specifica appaiano altrove sul Web è estremamente ridotta. Provalo ora: copia e incolla una frase a caso da questo paragrafo in Google, racchiudila tra virgolette e guarda quanti risultati ottieni. Probabilmente troverai questo URL solo come risultato, a meno che questo articolo non sia stato distribuito in syndication (questo è anche un ottimo modo per verificare quali siti hanno raccolto i tuoi contenuti quando li distribuisci).
- Includi sempre un backlink nella tua versione in syndication all'URL della fonte del contenuto originale. Google dice che questo è il modo per farlo bene, ma non è ancora una cosa infallibile. Tuttavia, di certo non può far male.
Che ne dici di prendere il suggerimento di Vanessa e riscrivere i tuoi contenuti prima di distribuirli?
Questo risolverebbe sicuramente il problema di ottenere i tuoi contenuti essenzialmente deindidicizzati quando Google attribuisce erroneamente la proprietà dei contenuti, ma ci sono anche alcuni grossi problemi con questo:
- È molto costoso se hai molti contenuti. Pensa a quanto tempo impiegheresti a riscrivere ogni articolo che hai. Questo post da solo supera le 6.000 parole e mi ci sono volute ore e ore per scriverlo! Potresti esternalizzare la riscrittura a un servizio come Human Rewriter, ma questo ti costerà circa $ 4 per 500 parole (meno del costo di SEO e link building), ma la spesa è probabilmente ridondante. Potrebbe diventare molto costoso se hai molti contenuti.
- Stai ancora distribuendo contenuti a tema tematico attorno alle stesse parole chiave del tuo contenuto originale, quindi non è un'esagerazione pensare che il contenuto riscritto supererebbe ancora il tuo contenuto originale per query di ricerca pertinenti, specialmente su siti di alta autorità come EzineArticles.
Contenuti duplicati sullo stesso dominio
L'ultima parola è che, a meno che non si sono davvero palesemente duplicando i tuoi contenuti su tonnellate di URL all'interno dello stesso dominio, non c'è niente di cui preoccuparsi. Uno dei tuoi URL su cui risiede il contenuto duplicato verrà indicizzato e scelto come "rappresentante" di quel cluster di URL. Quando gli utenti eseguono query di ricerca nei motori di ricerca, quel particolare contenuto verrà visualizzato come risultato per le query pertinenti e gli altri URL nel cluster duplicato no. Semplice come quella.
Tuttavia, l'altro lato della medaglia è il contenuto duplicato in diversi domini . E questo è un mostro completamente diverso. Pronto ad affrontarlo? Eccoci qui.
“Contenuto duplicato” tradizionale

Il contenuto duplicato tradizionale è il tipo di contenuto che viene in mente intuitivamente quando senti la frase. Si tratta di contenuti identici o molto simili a contenuti che esistono altrove sul Web (di solito sul tuo sito). Ci sono una serie di motivi per cui un sito duplica intenzionalmente questo contenuto:
- Riprodurre vecchi contenuti per far apparire il tuo sito più aggiornato.
- Copiare materiale più e più volte per aggiungere più pagine al tuo sito.
- Materiale plagiato da spacciare per tuo.
Tutte queste situazioni sono ingannevoli, a volte per gli utenti ea volte per Google, e per la maggior parte i webmaster sanno di stare lontani da queste pratiche. Se ti impegni in loro, probabilmente meriti una penalità.
Contenuto duplicato subdolo
Lo chiamo contenuto duplicato "subdolo" a causa della facilità con cui può intrufolarsi su di te. Non hai intenzione di creare pagine duplicate, ma possono succedere comunque. Di solito ciò è dovuto a un singhiozzo tecnico oa una riproduzione inconsapevole; per esempio:
- Se hai due versioni del tuo sito web per https:// e https://, Google può indicizzare entrambe le versioni di ogni pagina separatamente, quindi contrassegnare quelle pagine come istanze di contenuto duplicato.
- Se disponi di una versione "stampabile" di una pagina Web, verrà visualizzata come un URL separato con lo stesso contenuto.
- Moduli di pagine web completi e modificati per dispositivi mobili, come le sezioni del forum.
Sfortunatamente, la maggior parte di questi casi può sorgere naturalmente mentre crei e modifichi il tuo sito web, a meno che tu non abbia specificamente intrapreso un'azione preventiva per fermarlo.
"Ma non copio i miei contenuti"
La tua prima reazione a questa valutazione potrebbe essere di licenziamento. Non copi i tuoi contenuti da una pagina all'altra. Ti prendi cura meticolosa per assicurarti che ogni pagina del tuo sito sia scritta originariamente, senza frasi o sezioni duplicate.
Sfortunatamente, c'è ancora un rischio per te. Ciò che Google registra come "contenuto duplicato" non è sempre ciò che un utente vede come contenuto duplicato. Un utente che naviga nelle tue pagine potrebbe non incontrare mai una frase ripetuta, ma Google potrebbe eseguire la scansione del tuo sito e trovare dozzine di ripetizioni nei tag del titolo oppure potresti avere più URL non canonizzati che ospitano lo stesso contenuto sulla pagina. Anche se sei sicuro di non aver influenzato direttamente una qualche forma di contenuto duplicato, vale la pena controllare il tuo sito solo per essere sicuro.
Come trovare (e pulire) i contenuti duplicati

Riparare i contenuti duplicati è relativamente facile. Trovarlo è la parte difficile. Come ho detto sopra, i contenuti duplicati possono essere difficili da rilevare, solo perché non hai contenuti ripetuti dal punto di vista dell'esperienza utente non significa che non hai contenuti ripetuti dal punto di vista di un algoritmo di ricerca.
Il tuo primo passo è manuale; passa attraverso il tuo sito e vedi se ci sono ripetizioni ovvie del contenuto. Ad esempio, hai un paragrafo identico che conclude ciascuna delle tue pagine di servizi? Riscrivilo. Hai riutilizzato una sezione di un post del blog passato in un nuovo post? Fai una distinzione. Una volta completata questa scansione manuale iniziale, ci sono due strumenti principali che puoi utilizzare per trovare più istanze nascoste migliori di contenuti duplicati.
Esegui la tua ricerca
Innanzitutto, puoi eseguire una ricerca per vedere attraverso gli occhi di Google. Usa un tag Site: per limitare la ricerca solo al tuo sito e segui con un intitle: tag per cercare una frase specifica. Dovrebbe assomigliare a qualcosa del genere:
Site:thisisyoursite.comintitle:”thisisyourtargetphrase”
Questa ricerca genererà tutti i risultati sul tuo dato sito che sono correlati alla frase scelta. Se vedi più risultati identici, sai di avere un problema di contenuto duplicato.
Controlla gli Strumenti per i Webmaster
Un modo più semplice per verificare la presenza di contenuti duplicati consiste nell'utilizzare Strumenti per i Webmaster di Google per eseguire la scansione del tuo sito e segnalare eventuali errori. Dopo aver creato e verificato il tuo account Strumenti per i Webmaster, vai alla scheda Aspetto nella ricerca e fai clic su "Miglioramenti HTML". Qui potrai vedere e scaricare un elenco di meta descrizioni e tag title duplicati. Questi sono problemi comuni e facilmente risolvibili che richiedono solo un po' di tempo per essere riscritti.
Per determinare se un campione di contenuti duplicati ridurrà le tue classifiche, prima devi determinare perché pubblicherai tali contenuti in primo luogo.
Tutto si riduce al tuo scopo.
Se il tuo obiettivo è provare a violare il sistema utilizzando un contenuto che è stato pubblicato altrove, sei destinato a essere penalizzato. Lo scopo è chiaramente ingannevole e mira a manipolare i risultati di ricerca.
Questo è ciò che Google ha da dire su questo tipo di comportamento:
Il contenuto duplicato su un sito non è motivo di azione su quel sito, a meno che non sembri che l'intento del contenuto duplicato sia ingannevole e manipolare i risultati dei motori di ricerca.
Copyscape

Per 5 centesimi per ricerca, puoi far controllare a Copyscape un intero pezzo per te. Ma se il tuo budget non consente questo tipo di spesa, puoi comunque utilizzare Copyscape gratuitamente. Il problema con Copyscape gratuito è che dovrai prima pubblicare il contenuto online per recuperare il suo URL.
Copia e incolla l'URL del tuo contenuto appena pubblicato nella casella di ricerca di Copyscape. Quello che fa Copyscape è scansionare l'intero interweb per qualsiasi copia del contenuto che hai appena pubblicato.
Copyscape è uno strumento affidabile da cui dipendono molti editori per verificare la qualità e l'originalità. Esistono altri strumenti molto simili a Copyscape che puoi utilizzare per lo stesso scopo, come Plagiarism Detect e InterNIC.
Il controllo dei contenuti duplicati è abbastanza facile e semplice. È un compito SEO indispensabile per i principianti, ma nessuno dovrebbe darlo per scontato. Con il giusto set di strumenti, puoi comodamente assicurarti che i tuoi contenuti siano unici ben prima di pubblicarli online.
E fornendo ai tuoi lettori contenuti unici e di alta qualità, avrai fornito un grande valore.
Come pulire i contenuti duplicati
Una volta identificate le aree critiche di duplicazione sul tuo sito, puoi iniziare ad agire per correggerle. Prima intraprendi un'azione correttiva, prima inizierai a riprenderti dagli effetti negativi. Fortunatamente, Google ti consente anche di trovare e correggere facilmente i contenuti duplicati sul tuo sito. Quando accedi a Google Webmaster Tools, vai su "Aspetto nella ricerca" e poi su "Miglioramenti HTML". Ciò ti consentirà di generare un elenco di tutte le pagine che Google rileva come duplicate. Una volta che hai questo elenco, puoi iniziare a eliminare gli errori duplicati uno per uno con uno dei seguenti metodi:
- Elimina inutili duplicazioni. Il primo passaggio è il più semplice e ovvio, anche se può richiedere molto tempo se si hanno più istanze. In ogni situazione in cui puoi riscrivere un contenuto per risolvere la duplicazione, fallo. Metti le tue idee in parole diverse, usa diversi dispositivi di inquadratura e non aver paura di riscrivere da zero.
- Caldaie . Long boilerplates or copyright notices should be removed from various pages and placed on a single page instead. In cases where you would have to call your readers' attention to boilerplate or copyright at the bottom of each of your pages or posts, insert a link to the single special page instead.
- Similar pages . There are cases when similar pages must be published, such as SEO for small and big businesses. Avoid publishing the same or similar information. Instead, expand on both services and make the information very specific to each business segment.
- Noindex . People could be syndicating your content. If there's no way to avoid this, include a note at the bottom of each page of your content that asks users to include a “noindex” metatag on your syndicated content to prevent the duplicate content from being indexed by the search engines.
- 301 redirects . Let the search engine spiders know that a page has permanently moved by using 301 redirects. This also alerts the search engines to remove the old URL from their index and replace it with the new address.
- Choosing only one URL . There might be several URLs you could use to point to your homepage, but you should choose only one. When choosing the best URL for your page, be sure to keep the users in mind. Make the URL user-friendly. This makes it easier not only for your users to find your page, but also for the search engines to index your site. Some duplicate content errors aren't due to actual duplicated content. They have to do with the URL structure that Google sees. For example, if you have one page that is associated with thisisyoursite.com/, thisisyoursite.com/?, and thisisyoursite.com/?sessionid=111, Google will see that page as repeating content three times. First, choose between www or non-www formatting and stick to that.
- Always create unique content . Affiliates almost always fall victim to the convenience of ready-made content provided by merchants. If you are an affiliate, be sure to create unique content for the merchant products you are promoting. Don't just copy and paste.
Conclusione
Let's do a brief recap. “Duplicate content” can refer to plagiarized material, copied content for the purposes of site inflation, but more importantly for the average user, pages that Google indexes twice. These duplicate forms of content are easy to track down with Google Webmaster Tools and fix with canonicalization adjustments or redirects, but if they go unnoticed, they can cumulatively bring your rankings down. Be proactive and scout for duplicate content at least once every few months—unless your site management process is flawless, it's probably that duplicate content will surface when you least expect it.
In the end, it all comes down to testing on a massive scale, getting solid data and making decisions based on that data. So here's what I'm going to do. I'm going to run a huge test and then update this post with my results. At the beginning of the post I mentioned that I am soon launching a massive Website with tons of unique content. I'm going to syndicate it all, completely unedited, as far and wide as I possibly can. As I do so, I'll monitor traffic sources to see what keywords people are using to find my content. Then, I'll replicate those keyword queries in Google and see where my site ranks in the search results. This should be the definitive test for the merits of syndication.
Thanks for sticking with me through this crazy post!
