Come evitare il problema dei contenuti duplicati per Google?

Pubblicato: 2021-11-01

Il contenuto duplicato su una pagina ha molto in comune con il superamento del budget. Solo in questo caso si tratta della diminuzione del “Trust Budget” nel sito del robot di ricerca. Questo problema riguarda molti proprietari di siti, poiché può apparire anche alle loro spalle. Dopo aver letto qualcosa sul problema dei contenuti duplicati, il tuo sito si è trasformato in una bomba a orologeria. Tick ​​Toc sull'orologio e le sanzioni di Google ti stanno aspettando.

Triste ma vero, c'è circa il 25-30% di contenuti duplicati sul Web. L'ex googler Matt Cutts sostiene questo punto di vista. Sebbene i contenuti duplicati possano metterti in un mondo di guai con l'ottimizzazione dei motori di ricerca, non è poi così drammatico. C'è una soluzione: leggi questo articolo e scopri come evitare problemi di contenuti duplicati per Google.

Mostra il sommario
  • Che cos'è il contenuto duplicato?
  • Fatti sui contenuti duplicati
  • Che tipo di contenuto c'è?
  • Qual è il CODICE?
    • pagine HTTPS
    • Sistemi di gestione dei contenuti che creano contenuti duplicati
    • Pagine per la stampa o più opzioni di ordinamento
    • Contenuto duplicato nei blog e nei sistemi di archiviazione
    • Contenuti duplicati generati dagli utenti (post ripetuti, ecc.)
  • Conclusione

Che cos'è il contenuto duplicato?

content-marketing-desk-laptop-note-work-writing-article-blog
Esistono 3 tipi principali di contenuti duplicati.
  • Duplicato esatto: due URL hanno contenuto completamente identico;
  • Contenuto con lievi differenze: come l'ordine delle frasi, un po' di immagini diverse, ecc.;
  • Duplicati tra domini: in molti domini esiste una copia esatta o leggermente modificata.

Inoltre, esistono due concetti correlati che Google non considera contenuti duplicati. Ma editori e specialisti SEO non così esperti possono facilmente mescolarli con contenuti duplicati.

  • Contenuti sottili: si tratta di pagine con pochissimi contenuti. Insieme di pagine costruito su un elenco di indirizzi di organizzazioni, che hanno 6 000 indirizzi, ma ogni pagina contiene un solo indirizzo: solo poche righe.
  • Contenuto della sezione: pagine leggermente diverse l'una dall'altra. Il sito vende scarpe Timberland nelle taglie 38, 38,5, 39, 40, 41, 42, ecc. Se il sito ha una pagina separata per ogni misura di scarpa, ci sarà una piccola differenza tra tutte quelle pagine. Un tale effetto viene percepito da Google come una porzione di contenuto.

A Google non piacciono i contenuti ugualmente sottili e tagliati. Ognuno di questi effetti può essere rilevato da Google Panda. Ecco perché gli editori dovrebbero evitare di creare questi tipi di pagine.

Il contenuto duplicato può verificarsi per una serie di motivi:
  • licenza del contenuto del tuo sito;
  • difetti nell'architettura del sito dovuti a un sistema di gestione dei contenuti non ottimizzato per i motori di ricerca;
  • esistenza di plagio.

Negli ultimi cinque anni, gli spammer, con una straordinaria esigenza di contenuto, hanno iniziato a “strappare” contenuti da fonti legittime, trasferendo parole utilizzando una varietà di processi complessi e inserendo il testo risultante sulle loro pagine per attirare operazioni di ricerca “long tail” e mostrare la pubblicità contestuale e altri scopi disonesti. Quindi, al giorno d'oggi le persone vivono in un mondo di "problemi con contenuti duplicati" e "penalità per contenuti duplicati".

Consigliato per te: 5 modi in cui un buon contenuto può accelerare i tuoi sforzi di marketing.

Fatti sui contenuti duplicati

domande-risposte-faq-query-help
Posizione del contenuto duplicato

Se tutto il contenuto è presente sul tuo sito, si tratta di contenuto duplicato?

Sì, perché i contenuti duplicati possono verificarsi sia sullo stesso sito che su siti diversi.

Percentuale di contenuti duplicati

Quale percentuale di una pagina dovrebbe essere duplicata per rientrare in un filtro di contenuto duplicato? Sfortunatamente, i motori di ricerca non rendono mai pubbliche queste informazioni perché pregiudicherebbero la loro capacità di prevenire il problema stesso. Questa percentuale è in continua evoluzione per tutti i motori. La linea di fondo è che le pagine non devono essere identiche per essere considerate duplicate.

Il rapporto tra codice e testo

Cosa succede se il codice è molto grande, ma nella pagina sono presenti alcuni elementi HTML univoci? Google non penserà che tutte le pagine siano duplicate l'una dell'altra?

No. Ai motori di ricerca non interessa il tuo codice, ma il contenuto delle tue pagine. La dimensione del codice diventa un problema solo quando cresce in modo sproporzionato.

Gli elementi di navigazione in rapporto al contenuto unico

Tutte le pagine del tuo sito hanno un'ampia barra di navigazione, molte intestazioni e piè di pagina, ma pochissimo contenuto. Google non considererà tutte queste pagine duplicate?

No. Google considera gli elementi di navigazione prima ancora di valutare le pagine per la duplicazione.

Contenuti con licenza

Vuoi evitare il problema del contenuto duplicato. Ma cosa fare se hai contenuti da altre fonti web che hai concesso in licenza per mostrare ai tuoi visitatori?

Usa meta name = "robot" content="noindex, segui". Inseriscilo nell'intestazione della tua pagina e i motori di ricerca sapranno che questo contenuto non fa per loro. Un'altra opzione è ottenere i diritti esclusivi per possedere e pubblicare quel contenuto.

Che tipo di contenuto c'è?

computer-laptop-scrivania-lavoro-ufficio-contenuti-scrittura-note-ricerca
  • Il contenuto unico è scritto da una persona. È completamente diverso da qualsiasi altra combinazione di lettere, simboli e parole sul Web e non è stato influenzato dagli algoritmi di elaborazione del testo del computer.
  • I frammenti sono piccoli frammenti di contenuto (ad es. virgolette) che vengono copiati e utilizzati più e più volte. Raramente rappresentano un problema per i motori di ricerca, soprattutto se inclusi in un documento più ampio con molti contenuti unici.
  • Herpes zoster. I motori di ricerca cercano segmenti relativamente piccoli di frasi (da cinque a sei parole) su altre pagine web. Se due documenti hanno troppi scandole, i motori di ricerca possono interpretare quei documenti come contenuti duplicati.

Qual è il CODICE?

sviluppo web di codice di programmazione

Esistono molti modi per creare contenuti duplicati. Questo spiega perché ce n'è più che sufficiente sul web. I contenuti interni duplicati necessitano di tattiche specifiche per ottenere i migliori risultati in termini di ottimizzazione. Francamente, le pagine duplicate sono pagine di nessun valore sia per gli utenti che per i motori di ricerca. Quindi cerca di evitare completamente questo problema. Assicurati che un solo URL faccia riferimento a ciascuna pagina. Inoltre, esegui un reindirizzamento 301 per i vecchi URL agli URL rimanenti. Aiuta i robot di ricerca a vedere le modifiche che hai apportato il più rapidamente possibile e a mantenere il "link juice" che avevano le pagine eliminate.

Se ciò non è possibile, ci sono molte altre opzioni. Ecco una carrellata delle soluzioni più semplici per vari scenari:

  • Puoi utilizzare il file robots.txt per impedire agli spider dei motori di ricerca di eseguire la scansione di versioni duplicate delle pagine del tuo sito;
  • usa l'elemento rel="canonical", che è la seconda migliore soluzione per rimuovere le pagine duplicate;
  • usa CODE <meta name=”robots” content=”noindex”> per indicare ai motori di RICERCA di non mostrare pagine duplicate.

Tuttavia, nota: se utilizzi robots.txt per impedire la visualizzazione della pagina, l'applicazione di noindex o nofollow sulla pagina non ha senso. Poiché un ragno non può leggere la pagina, non vedrà mai i meta-tag noindex o nofollow. Tenendo presente questi strumenti, considera alcune situazioni specifiche di contenuto duplicato.

Potrebbe piacerti: Perché la scrittura di contenuti è importante per marchi e aziende?

pagine HTTPS

Se stai utilizzando il protocollo SSL (scambio di dati crittografato tra il browser e il server web, che viene spesso utilizzato per l'e-commerce), il tuo sito ha pagine che iniziano con HTTPS: (anziché HTTP:). Il problema si presenta quando i collegamenti sulle tue pagine HTTPS puntano ad altre pagine del sito utilizzando collegamenti relativi anziché assoluti. Ad esempio, il collegamento alla tua home page diventa https://www.YourDomain.com anziché http://www.YourDomain.com).

Se il tuo sito ha questo problema, puoi utilizzare i reindirizzamenti rel="canonical" o 301 per risolverlo. Una soluzione alternativa è cambiare i link in assoluto: http://www.YourDomain.com/content.html invece di /contenthtml), il che rende anche la vita un po' più difficile a chi ruba i tuoi contenuti.

Sistemi di gestione dei contenuti che creano contenuti duplicati

A volte un sito può avere molte versioni di pagine identiche. Succede alle limitazioni in alcuni sistemi di gestione dei contenuti che fanno riferimento allo stesso contenuto con più di un URL. Di solito è una duplicazione completamente extra che non ha alcun valore per gli utenti. La decisione migliore è rimuovere le pagine duplicate ed eseguire un reindirizzamento 301 per le pagine rimosse alle restanti. Se non funziona, prova altri metodi.

Pagine per la stampa o più opzioni di ordinamento

Molti siti offrono pagine per la stampa che offrono all'utente lo stesso contenuto in un formato adattato alla stampante. Alcuni siti di e-commerce forniscono elenchi dei loro prodotti con ordinamenti multipli (per taglia, colore, marca e prezzo). Queste pagine hanno valore per l'utente ma non hanno alcun valore per i motori di ricerca. Pertanto, pensano che sia contenuto duplicato. In una situazione del genere, puoi creare un foglio di calcolo CSS per la stampa.

Contenuto duplicato nei blog e nei sistemi di archiviazione

I blog hanno la forma di una variante interessante sul problema dei contenuti duplicati. Un post del blog può apparire su diverse pagine:

  • la pagina iniziale del blog;
  • la pagina del permalink per quel post;
  • le pagine di archivio;
  • le pagine delle categorie.

Ogni copia del post è un duplicato delle altre copie. Molto raramente gli editori cercano di affrontare il problema della presenza di un post sia nella home page del blog che nella pagina dei permalink. E i motori di ricerca sembrano affrontare abbastanza bene questo problema. Tuttavia, potrebbe avere senso mostrare solo frammenti di post nelle pagine di categoria e archivio.

Contenuti duplicati generati dagli utenti (post ripetuti, ecc.)

Una varietà di siti utilizza strutture per ottenere contenuti generati dagli utenti, come blog, forum o bacheche. Questi possono essere ottimi modi per sviluppare molti contenuti a un costo molto basso. Il problema è che un utente può pubblicare lo stesso contenuto sia sul tuo sito che su diversi altri siti contemporaneamente, il che porta a problemi di contenuto duplicato. È difficile da controllare, ma per ridurre il problema si può procedere come segue:

  • È necessario disporre di una politica chiara che notifichi agli utenti che il contenuto che forniscono al tuo sito deve essere unico e non può essere pubblicato su altri siti. Senza dubbio, è difficile ottenerlo, ma aiuterà a realizzare le tue aspettative;
  • Ravviva il tuo forum in un modo unico che avrà bisogno di contenuti diversi. Oltre ai campi di immissione dati standard, aggiungi anche alcuni campi univoci (diversi dagli altri siti) che saranno utili per i visitatori del tuo sito.
Potrebbe piacerti anche: Come amplificare la tua SEO con i contenuti video?

Conclusione

segnaletica-strada-a-senso-avviso-duplicato-motivazione-occupazione

Non preoccuparti troppo dei contenuti duplicati. Di solito non è un grosso problema. Per lo più Google stesso sa come affrontare problemi come pagine master o citazioni di contenuti. Inoltre, molte persone affrontano il problema dei contenuti duplicati. A volte i duplicati non vengono visualizzati a nessuno dove si aspettano, quindi dovresti sempre controllare il sito per loro. Per prevenirli, devi creare contenuti unici per ogni pagina.



Autore-immagine-Isabelle-Jordan

Questo articolo è stato scritto da Isabelle Jordan. Isabelle è una giornalista di affari e marketing presso la compagnia di assicurazioni ektatraveling.com. Scrive per diversi portali di notizie e blog tematici che la aiutano a rimanere al centro delle notizie sui viaggi e sulle assicurazioni. Tale lavoro le dà l'opportunità di scrivere articoli sugli argomenti più rilevanti di oggi.