Conținut duplicat: Ghidul final pentru găsirea și remedierea conținutului duplicat pentru îmbunătățirea SEO

Publicat: 2019-10-18

Conținutul duplicat este rău. Utilizarea aceluiași conținut, în formă totală sau parțială, pe site-ul dvs. web duce la o experiență slabă a utilizatorului și declanșează un semnal roșu în algoritmul de căutare Google. În vremurile vechi ale SEO, conținutul duplicat era adesea folosit ca un truc ieftin pentru a obține mai multe cuvinte cheie și mai mult conținut pe site-ul dvs., așa că Google a dezvoltat un sistem pentru a elimina spammerii care au încălcat cele mai bune practici făcând acest lucru. Astăzi, dacă sunteți surprins folosind conținut duplicat, autoritatea domeniului dvs. ar putea suferi și clasamentul cuvintelor cheie ar putea scădea.

Din fericire, Google este destul de corect în legătură cu această problemă. Compania înțelege că majoritatea problemelor de conținut duplicat nu apar ca o încercare rău intenționată de a crește ieftin rangul. În realitate, cele mai multe cazuri de conținut duplicat sunt accidente sau sunt trecute cu vederea de către webmasteri. Totuși, a avea prea mult conținut repetat pe site-ul dvs. poate fi dăunător și este în interesul dvs. să efectuați un test pentru a vedea dacă există vreo duplicare pe site-ul dvs.

Cuprins

Introducere

De când am început să-mi umez picioarele în SEO, această întrebare s-a învârtit în jurul forumurilor și blogurilor. Undeva, cineva de acolo a perpetuat ideea că a avea același conținut pe pagina A a site-ului dvs. web ca și pagina B a site-ului dvs. web ar determina penalizarea site-ului dvs. în clasamentul motoarelor de căutare. Această idee a început să se răspândească în comunitatea de marketing pe internet, deoarece o grămadă de spammers și-au dat seama că atunci când au un conținut (adică un articol) care obține o mulțime de trafic de căutare, ar putea umple fiecare pagină a site-ului web cu același conținut pentru a atrage și mai mult trafic din motoarele de căutare. Evident, același articol duplicat în mod flagrant pe sute de pagini dintr-un singur domeniu este o încercare rău intenționată de a câștiga traficul motorului de căutare fără a adăuga de fapt nicio valoare. Google a prins destul de repede această metodă și și-a fixat algoritmii pentru a detecta conținutul duplicat și a afișa o singură versiune a acestuia în clasamentul de căutare. Site-urile care s-au angajat în această activitate flagrantă au fost dezindexate și au strigat un râu peste forumuri și bloguri din întreaga comunitate de marketing pe internet. Astfel s-a născut teama de „penalizarea conținutului duplicat”.

Cu toate acestea, în marea majoritate a cazurilor, conținutul duplicat nu este rău intenționat și este pur și simplu un produs al oricărui CMS (sistem de gestionare a conținutului) pe care se întâmplă să ruleze site-ul web. De exemplu, WordPress (CMS standard din industrie) creează automat pagini „Categorie” și „etichetă” care listează toate postările de blog din anumite categorii sau etichete. Aceasta creează mai multe adrese URL în cadrul domeniului care conțin același conținut.

1) Google poate decide să mă lase cu un „avertisment” și pur și simplu alege să nu indexez 99 din cele 100 de postări duplicate ale mele, ci să păstrez una dintre ele indexată. NOTĂ: Aceasta nu înseamnă că clasamentele site-ului meu de căutare ar fi afectate în vreun fel.

2) Google poate decide că este o încercare atât de flagrantă de a juca sistemul încât să-mi dezindexeze complet întregul site web de toate rezultatele căutării. Aceasta înseamnă că, chiar dacă ați căuta direct „Example.com”, Google nu va găsi rezultate.

Deci, unul dintre aceste două scenarii este garantat să se întâmple. Care dintre ele depinde de cât de flagrant Google determină să fie gafa ta. În cuvintele proprii ale Google:

Conținutul duplicat de pe un site nu este motiv de acțiune pe acel site decât dacă se pare că intenția conținutului duplicat este de a fi înșelător și de a manipula rezultatele motorului de căutare. Dacă site-ul dvs. suferă de probleme de conținut duplicat și nu respectați sfaturile enumerate mai sus, facem o treabă bună de a alege o versiune a conținutului pentru a fi afișată în rezultatele noastre de căutare.

Acest tip de duplicare non-rău intenționată este destul de obișnuit, mai ales că multe CMS nu se descurcă bine în mod implicit. Deci, atunci când oamenii spun că a avea acest tip de conținut duplicat poate afecta site-ul dvs., nu este pentru că este probabil să fiți penalizat; se datorează pur și simplu modului în care funcționează site-urile web și motoarele de căutare.

Majoritatea motoarelor de căutare se străduiesc să obțină un anumit nivel de varietate; vor să vă afișeze zece rezultate diferite pe o pagină cu rezultatele căutării, nu zece adrese URL diferite, care au toate același conținut. În acest scop, Google încearcă să filtreze documentele duplicat, astfel încât utilizatorii să aibă mai puțină redundanță.

Deci, ce se întâmplă atunci când un motor de căutare crawler detectează conținut duplicat? (de la https://searchengineland.com/search-illustrated-how-a-search-engine-determines-duplicate-content-13980)

Cum penalizează Google conținutul duplicat

How Google Penalizes Duplicate Content

Google este destul de deschis cu privire la politicile sale de conținut duplicat. Potrivit rapoartelor lor, dacă Google întâlnește două versiuni diferite ale aceleiași pagini web sau conținut care este semnificativ similar cu conținutul de la fața locului în altă parte, va selecta aleatoriu o versiune „canonică” pe care să o indexeze. Exemplul pe care îl dau este următorul: imaginați-vă că aveți o pagină web standard și o versiune pentru imprimare a aceleiași pagini web, completată cu conținut identic. Google ar alege una dintre aceste pagini la întâmplare pentru indexare și ar ignora complet cealaltă versiune. Acest lucru nu implică nimic despre suferința unei penalități, dar este în interesul dumneavoastră să vă asigurați că Google indexează și organizează corect site-ul dvs.

Adevărata problemă apare atunci când Google suspectează că conținutul dvs. este duplicat în mod rău intenționat sau manipulator. Practic, dacă Google consideră că conținutul dvs. duplicat a fost un efort de a-și păcăli algoritmul de clasare, veți fi confruntați cu acțiuni punitive. Este în interesul dvs. să eliminați orice erori cu mult timp înainte pentru a preveni o astfel de soartă pentru site-ul dvs.

Sindicalizare: conținut duplicat pe domenii

Uneori, același conținut poate apărea cuvânt cu cuvânt pe diferite adrese URL. Câteva exemple în acest sens includ:

  • Articole de știri (cred că Associated Press)
  • Același articol dintr-un director de articole preluat de diferiți webmasteri
  • Webmasterii care trimit același conținut în diferite directoare de articole
  • Comunicate de presă distribuite pe web
  • Informații despre produs de la un producător care apar pe diferite site-uri de comerț electronic

Toate aceste exemple rezultă din sindicalizarea conținutului . Web-ul este plin de conținut sindicalizat. Un comunicat de presă poate crea conținut duplicat pe mii de domenii unice. Dar motoarele de căutare se străduiesc să ofere utilizatorilor o experiență de utilizare bună, iar livrarea unei pagini de rezultate constând din aceleași conținuturi nu ar face mulți oameni fericiți. Deci, ce ar trebui să facă un motor de căutare? Cumva, trebuie să decidă ce locație a conținutului este cea mai relevantă pentru a arăta căutătorului. Deci, cum se face asta? Chiar de la marele G:

Când întâlnim un astfel de conținut duplicat pe diferite site-uri, ne uităm la diferite semnale pentru a determina care site este cel original, care de obicei funcționează foarte bine. Acest lucru înseamnă, de asemenea, că nu ar trebui să fii foarte îngrijorat cu privire la efectele negative asupra prezenței site-ului tău pe Google dacă observi că cineva îți răzuiește conținutul.

Ei bine, Google, îmi cer diferențe. Din păcate, nu cred că sunteți foarte priceput să decideți ce site este inițiatorul conținutului. Nici Michael Gray, care se plânge în postarea sa de pe blogul „Când Google devine conținut duplicat greșit”, că Google își atribuie de multe ori conținutul original altor site-uri pe care își sindicalizează conținutul. Potrivit lui Michael:

Cu toate acestea, problema este legată de Google, iar clasamentul lor IMHO pune prea multă părtinire pe încrederea și autoritatea domeniului.

Și sunt de acord cu Michael. Pentru o mare parte din cariera mea de marketing pe internet, am sindicalizat articole complete în diverse directoare de articole pentru a extinde acoperirea conținutului meu, în timp ce îl folosesc și ca „combustibil SEO” pentru a obține backlink-uri cu pălărie albă către site-urile mele web. Potrivit Google, atâta timp cât versiunile dvs. sindicalizate conțin un backlink către originalul dvs., acest lucru vă va ajuta cazul atunci când Google decide ce piesă este originalul. Iată dovada:

În primul rând, un videoclip cu Matt Cutts, un blogger cunoscut și fost inginer de algoritmi pentru motoarele de căutare pentru Google:

Discuția despre sindicare începe la aproximativ 2:25. La 2:54 spune că le puteți spune oamenilor că sunteți „stăpânul conținutului”, incluzând un link de la piesa sindicalizată înapoi la piesa dvs. originală.

Mai multe dovezi:

În cazurile în care vă sindicalizați conținutul, dar doriți, de asemenea, să vă asigurați că site-ul dvs. este identificat ca sursă originală, este util să solicitați partenerilor dvs. de sindicalizare să includă un link către conținutul dvs. original.

Și, în sfârșit:

Sindicați cu atenție : dacă vă sindicalizați conținutul pe alte site-uri, Google va afișa întotdeauna versiunea pe care o considerăm cea mai potrivită pentru utilizatorii din fiecare căutare dată, care poate fi sau nu versiunea pe care ați prefera-o. Cu toate acestea, este util să vă asigurați că fiecare site pe care este distribuit conținutul dvs. include un link către articolul dvs. original. De asemenea, puteți cere celor care utilizează materialul dvs. sindicalizat să utilizeze metaeticheta noindex pentru a împiedica motoarele de căutare să indexeze versiunea lor de conținut.

Acum, ceea ce cred că este interesant din acest ultim citat de la Google este că ei recunosc de fapt că piesa de conținut pe care o aleg poate să nu fie cea potrivită. Din experiența mea, este foarte probabil să nu o alegeți pe cea potrivită dacă site-ul care a generat conținutul este relativ tânăr sau are un PageRank scăzut. Deci, acest lucru ridică următoarea mare problemă:

Cum pot fi clasat ca sursă originală pentru conținutul pe care îl sindicalizez?

How do I get ranked as the original source for the content I syndicate?

Într-o viață anterioară, am sindicalizat tone de articole către EzineArticles doar pentru a vedea că Google le acordă rezultate de căutare mai mari pentru conținutul meu, chiar și atunci când m-am asigurat pe deplin că Google mi-a indexat conținutul în locația inițială înainte de a-l trimite la Ezine. Vanessa Fox, care a lucrat anterior la Google și a creat Webmaster Central, încearcă să abordeze această întrebare în postarea sa de pe blog, „Clasarea ca sursă originală pentru conținutul pe care îl sindicați”.

Din păcate, ea concluzionează că, practic, nu puteți face nimic pentru a vă asigura că faceți acest lucru. Ea sugerează:

Creați o versiune diferită a conținutului de sindicalizat decât ceea ce scrieți pentru propriul site. Această metodă funcționează cel mai bine pentru lucruri precum feedurile afiliate produselor. Nu cred că funcționează la fel de bine pentru lucruri precum postări pe blog sau alte tipuri de articole. În schimb, ați putea face ceva de genul să scrieți un articol rezumat de nivel înalt pentru sindicalizare și o postare pe blog cu detalii despre acest subiect pentru propriul dvs. site.

Rescrierea unui conținut nu este definiția mea a sindicalizării. Asta înseamnă doar rescrierea unui articol în cuvinte diferite și distribuirea acestuia. Aproape toate informațiile care circulă pe web au fost oricum deja postate în altă parte; chiar și această postare de blog este compusă dintr-o grămadă de informații pe care le-am găsit în altă parte pe internet. Deci, pentru mine, a scrie un articol nou care spune același lucru în cuvinte diferite și a distribui acest lucru partenerilor de sindicare nu este într-adevăr sindicarea articolului original. Este sindicalizarea unui articol diferit. Așadar, ne-a rămas încă întrebarea cu privire la rezultatele sindicalizării exact a aceluiași conținut care apare deja pe site-ul dvs.: care sunt efectele acestui lucru? Îmi poate afecta în vreun fel clasamentul meu ?

Pentru mine, aceasta este cea mai importantă întrebare referitoare la conținutul duplicat. Înainte de a intra în acea analiză, să luăm în considerare o întrebare fundamentală importantă.

De ce aș dori să sindicalizez exact același conținut de pe site-ul meu în altă parte?

Internetul funcționează într-adevăr pe o economie simplă de a da și lua. Cele două mărfuri care sunt schimbate sunt conținut unic și backlink-uri . Conținutul unic este definit ca un conținut pe care Google nu îl identifică drept duplicat. Există diverse teorii cu privire la locul exact în care Google trasează linia de a decide dacă conținutul trebuie considerat duplicat , dar o cifră pe care am auzit-o aruncată în jur este de 30%. Practic, conform teoriei 30%, dacă Google identifică că mai mult de 30% dintr-un anumit conținut apare în altă parte pe internet, acesta va fi clasificat drept duplicat. Acum, nu pot să atest acuratețea acestei figuri, așa că ia-o pentru ceea ce merită. Există, de asemenea, diverse software de detectare a conținutului duplicat, cum ar fi CopyScape, care este conceput pentru a ajuta webmasterii să verifice dacă conținutul lor a fost furat și duplicat în alte domenii. Acesta este, de asemenea, un instrument bun de utilizat pentru a determina dacă conținutul dvs. poate fi considerat duplicat de Google. Și asta contează cu adevărat.

Dar am ieșit puțin din cale, așa că să revenim la discuția de ce ați dori să sindicalizați conținut. Am menționat economia pe internet a backlink-urilor și a conținutului unic. Conținutul unic este de dorit, deoarece acesta va fi indexat de Google, oferind acelui site Web o altă instanță din „numele său în pălărie”, ca să spunem așa. Practic, cu cât un site a indexat mai mult conținut, cu atât are mai multe șanse de a fi returnat în rezultatele căutării Google pentru interogări relevante.

Dar cum rămâne cu backlink-urile? Backlink-urile sunt pur și simplu linkuri de la orice alt site web la propriul dvs. site. Motoarele de căutare consideră că este un „vot” atunci când un site web se leagă de altul. Acest vot este utilizat pentru a determina autoritatea și relevanța în rezultatele căutării Google. De fapt, se crede că backlink-urile sunt singurul factor cel mai important în determinarea modului în care site-ul dvs. web ar trebui să se claseze pentru o anumită interogare. Există o mulțime de factori care se joacă în backlink-uri și cât de mult contează „votul” lor, dar voi intra în asta într-o viitoare postare pe blog. Deocamdată, trebuie să știți că backlink-urile sunt valoroase, deoarece vă îmbunătățesc clasamentul în motoarele de căutare și asta înseamnă mai mult trafic către site-ul dvs. web.

OK, așa că acum am acoperit produsele de bază ale microeconomiei web. Acest lucru este important, deoarece atunci când vă sindicalizați conținutul, presupunând că ați inclus un backlink în acesta care să se conecteze înapoi la sursa dvs. originală, primiți un backlink de la fiecare site web la care conținutul dvs. a fost sindicat. Minunat, nu?

Poate nu. Prima întrebare este cât de mult apreciază Google un backlink dintr-un conținut despre care se știe că este un conținut duplicat. Sincer, nu știu. Pe de o parte, este ușor să sindicați conținutul la o grămadă de bloguri de acceptare automată dacă singurul dvs. obiectiv este să obțineți backlink-uri, iar acest lucru nu spune nimic despre calitatea conținutului dvs. sau despre cât de mult ar trebui să fie recompensat inițiatorul conținutului. Pe de altă parte, sindicalizarea poate fi, de asemenea, un indicator excelent al calității unui anumit conținut. La urma urmei, de ce ar fi sindicat atât de mult dacă nu ar fi cu adevărat grozav?

În cele din urmă, Google are probabil semnale despre cum răspunde la aceste două întrebări, dar răspunsurile reale sunt probabil cunoscute doar de inginerii software care au codat algoritmul. Mulți oameni încearcă să crească valoarea conținutului lor sindicalizat prin implicarea în „filare” a conținutului, care este perfect legitimă, atâta timp cât nu gunoiul este adesea scos de software automat. Voi aprofunda mai mult despre filarea conținutului într-o postare ulterioară. Deocamdată, încercăm în continuare să răspundem la întrebarea dacă distribuirea conținutului exact așa cum apare pe propriul site web este o idee bună sau o idee proastă. După testarea atentă, am ajuns la următoarea concluzie:

.

...

……

* tambur *

...

……

* mai mult tambur *

... ..

...

Poate.

Știu, știu. Nu acesta este răspunsul pe care l-ai dorit. Permiteți-mi să explic.

Dețin peste 50 de domenii și îmi place să fac o mulțime de testări pe ele. Am petrecut câteva ore aseară efectuând căutări pentru conținutul meu pe care îl distribuisem în alte bloguri și directoare. Și ceea ce am găsit a fost atât dezamăgitor, cât și încurajator.

Partea dezamăgitoare a fost că, în multe cazuri, conținutul meu sindicalizat a depășit propriul meu conținut original. Chiar dacă un site clasat mai sus decât al meu pentru propriul meu conținut avea un backlink către site-ul meu, inițiatorul conținutului, a fost ca și cum Google a ignorat complet acel backlink și a acordat totuși mai mult credit celorlalte site-uri. În unele cazuri, versiunea propriului site al conținutului nu a fost găsită nicăieri, evident că se încadrează în clusterul de URL-uri duplicat al Google și este filtrată din rezultatele căutării. Acest lucru înseamnă că, prin sindicalizarea conținutului meu, de fapt, am de fapt indexat propriul meu conținut.

Acesta este aproape cel mai prost scenariu posibil, dar s-a întâmplat. Uneori, cel puțin. Și asta e partea ciudată; uneori, conținutul meu a fost recunoscut ca fiind conținutul original și a primit cea mai înaltă clasare. Cu alte site-uri și piese de conținut, s-a clasat pe locul doi în spatele unui site cu înaltă autoritate, de obicei EzineArticles. Deci, trebuie să concluzionez următoarele:

Când vă sindicalizați conținutul, acesta ar putea:

  • Faceți ca sursa dvs. de conținut originală (de exemplu, site-ul dvs. web) să fie, de fapt, de-indexată pentru acea parte a conținutului
  • Faceți ca site-ul dvs. să se claseze foarte bine pentru interogări relevante pentru conținutul dvs., dar nu cel mai ridicat
  • Faceți site-ul dvs. să se claseze cel mai bine pentru conținutul dvs.

Ei bine, asta acoperă cam toate bazele, nu-i așa? Acestea sunt toate rezultatele pe care le-am observat când m-am uitat la propriile site-uri și rezultatele sindicalizării articolelor care au apărut pe aceste site-uri. Practic, pot concluziona că Google nu întotdeauna o înțelege bine. Și, Google nu-i place să facă nimic cu un fel de consistență. Ultimul lucru pe care și-l doresc este ca noi SEO să își descopere complet algoritmul, deoarece odată ce se va întâmpla, integritatea rezultatelor căutării lor va fi distrusă pe măsură ce oamenii îi manipulează pe toți în iad.

Partea încurajatoare a fost atunci când am descoperit că backlink-urile din conținutul sindicat au ajutat cu siguranță la clasarea site-urilor mele pentru cuvintele cheie vizate. Așadar, există cu siguranță cel puțin o anumită valoare a backlink-urilor provenite din conținutul pe care Google l-a etichetat drept „duplicat”.

Deci, întrebarea rămâne: ar trebui să-mi sindicalizez conținutul?

Să ne uităm la beneficiile acestui lucru:

Avantajele sindicalizării conținutului dvs.

  • Obțineți backlinks de pe multe site-uri
  • Extindeți-vă acoperirea și gradul de cunoaștere a mărcii la site-uri cu trafic intens
  • Obțineți trafic direct prin recomandări de la backlink-uri în conținutul dvs. sindicalizat
  • Mod mult mai ieftin de a obține backlink-uri decât de a scrie conținut nou (sau de a rescrie conținut existent) pentru distribuire / sindicalizare

Dezavantaje ale sindicalizării conținutului dvs.

  • Site-urile pe care le sindicalizați s-ar putea să vă depășească pentru propriul dvs. conținut dacă au autoritate mai mare decât site-ul dvs., chiar dacă urmați sfaturile Google și includeți un backlink către sursa originală a conținutului
  • Google ar putea grupa adresa URL pe care se află conținutul dvs. cu restul duplicatelor, ascunzându-l de paginile cu rezultatele motorului de căutare (efectiv dezindexându-l)

Deci, sindicarea conținutului dvs. este riscantă. Puteți obține cu siguranță cele mai bune din ambele lumi dacă Google decide că site-ul dvs. este inițiatorul conținutului , recompensând astfel conținutul dvs. cu poziția de top în rezultatele căutării și obținând, de asemenea, toate backlink-urile suculente care se joacă în clasamentul dvs. general pentru anumite cuvinte cheie. Dar dacă Google greșește (și o face, destul de des, contrar a ceea ce ar putea crede ei), riscați ca conținutul dvs. să nu se claseze niciodată pentru interogări relevante ale motorului de căutare.

Și acest lucru mă îngrijorează cu adevărat, pentru că am avut întotdeauna părerea că altceva nu poate face altcineva pentru a afecta clasamentul unui anumit site web. După analiza acestor rezultate, mă tem că am găsit o lacună în propriul meu argument; dacă altcineva îmi vizitează site-ul web, îmi copiază tot conținutul și îl sindicalizează pe web, este posibil ca site-urile pe care a fost sindicat conținutul meu să se claseze de fapt mai mult decât site-ul meu. Google încearcă să abordeze această problemă aici, precum și în videoclipul Matt Cutts:

În majoritatea cazurilor, un webmaster nu are nicio influență asupra terților care răzuiesc și redistribuie conținutul fără consimțământul webmasterului. Ne dăm seama că acest lucru nu este vina webmasterului afectat, ceea ce înseamnă, la rândul său, că conținutul identic care apare pe mai multe site-uri în sine nu este considerat în mod inerent ca o încălcare a regulilor noastre pentru webmasteri. Acest lucru duce pur și simplu la alte procese cu intenția de a determina sursa originală a conținutului - lucru la care Google este destul de bun, deoarece în majoritatea cazurilor conținutul original poate fi identificat corect, rezultând niciun efect negativ pentru site-ul care a generat conținutul.

Din nou, din păcate, trebuie să subliniez că, în propria mea experiență, în mod repetat, am văzut propriul meu conținut clasându-se mai rău decât site-urile pe care a fost sindicat. Așadar, chiar dacă Google consideră că este bun la identificarea sursei originale a conținutului, datele mele sugerează contrariul. În timp, nu putem decât să sperăm că Google îmbunătățește acest aspect al algoritmului său; cu siguranță nu mai putem face nimic ca webmasteri. În schimb, trebuie doar să înțelegeți avantajele și dezavantajele sindicalizării și să decideți dacă vă simțiți confortabil cu riscul ca Google să identifice în mod greșit proprietatea asupra conținutului dvs.

Iată câteva sfaturi pentru a minimiza riscul ca Google să greșească (în teorie):

  • Postați întotdeauna conținut nou pe propriul dvs. site web și apoi așteptați să-l sindicați în altă parte până când Google a accesat cu crawlere și a indexat conținutul dvs. Puteți verifica dacă o anumită pagină a fost indexată efectuând o interogare de căutare a adresei URL exacte, între ghilimele. Dacă căutarea returnează rezultatul corect (adică nu rezultate zero), atunci acesta a fost indexat. Un alt truc elegant pe care îl puteți încerca este să selectați aleatoriu 11-12 cuvinte din conținutul dvs. și să căutați acel șir, din nou între ghilimele. Nu v-ați gândi, dar probabilitatea ca orice 10-12 cuvinte dintr-o anumită secvență să apară în altă parte pe Web este extrem de mică. Încercați acum - copiați și lipiți o propoziție aleatorie din acest paragraf în Google, înconjurați-o între ghilimele și vedeți câte rezultate obțineți. Probabil că veți găsi acest URL doar ca rezultat, cu excepția cazului în care acest articol a fost sindicalizat (acesta este, de asemenea, o modalitate excelentă de a verifica ce site-uri au preluat conținutul dvs. atunci când îl sindicalizați).
  • Includeți întotdeauna un backlink în versiunea dvs. sindicalizată la adresa URL sursă de conținut originală. Google spune că aceasta este modalitatea de a face acest lucru corect, dar încă nu este un lucru sigur. Cu toate acestea, cu siguranță nu poate face rău.

Ce zici de a lua sugestia Vanessei și de a-ți rescrie conținutul înainte de a-l sindicaliza?

Acest lucru ar rezolva cu siguranță problema de a obține propriul dvs. conținut în esență dezindexat atunci când Google atribuie în mod greșit calitatea de proprietar al conținutului, dar există și câteva probleme majore cu acesta:

  • Este foarte scump dacă aveți mult conținut. Gândește-te la cât timp ți-ar lua pentru a rescrie fiecare articol pe care îl ai. Numai această postare are peste 6.000 de cuvinte și mi-a luat ore și ore să scriu! Ați putea externaliza rescrierea către un serviciu precum Human Rewriter, dar acest lucru vă va costa în jur de 4 USD pe 500 de cuvinte (mai puțin decât costul SEO și al construirii de linkuri), dar cheltuielile sunt probabil redundante. Acest lucru ar putea deveni foarte scump dacă aveți mult conținut.
  • În continuare distribuiți conținut cu tematică actuală în jurul acelorași cuvinte cheie ca și conținutul dvs. original, așa că nu este deloc ușor să credeți că conținutul rescris ar depăși în continuare conținutul original pentru interogări de căutare relevante, în special pe site-urile cu autoritate înaltă, cum ar fi EzineArticles.

Conținutul duplicat pe același domeniu

Cuvântul final este că, dacă nu dublați într - adevăr ostentativ conținutul dvs. pe tone de URL - uri în cadrul aceluiași domeniu, nu e nimic să vă faceți griji. Una dintre adresele URL pe care se află conținutul duplicat va fi indexată și aleasă ca „reprezentant” al acelui cluster URL. Când utilizatorii efectuează interogări de căutare în motoarele de căutare, respectivul conținut va fi afișat ca rezultat pentru interogări relevante, iar celelalte adrese URL din clusterul dupe nu. Simplu.

Cu toate acestea, cealaltă față a monedei este un conținut duplicat în diferite domenii . Și acesta este un monstru cu totul diferit. Sunteți gata să o abordați? Începem.

„Conținut duplicat” tradițional

Traditional “Duplicate Content”

Conținutul duplicat tradițional este tipul de conținut care îți vine în minte intuitiv când auzi expresia. Este un conținut identic sau foarte similar cu conținutul care există în altă parte pe web (de obicei pe propriul site). Există câteva motive pentru care un site ar reproduce intenționat acest conținut:

  • Reproducerea conținutului vechi pentru ca site-ul dvs. să pară mai actualizat.
  • Copierea materialului de mai multe ori pentru a adăuga mai multe pagini pe site-ul dvs.
  • Materialul plagiat pentru a fi transmis ca al tău.

Toate aceste situații sunt înșelătoare, uneori pentru utilizatori și alteori pentru Google și, în cea mai mare parte, webmasterii știu să stea departe de aceste practici. Dacă vă angajați în ele, probabil că meritați o pedeapsă.

Conținut duplicat ascuns

Îi spun conținut duplicat „șmecher” din cauza cât de ușor vă poate strecura. Nu aveți intenția de a crea pagini duplicate, dar acestea se pot întâmpla oricum. De obicei, acest lucru se datorează unui sughiț tehnic sau unei reproduceri involuntare; de exemplu:

  • Dacă aveți două versiuni ale site-ului dvs. pentru https: // și https: //, Google poate indexa ambele versiuni ale fiecărei pagini separat, apoi poate marca acele pagini ca instanțe de conținut duplicat.
  • Dacă aveți o versiune „imprimabilă” a unei pagini web, aceasta se va afișa ca o adresă URL separată cu același conținut.
  • Forme complete și modificate de mobil ale paginilor web, cum ar fi secțiunile forumului.

Din păcate, majoritatea acestor cazuri pot apărea în mod natural pe măsură ce vă construiți și modificați site-ul web, cu excepția cazului în care ați întreprins măsuri preventive specifice pentru a-l opri.

„Dar nu-mi copiez conținutul”

Prima dvs. reacție la această evaluare poate fi una de concediere. Nu vă copiați conținutul de la o pagină la alta. Aveți grijă minuțioasă să vă asigurați că fiecare pagină a site-ului dvs. este scrisă inițial, fără fraze sau secțiuni duplicate.

Din păcate, există încă un risc pentru dvs. Ceea ce Google înregistrează ca „conținut duplicat” nu este întotdeauna ceea ce un utilizator vede ca conținut duplicat. Un utilizator care navighează prin paginile dvs. nu poate întâlni niciodată o frază repetată, dar Google poate să acceseze cu crawlere site-ul dvs. și să găsească zeci de repetări în etichetele dvs. de titlu sau este posibil să aveți mai multe adrese URL necanonizate care găzduiesc același conținut de pe pagină. Chiar dacă vă simțiți sigur că nu ați influențat direct o formă de conținut duplicat, merită să vă verificați site-ul doar pentru a fi sigur.

Cum să găsiți (și să curățați) conținut duplicat

How to Find (and Clean) Duplicate Content

Remedierea conținutului duplicat este relativ ușoară. Găsirea acestuia este partea dificilă. Așa cum am menționat mai sus, conținutul duplicat poate fi dificil de detectat - doar pentru că nu aveți conținut repetat din perspectiva experienței utilizatorului nu înseamnă că nu aveți conținut repetat din perspectiva algoritmului de căutare.

Primul dvs. pas este unul manual; parcurgeți site-ul dvs. și vedeți dacă există repetări evidente ale conținutului. De exemplu, aveți un paragraf identic care să încheie fiecare dintre paginile dvs. de servicii? Rescrieți-l. Ați reutilizat o secțiune dintr-o postare de blog trecută într-o postare nouă? A face o distinctie. După ce ați finalizat această scanare manuală inițială, există două instrumente principale pe care le puteți utiliza pentru a găsi mai multe instanțe ascunse mai bine de conținut duplicat.

Efectuați propria căutare

În primul rând, puteți efectua o căutare pentru a vedea prin ochii Google. Utilizați o etichetă Site: pentru a restrânge căutarea numai la site-ul dvs. și urmați cu o etichetă intitle: pentru a căuta o anumită frază. Ar trebui să arate puțin așa:

Site: thisisyoursite.comintitle: ”thisisyourtargetphrase”

Această căutare va genera toate rezultatele de pe site-ul dvs. care se corelează cu expresia aleasă. Dacă vedeți mai multe rezultate identice, știți că aveți o problemă de conținut duplicat.

Verificați Instrumentele pentru webmasteri

O modalitate mai simplă de a verifica conținutul duplicat este de a utiliza Google Webmaster Tools pentru a vă accesa cu crawlere site-ul și a raporta orice erori. După ce v-ați creat și ați verificat contul Instrumente pentru webmasteri, accesați fila Aspect căutare și faceți clic pe „Îmbunătățiri HTML”. Aici, veți putea vedea și descărca o listă de meta descrieri duplicate și etichete de titlu. Acestea sunt probleme obișnuite și ușor de remediat, care necesită doar puțin timp pentru rescriere.

Pentru a stabili dacă un eșantion de conținut duplicat va reduce clasamentul, mai întâi trebuie să determinați de ce veți publica în primul rând un astfel de conținut.

Totul se rezumă la scopul tău.

Dacă obiectivul dvs. este să încercați să punk sistemul folosind un conținut care a fost publicat în altă parte, sunteți obligat să fiți penalizat. Scopul este clar înșelător și este destinat manipulării rezultatelor căutării.

Iată ce a spus Google despre acest tip de comportament:

Conținutul duplicat de pe un site nu este motiv de acțiune pe acel site decât dacă se pare că intenția conținutului duplicat este de a fi înșelător și de a manipula rezultatele motorului de căutare.

Copyscape

Copyscape

Pentru 5 cenți pe căutare, puteți solicita copyscape veterinarului o bucată întreagă pentru dvs. Dar dacă bugetul dvs. nu permite acest tip de cheltuieli, puteți utiliza Copyscape gratuit. Captura cu Copyscape gratuit este că va trebui să publicați mai întâi conținutul online pentru a-i recupera URL-ul.

Copiați și lipiți adresa URL a conținutului dvs. recent publicat în caseta de căutare Copyscape. Ceea ce face Copyscape este să scaneze întregul interweb pentru orice copie a conținutului pe care tocmai l-ați publicat.

Copyscape este un instrument de încredere de care mulți editori depind în mare măsură pentru a verifica calitatea și originalitatea. Există alte instrumente foarte asemănătoare cu Copyscape pe care le puteți utiliza în același scop, cum ar fi Plagiarism Detect și InterNIC.

Verificarea conținutului duplicat este destul de ușoară și simplă. Este o sarcină indispensabilă SEO pentru începători, dar nimeni nu ar trebui să o ia de la sine. Cu setul corect de instrumente, vă puteți asigura confortabil că conținutul dvs. este unic înainte de ao publica online.

Și oferind cititorilor dvs. conținut de înaltă calitate și unic, veți avea o valoare deosebită.

Cum se curăță conținutul duplicat

După ce ați identificat zonele critice ale duplicării pe site-ul dvs., puteți începe să luați măsuri pentru a le corecta. Cu cât luați măsuri corective mai repede, cu atât mai repede veți începe să reveniți din efectele negative. Din fericire, Google vă ajută, de asemenea, să găsiți și să corectați conținut duplicat pe site-ul dvs. Când vă conectați la Google Webmaster Tools, mergeți la „Aspect de căutare”, apoi „Îmbunătățiri HTML”. Acest lucru vă va permite să generați o listă a oricăror pagini pe care Google le detectează ca fiind duplicate. Odată ce aveți această listă, puteți începe să eliminați erorile duplicate unul câte unul cu oricare dintre următoarele metode:

  • Eliminați duplicarea inutilă. Primul pas este cel mai ușor și cel mai evident, deși poate consuma mult timp dacă aveți mai multe instanțe. În orice situație în care puteți rescrie un conținut pentru a rezolva duplicarea, faceți-o. Puneți-vă ideile în cuvinte diferite, folosiți diferite dispozitive de încadrare și nu vă fie teamă să rescrieți de la bază.
  • Cazane . Long boilerplates or copyright notices should be removed from various pages and placed on a single page instead. In cases where you would have to call your readers' attention to boilerplate or copyright at the bottom of each of your pages or posts, insert a link to the single special page instead.
  • Similar pages . There are cases when similar pages must be published, such as SEO for small and big businesses. Avoid publishing the same or similar information. Instead, expand on both services and make the information very specific to each business segment.
  • Noindex . People could be syndicating your content. If there's no way to avoid this, include a note at the bottom of each page of your content that asks users to include a “noindex” metatag on your syndicated content to prevent the duplicate content from being indexed by the search engines.
  • 301 redirects . Let the search engine spiders know that a page has permanently moved by using 301 redirects. This also alerts the search engines to remove the old URL from their index and replace it with the new address.
  • Choosing only one URL . There might be several URLs you could use to point to your homepage, but you should choose only one. When choosing the best URL for your page, be sure to keep the users in mind. Make the URL user-friendly. This makes it easier not only for your users to find your page, but also for the search engines to index your site. Some duplicate content errors aren't due to actual duplicated content. They have to do with the URL structure that Google sees. For example, if you have one page that is associated with thisisyoursite.com/, thisisyoursite.com/?, and thisisyoursite.com/?sessionid=111, Google will see that page as repeating content three times. First, choose between www or non-www formatting and stick to that.
  • Always create unique content . Affiliates almost always fall victim to the convenience of ready-made content provided by merchants. If you are an affiliate, be sure to create unique content for the merchant products you are promoting. Don't just copy and paste.

Concluzie

Let's do a brief recap. “Duplicate content” can refer to plagiarized material, copied content for the purposes of site inflation, but more importantly for the average user, pages that Google indexes twice. These duplicate forms of content are easy to track down with Google Webmaster Tools and fix with canonicalization adjustments or redirects, but if they go unnoticed, they can cumulatively bring your rankings down. Be proactive and scout for duplicate content at least once every few months—unless your site management process is flawless, it's probably that duplicate content will surface when you least expect it.

In the end, it all comes down to testing on a massive scale, getting solid data and making decisions based on that data. So here's what I'm going to do. I'm going to run a huge test and then update this post with my results. At the beginning of the post I mentioned that I am soon launching a massive Website with tons of unique content. I'm going to syndicate it all, completely unedited, as far and wide as I possibly can. As I do so, I'll monitor traffic sources to see what keywords people are using to find my content. Then, I'll replicate those keyword queries in Google and see where my site ranks in the search results. This should be the definitive test for the merits of syndication.

Thanks for sticking with me through this crazy post!