Zduplikowana treść: najlepszy przewodnik po znajdowaniu i naprawianiu zduplikowanych treści w celu poprawy SEO
Opublikowany: 2019-10-18Zduplikowana treść jest zła. Korzystanie z tej samej treści, w całości lub w części, w Twojej witrynie prowadzi do słabszego doświadczenia użytkownika i powoduje wyświetlenie czerwonej flagi w algorytmie wyszukiwania Google. W dawnych czasach SEO, duplikaty treści były często używane jako tania sztuczka, aby uzyskać więcej słów kluczowych i więcej treści w Twojej witrynie, więc Google rozwinęło system, aby wyeliminować spamerów, którzy naruszyli najlepsze praktyki, robiąc to. Dzisiaj, jeśli zostaniesz przyłapany na używaniu zduplikowanych treści, Twój autorytet domeny może ucierpieć, a rankingi słów kluczowych mogą spaść.
Na szczęście Google dość uczciwie podchodzi do tego problemu. Firma rozumie, że większość problemów ze zduplikowaną zawartością nie wynika ze złośliwej próby taniego podniesienia rangi. W rzeczywistości większość przypadków zduplikowanych treści to przypadki lub są pomijane przez webmasterów. Mimo to zbyt duża liczba powtarzających się treści w witrynie może być szkodliwa, dlatego w Twoim najlepszym interesie jest przeprowadzenie testu, aby sprawdzić, czy w witrynie nie ma duplikatów.
Wstęp
Odkąd zacząłem zajmować się SEO, to pytanie krążyło na forach i blogach. Gdzieś tam ktoś utrwalił pomysł, że posiadanie tej samej treści na stronie A Twojej witryny, co na stronie B Twojej witryny, spowodowałoby ukaranie Twojej witryny w rankingach wyszukiwarek. Pomysł ten zaczął przenikać do społeczności zajmującej się marketingiem internetowym, ponieważ grupa spamerów zdała sobie sprawę, że gdy mają część treści (np. artykuł), która generuje duży ruch w sieci wyszukiwania, mogą wypełnić każdą stronę swojej witryny te same treści, aby przyciągnąć jeszcze większy ruch z wyszukiwarek. Oczywiście ten sam artykuł rażąco powielany na setkach stron w obrębie jednej domeny jest złośliwą próbą zdobycia ruchu w wyszukiwarkach, nie dodając żadnej wartości. Google dość szybko przyjęło tę metodę i naprawiło swoje algorytmy do wykrywania duplikatów treści i wyświetlania tylko jednej jej wersji w rankingu wyszukiwania. Strony internetowe, które zaangażowały się w tę rażącą działalność, zostały usunięte z indeksu i zaczęły płakać na forach i blogach w społeczności marketingu internetowego. W ten sposób narodził się strach przed „karą za powielanie treści”.
Jednak w zdecydowanej większości przypadków zduplikowana treść nie jest złośliwa i jest po prostu produktem dowolnego CMS (systemu zarządzania treścią), na którym działa strona internetowa. Na przykład WordPress (standard CMS w branży) automatycznie tworzy strony „Kategorii” i „oznaczania”, które zawierają listę wszystkich postów na blogu w ramach określonych kategorii lub tagów. Tworzy to wiele adresów URL w domenie, które zawierają tę samą treść.
1) Google może zdecydować o wyrzuceniu mnie z „ostrzeżeniem” i po prostu zrezygnować z indeksowania 99 ze 100 zduplikowanych postów, ale pozostawić jeden z nich zindeksowany. UWAGA: Nie oznacza to, że w jakikolwiek sposób wpłynie to na rankingi wyszukiwania mojej witryny.
2) Google może uznać, że jest to tak rażąca próba oszukania systemu, że całkowicie usunie całą moją witrynę ze wszystkich wyników wyszukiwania. Oznacza to, że nawet jeśli wyszukasz bezpośrednio „Example.com”, Google nie znajdzie żadnych wyników.
Tak więc jeden z tych dwóch scenariuszy jest gwarantowany. Który to jest, zależy od tego, jak rażąco Google określi twój błąd. Własnymi słowami Google:
Zduplikowana treść w witrynie nie stanowi podstawy do działania w tej witrynie, chyba że wydaje się, że jej celem jest wprowadzenie w błąd i manipulowanie wynikami wyszukiwania. Jeśli w Twojej witrynie występują problemy z powieloną treścią, a nie stosujesz się do powyższych porad, możemy dobrze wybrać wersję treści, która ma być wyświetlana w naszych wynikach wyszukiwania.
Ten typ niezłośliwego powielania jest dość powszechny, zwłaszcza że wiele systemów CMS domyślnie nie radzi sobie z tym dobrze. Więc kiedy ludzie mówią, że posiadanie tego typu zduplikowanych treści może wpłynąć na twoją witrynę, to nie dlatego, że prawdopodobnie zostaniesz ukarany; to po prostu ze względu na sposób działania witryn internetowych i wyszukiwarek.
Większość wyszukiwarek dąży do pewnego poziomu różnorodności; chcą pokazać ci dziesięć różnych wyników na stronie wyników wyszukiwania, a nie dziesięć różnych adresów URL, które mają tę samą treść. W tym celu Google stara się odfiltrować duplikaty dokumentów, aby użytkownicy odczuwali mniejszą nadmiarowość.
Co się dzieje, gdy robot wyszukiwarek wykryje zduplikowane treści? (z https://searchengineland.com/search-illustrated-how-a-search-engine-determines-duplicate-content-13980)
Jak Google karze za powielanie treści

Google otwarcie mówi o swojej polityce dotyczącej duplikatów treści. Według ich raportów, jeśli Google napotka dwie różne wersje tej samej strony internetowej lub treści, które są znacznie podobne do treści na stronie w innym miejscu, losowo wybierze „kanoniczną” wersję do zindeksowania. Przykład, który podają, jest następujący: wyobraź sobie, że masz standardową stronę internetową i wersję do druku tej samej strony internetowej, zawierającą identyczną treść. Google wybrałby losowo jedną z tych stron do zindeksowania i całkowicie zignorował drugą wersję. Nie oznacza to poniesienia kary, ale w Twoim najlepszym interesie jest upewnienie się, że Google prawidłowo indeksuje i organizuje Twoją witrynę.
Prawdziwy problem pojawia się, gdy Google podejrzewa, że twoje treści są złośliwie lub manipulująco duplikowane. Zasadniczo, jeśli Google uzna, że zduplikowana treść była próbą oszukania ich algorytmu rankingu, spotkasz się z działaniami karnymi. W Twoim najlepszym interesie jest usunięcie wszelkich błędów z dużym wyprzedzeniem, aby zapobiec takiemu losowi Twojej witryny.
Syndykacja: zduplikowana zawartość w różnych domenach
Czasami ten sam fragment treści może pojawiać się słowo w słowo w różnych adresach URL. Oto kilka przykładów:
- Artykuły z wiadomościami (pomyśl Associated Press)
- Ten sam artykuł z katalogu artykułów jest wybierany przez różnych webmasterów
- Webmasterzy przesyłający tę samą treść do różnych katalogów artykułów
- Komunikaty prasowe rozpowszechniane w sieci
- Informacje o produkcie od producenta pojawiające się w różnych witrynach e-commerce
Wszystkie te przykłady są wynikiem syndykacji treści . Sieć jest pełna treści syndykowanych. Jedna informacja prasowa może tworzyć duplikaty treści w tysiącach unikalnych domen. Wyszukiwarki jednak starają się zapewnić użytkownikom wyszukującym dobre wrażenia, a dostarczanie strony wyników zawierającej te same fragmenty treści nie uszczęśliwiłoby wielu osób. Co więc ma robić wyszukiwarka? W jakiś sposób musi zdecydować, która lokalizacja treści jest najbardziej odpowiednia do wyświetlenia wyszukiwarce. Więc jak to się robi? Prosto z dużego G:
Gdy napotykamy takie zduplikowane treści w różnych witrynach, przyglądamy się różnym sygnałom, aby określić, która witryna jest oryginalna, co zwykle działa bardzo dobrze. Oznacza to również, że nie powinieneś obawiać się negatywnego wpływu na obecność Twojej witryny w Google, jeśli zauważysz, że ktoś skrobał Twoje treści.
Cóż, Google, błagam o różnicę. Niestety nie wydaje mi się, że jesteś dobry w decydowaniu, która witryna jest twórcą treści. Podobnie Michael Gray, który w swoim poście na blogu „Kiedy Google dostaje zduplikowane treści źle” ubolewa, że Google często przypisuje jego oryginalną treść innym witrynom, do których udostępnia swoje treści. Według Michaela:
Jednak problem tkwi w Google, ich algorytm rankingowy IMHO zbytnio kładzie nacisk na zaufanie i autorytet domeny.
I zgadzam się z Michaelem. Przez większość mojej kariery w marketingu internetowym syndykowałem pełne artykuły do różnych katalogów artykułów, aby poszerzyć zasięg moich treści, jednocześnie używając ich jako „paliwa SEO”, aby uzyskać linki zwrotne do moich stron internetowych. Według Google, o ile Twoje wersje konsorcjalne zawierają link zwrotny do oryginału, pomoże to w przypadku, gdy Google zdecyduje, który kawałek jest oryginałem. Oto dowód:
Najpierw film z Mattem Cuttsem, znanym blogerem i byłym inżynierem algorytmów wyszukiwarek dla Google:
Dyskusja na temat syndykacji zaczyna się około 2:25. O 2:54 mówi, że możesz powiedzieć ludziom, że jesteś „mistrzem treści”, umieszczając link z konsorcjalnego utworu z powrotem do oryginalnego utworu.
Więcej dowodów:
W przypadkach, gdy dystrybuujesz swoje treści, ale chcesz również upewnić się, że Twoja witryna jest identyfikowana jako oryginalne źródło, warto poprosić partnerów dystrybucyjnych o dołączenie linku do oryginalnej treści.
I w końcu:
Syndykuj ostrożnie : jeśli dystrybuujesz swoje treści w innych witrynach, Google zawsze pokaże wersję, która naszym zdaniem jest najbardziej odpowiednia dla użytkowników w każdym wyszukiwaniu, która może być lub nie być wersją preferowaną przez Ciebie. Warto jednak upewnić się, że każda witryna, w której rozpowszechniane są Twoje treści, zawierała link do oryginalnego artykułu. Możesz również poprosić osoby korzystające z Twoich materiałów syndykowanych o użycie metatagu noindex, aby uniemożliwić wyszukiwarkom indeksowanie ich wersji treści.
To, co myślę, jest interesujące z tego ostatniego cytatu z Google, to to, że faktycznie przyznają, że wybrana przez nich treść może nie być właściwa. Z mojego doświadczenia wynika, że prawdopodobnie nie uda się wybrać właściwej, jeśli witryna, z której pochodzi treść, jest stosunkowo młoda lub ma niski PageRank. To rodzi kolejny duży problem:
Jak uzyskać pozycję w rankingu jako oryginalne źródło treści, które syndykuję?

W poprzednim życiu dystrybuowałem mnóstwo moich artykułów do EzineArticles tylko po to, aby Google przypisywał im wyższe wyniki wyszukiwania dla moich treści, nawet jeśli w pełni upewniłem się, że Google zindeksował moją treść w oryginalnej lokalizacji przed przesłaniem jej do Ezine. Vanessa Fox, która wcześniej pracowała w Google i stworzyła Centrum dla webmasterów, próbuje odpowiedzieć na to pytanie w swoim poście na blogu „Ranking jako oryginalne źródło treści, które syndykujesz”.
Niestety, dochodzi do wniosku, że w zasadzie nic nie możesz zrobić, aby to zrobić. Ona sugeruje:
Utwórz inną wersję treści do rozpowszechniania niż to, co piszesz dla własnej witryny. Ta metoda działa najlepiej w przypadku takich rzeczy, jak kanały partnerskie produktów. Nie sądzę, aby działało to równie dobrze w przypadku postów na blogu lub innych rodzajów artykułów. Zamiast tego możesz zrobić coś takiego, jak napisać artykuł z podsumowaniem wysokiego poziomu dla syndykacji i post na blogu ze szczegółowymi informacjami na ten temat dla własnej witryny.
Przepisywanie fragmentu treści nie jest moją definicją syndykacji. To po prostu przepisanie artykułu innymi słowami i rozprowadzenie go. Prawie wszystkie informacje krążące w sieci i tak zostały już opublikowane gdzie indziej; nawet ten wpis na blogu zawiera mnóstwo informacji, które znalazłem w innym miejscu w Internecie. Tak więc dla mnie pisanie nowego artykułu, w którym mówi się to samo innymi słowami, i rozpowszechnianie tego wśród partnerów nie jest tak naprawdę rozpowszechnianiem oryginalnego artykułu. To syndykacja innego artykułu. Pozostaje więc pytanie o wyniki dystrybucji dokładnie tych samych treści, które już pojawiają się na Twojej stronie: jakie są tego skutki? Czy może to w jakikolwiek sposób zaszkodzić moim rankingom ?
Dla mnie to najważniejsze pytanie dotyczące duplikatów treści. Zanim przejdę do tej analizy, rozważmy ważne fundamentalne pytanie.
Dlaczego miałbym chcieć dystrybuować dokładnie te same treści z mojej witryny w innym miejscu?
Internet naprawdę działa w oparciu o prostą ekonomię dawania i brania. Dwoma wymienianymi towarami są unikatowe treści i linki zwrotne . Niepowtarzalna treść to treść, której Google nie identyfikuje jako duplikat. Istnieją różne teorie na temat tego, gdzie dokładnie Google wyznacza linię decydowania o tym, czy treść należy uznać za duplikat , ale jedna liczba, którą często rzucano, to 30%. Zasadniczo, zgodnie z teorią 30%, jeśli Google zidentyfikuje, że ponad 30% określonej treści pojawia się w innym miejscu w Internecie, zostanie ona zakwalifikowana jako duplikat. Teraz nie mogę potwierdzić dokładności tej liczby, więc weź ją za to, co jest warte. Istnieją również różne programy do wykrywania duplikatów treści, takie jak CopyScape, które ma na celu pomóc webmasterom sprawdzić, czy ich treść nie została skradziona i powielona w innych domenach. Jest to również dobre narzędzie do określenia, czy Twoja treść może zostać uznana przez Google za duplikat . I to się naprawdę liczy.
Ale trochę zboczyłem z kursu, więc wróćmy do dyskusji, dlaczego chcesz dystrybuować treści. Wspomniałem o internetowej ekonomii backlinków i unikalnych treści. Unikalna treść jest pożądana, ponieważ będzie indeksowana przez Google, dając tej konkretnej witrynie kolejne wystąpienie jej „nazwy w kapeluszu”, że tak powiem. Zasadniczo im więcej treści zindeksowała witryna, tym większe są szanse, że zostanie zwrócona w wynikach wyszukiwania Google dla odpowiednich zapytań.
Ale co z linkami zwrotnymi? Linki zwrotne to po prostu linki z dowolnej innej witryny do Twojej własnej. Wyszukiwarki uznają to za „głos”, gdy jedna strona internetowa łączy się z drugą. Ten głos służy do określenia autorytetu i trafności wyników wyszukiwania Google. W rzeczywistości uważa się, że linki zwrotne są najważniejszym czynnikiem decydującym o tym, jak Twoja witryna powinna wyglądać w rankingu dla danego zapytania. Istnieje mnóstwo czynników, które wpływają na linki zwrotne i to, na ile liczy się ich „głos”, ale zajmę się tym w przyszłym poście na blogu. Na razie musisz wiedzieć, że linki zwrotne są cenne, ponieważ poprawiają Twoje pozycje w wyszukiwarkach, a to oznacza większy ruch na Twojej stronie.
OK, więc teraz omówiliśmy podstawowe towary mikroekonomii sieci. Jest to ważne, ponieważ kiedy syndykujesz swoje treści, zakładając, że umieściłeś w nim link zwrotny, który łączy się z oryginalnym źródłem, otrzymujesz link zwrotny z każdej witryny, do której Twoja treść była dystrybuowana. Niesamowite, prawda?
Może nie. Pierwsze pytanie dotyczy tego, jak wysoko Google ceni link zwrotny z fragmentu treści, o którym wiadomo, że jest zduplikowaną treścią. Szczerze, nie wiem. Z jednej strony łatwo jest dystrybuować treści do grupy automatycznie akceptowanych blogów, jeśli Twoim jedynym celem jest uzyskanie linków zwrotnych, a to nie mówi nic o jakości Twoich treści ani o tym, ile twórca treści powinien zostać nagrodzony. Z drugiej strony syndykacja może być również doskonałym wskaźnikiem jakości określonego fragmentu treści. W końcu, dlaczego miałby być tak rozpowszechniany, gdyby nie był naprawdę świetny?
Ostatecznie Google prawdopodobnie ma sygnały, w jaki sposób odpowiada na te dwa pytania, ale prawdziwe odpowiedzi są prawdopodobnie znane tylko inżynierom oprogramowania, którzy zakodowali algorytm. Wiele osób próbuje zwiększyć wartość swoich treści dystrybuowanych, angażując się w „wirowanie” treści, które są całkowicie legalne, o ile nie są to śmieci, które często są wyrzucane przez zautomatyzowane oprogramowanie. Bardziej szczegółowo omówię temat obracania się treści w późniejszym poście. Na razie wciąż próbujemy odpowiedzieć na pytanie, czy dystrybuowanie treści dokładnie takiej, jaka pojawia się w Twojej witrynie, jest dobrym czy złym pomysłem. Po dokładnych testach doszedłem do następującego wniosku:
.
…
…….
*werble*
…
……
*więcej bębnów*
…..
…
Być może.
Wiem wiem. To nie jest odpowiedź, której chciałeś. Pozwól mi wyjaśnić.
Posiadam ponad 50 domen i lubię przeprowadzać na nich wiele testów. Wczoraj wieczorem spędziłem kilka godzin na wyszukiwaniu moich treści, które udostępniłem w różnych innych blogach i katalogach. I to, co znalazłem, było zarówno rozczarowujące, jak i zachęcające.
Rozczarowujące było to, że w wielu przypadkach moja konsorcjalna treść przewyższała moją własną oryginalną treść. Nawet jeśli witryna zajmująca wyższą pozycję w rankingu niż moja dla mojej własnej treści miała link zwrotny do mojej witryny, autora treści, to było tak, jakby Google całkowicie zignorował ten link zwrotny i nadal przypisywał więcej zasług innym witrynom. W niektórych przypadkach nigdzie nie można było znaleźć wersji treści mojej własnej witryny, co oczywiście wpadało w zduplikowany klaster adresów URL Google i zostało odfiltrowane z wyników wyszukiwania. Oznacza to, że dystrybuując moje treści, w rzeczywistości moje własne treści zostały zdeindeksowane.
To najgorszy możliwy scenariusz, ale tak się stało. Przynajmniej czasami. I to jest najdziwniejsza część; czasami moja treść była rozpoznawana jako oryginalna i otrzymywała najwyższą ocenę. W przypadku innych witryn i fragmentów treści zajmował drugie miejsce za witryną o wysokim autorytecie, zwykle EzineArticles. Muszę więc stwierdzić, co następuje:
Dystrybucja treści może:
- Powoduje, że Twoje własne, oryginalne źródło treści (tj. Twoja witryna) zostanie deindeksowane dla tego fragmentu treści
- Spraw, aby Twoja witryna miała wysoką pozycję w rankingu dla zapytań związanych z treścią, ale nie najwyższą
- Spraw, aby Twoja witryna uzyskała najwyższą pozycję w rankingu dla Twoich treści
Cóż, to w zasadzie obejmuje wszystkie podstawy, prawda? Są to wszystkie wyniki, które zaobserwowałem podczas przeglądania własnych witryn oraz wyniki syndykowania artykułów pochodzących z tych witryn. Zasadniczo mogę stwierdzić, że Google po prostu nie zawsze robi to dobrze. A Google nie lubi robić niczego z jakąkolwiek konsekwencją. Ostatnią rzeczą, jakiej chcą, jest to, abyśmy my, SEO, całkowicie rozpracowali ich algorytm, ponieważ gdy to się stanie, integralność ich wyników wyszukiwania zostanie zniszczona, ponieważ ludzie będą nimi manipulować do diabła.

Zachęcającą częścią było odkrycie, że linki zwrotne z treści konsorcjalnych zdecydowanie pomogły w rankingu moich witryn dla moich docelowych słów kluczowych. Tak więc zdecydowanie istnieje przynajmniej pewna wartość linków zwrotnych pochodzących z treści, które Google określił jako „duplikaty”.
Pozostaje więc pytanie: czy powinienem dystrybuować swoje treści?
Spójrzmy na korzyści z tego płynące:
Korzyści z syndykowania treści
- Uzyskaj linki zwrotne z wielu witryn
- Zwiększ zasięg i świadomość marki w witrynach o dużym natężeniu ruchu
- Uzyskaj bezpośredni ruch dzięki odesłaniom z linków zwrotnych w swoich treściach syndykowanych
- Znacznie tańszy sposób na uzyskanie linków zwrotnych niż pisanie zupełnie nowej treści (lub przepisywanie istniejącej treści) do dystrybucji/syndykacji
Wady syndykowania treści
- Witryny, do których prowadzisz dystrybucję, mogą w rzeczywistości przewyższyć Cię pod względem własnych treści, jeśli mają wyższy autorytet niż Twoja własna witryna, nawet jeśli zastosujesz się do rad Google i dodasz link zwrotny do oryginalnego źródła treści
- Google może pogrupować adres URL, pod którym znajduje się Twoja treść, z pozostałymi duplikatami, ukrywając go przed stronami wyników wyszukiwania (skutecznie usuwając go z indeksu)
Tak więc dystrybucja treści jest ryzykowna. Zdecydowanie możesz uzyskać to, co najlepsze z obu światów, jeśli Google uzna, że Twoja witryna jest twórcą treści , nagradzając w ten sposób treść najwyższą pozycją w wynikach wyszukiwania, a także uzyskując wszystkie soczyste linki zwrotne, które wpływają na ogólne rankingi dla określonych słów kluczowych. Ale jeśli Google się pomyli (i robi to dość często, wbrew temu, co mogą sądzić), ryzykujesz, że Twoja treść nigdy nie zostanie sklasyfikowana pod kątem odpowiednich zapytań wyszukiwarek.
I to bardzo mnie martwi, bo zawsze uważałem, że nikt inny nie może zrobić nic innego, aby zaszkodzić rankingom konkretnego serwisu. Po przeanalizowaniu tych wyników obawiam się, że znalazłem lukę w mojej własnej argumentacji; jeśli ktoś inny odwiedzi moją witrynę, skopiuje całą moją zawartość i rozprowadzi ją w sieci, możliwe, że witryny, do których moja zawartość została udostępniona, będą miały dla niej wyższą pozycję niż moja własna witryna. Google próbuje rozwiązać ten problem tutaj, a także w filmie Matta Cuttsa:
W większości przypadków webmaster nie ma wpływu na strony trzecie, które zbierają i rozpowszechniają treści bez zgody webmastera. Zdajemy sobie sprawę, że nie jest to wina webmastera, którego dotyczy problem, co z kolei oznacza, że identyczne treści pojawiające się w kilku witrynach same w sobie nie są uznawane za naruszenie naszych wskazówek dla webmasterów. Prowadzi to po prostu do dalszych procesów mających na celu określenie oryginalnego źródła treści — coś, w czym Google jest całkiem dobry, ponieważ w większości przypadków oryginalną treść można poprawnie zidentyfikować, co nie powoduje żadnych negatywnych skutków dla witryny, z której pochodzi.
Znowu muszę niestety zaznaczyć, że z własnego doświadczenia wielokrotnie widziałem, że moja własna treść plasuje się gorzej niż strony, do których była dystrybuowana. Więc nawet jeśli Google uważa, że dobrze identyfikuje oryginalne źródło treści, moje dane sugerują coś innego. Z czasem możemy mieć tylko nadzieję, że Google poprawi ten aspekt swojego algorytmu; z pewnością nic więcej nie możemy zrobić jako webmasterzy. Zamiast tego musisz tylko zrozumieć zalety i wady syndykacji i zdecydować, czy nie masz nic przeciwko ryzyku błędnego zidentyfikowania przez Google własności Twoich treści.
Oto kilka wskazówek, które pozwolą zminimalizować ryzyko popełnienia błędu przez Google (teoretycznie):
- Zawsze publikuj nowe treści we własnej witrynie, a następnie poczekaj z dystrybucją w innym miejscu, aż Google zindeksuje i zindeksuje Twoją treść. Możesz sprawdzić, czy dana strona została zindeksowana, wyszukując dokładny adres URL w cudzysłowie. Jeśli wyszukiwanie zwraca poprawny wynik (tj. nie zero wyników), oznacza to, że zostało zindeksowane. Kolejną fajną sztuczką, którą możesz wypróbować, jest losowe wybranie 11-12 słów z treści i wyszukanie tego ciągu, ponownie w cudzysłowie. Nie pomyślelibyście, ale prawdopodobieństwo, że jakiekolwiek 10-12 słów w określonej kolejności pojawi się w innym miejscu w sieci, jest bardzo małe. Wypróbuj teraz — skopiuj i wklej losowe zdanie z tego akapitu do Google, otocz je cudzysłowami i zobacz, ile uzyskasz wyników. W rezultacie prawdopodobnie znajdziesz tylko ten adres URL, chyba że ten artykuł został rozpowszechniony (jest to również świetny sposób na sprawdzenie, które witryny pobrały Twoje treści, gdy je udostępniasz).
- W swojej dystrybuowanej wersji zawsze dołączaj link zwrotny do oryginalnego adresu URL źródła treści. Google twierdzi, że jest to sposób na zrobienie tego dobrze, ale nadal nie jest to pewne. Niemniej jednak na pewno nie zaszkodzi.
Co powiesz na skorzystanie z sugestii Vanessy i ponowne napisanie treści przed dystrybucją?
To z pewnością rozwiąże problem ewentualnego deindeksowania własnych treści, gdy Google błędnie przypisuje własność treści, ale jest z tym również kilka poważnych problemów:
- To naprawdę drogie, jeśli masz dużo treści. Zastanów się, ile czasu zajęłoby ci przepisanie każdego artykułu, który masz. Sam ten post ma ponad 6000 słów, a jego pisanie zajęło mi wiele godzin! Możesz zlecić przepisywanie do usługi takiej jak Human Rewriter, ale będzie to kosztować około 4 USD za 500 słów (mniej niż koszt SEO i budowania linków), ale wydatek jest prawdopodobnie zbędny. To może być bardzo drogie, jeśli masz dużo treści.
- Nadal rozpowszechniasz treści, które są tematycznie związane z tymi samymi słowami kluczowymi, co Twoja oryginalna treść, więc nie trzeba się przejmować, że przeredagowana treść nadal przewyższy Twoją oryginalną treść pod względem odpowiednich zapytań wyszukiwania, zwłaszcza w witrynach o wysokim autorytecie, takich jak EzineArticles.
Zduplikowana zawartość w tej samej domenie
Ostatnim słowem jest to, że jeśli naprawdę nie powielasz swoich treści w tonach adresów URL w tej samej domenie, nie ma się czym martwić. Jeden z Twoich adresów URL, pod którymi znajduje się zduplikowana treść, zostanie zindeksowany i wybrany jako „przedstawiciel” tego klastra adresów URL. Gdy użytkownicy wykonują zapytania wyszukiwania w wyszukiwarkach, ten konkretny fragment treści zostanie wyświetlony jako wynik dla odpowiednich zapytań, a inne adresy URL w klastrze dupe nie. Proste.
Jednak drugą stroną medalu są powielone treści w różnych domenach . A to zupełnie inny potwór. Gotowy na to? No to ruszamy.
Tradycyjne „duplikaty treści”

Tradycyjna zduplikowana treść to rodzaj treści, który intuicyjnie przychodzi na myśl, gdy słyszysz to zdanie. Jest to treść identyczna lub bardzo podobna do treści, która istnieje w innym miejscu w sieci (zwykle w Twojej witrynie). Istnieje kilka powodów, dla których witryna celowo powielałaby tę zawartość:
- Powielanie starych treści, aby Twoja witryna wyglądała na bardziej zaktualizowaną.
- Kopiowanie materiałów w kółko, aby dodać więcej stron do swojej witryny.
- Materiał plagiatowy, który uchodzi za Twój własny.
Wszystkie te sytuacje są zwodnicze, czasami dla użytkowników, a czasami dla Google, a w większości webmasterzy wiedzą, że należy trzymać się z daleka od tych praktyk. Jeśli się w nie angażujesz, prawdopodobnie zasługujesz na karę.
Podstępne zduplikowane treści
Nazywam to „podstępnymi” duplikatami ze względu na to, jak łatwo może się do ciebie podkraść. Nie masz zamiaru tworzyć duplikatów stron, ale i tak mogą się zdarzyć. Zwykle jest to spowodowane czkawką techniczną lub nieświadomą reprodukcją; na przykład:
- Jeśli masz dwie wersje swojej witryny dla https:// i https://, Google może zindeksować obie wersje każdej strony osobno, a następnie oznaczyć te strony jako wystąpienia zduplikowanej treści.
- Jeśli masz wersję strony internetowej „przyjazną dla drukarki”, zostanie ona wyświetlona jako osobny adres URL o tej samej treści.
- Pełne i mobilne formy stron internetowych, takie jak sekcje forum.
Niestety większość z tych przypadków może wystąpić naturalnie podczas tworzenia i modyfikowania witryny, chyba że podjęto konkretne działania zapobiegawcze, aby to zatrzymać.
„Ale nie kopiuję moich treści”
Twoją pierwszą reakcją na tę ocenę może być zwolnienie. Nie kopiujesz treści z jednej strony na drugą. Dbasz o to, aby każda strona Twojej witryny była oryginalnie napisana, bez zduplikowanych fraz lub sekcji.
Niestety nadal istnieje dla ciebie ryzyko. To, co Google rejestruje jako „duplikat treści”, nie zawsze jest tym, co użytkownik postrzega jako zduplikowaną treść. Użytkownik przeglądający Twoje strony może nigdy nie napotkać powtarzającego się wyrażenia, ale Google może zaindeksować Twoją witrynę i znaleźć dziesiątki powtórzeń w tagach tytułu lub możesz mieć wiele niekanonizowanych adresów URL zawierających tę samą treść na stronie. Nawet jeśli masz pewność, że nie miałeś bezpośredniego wpływu na jakąś formę zduplikowanych treści, warto sprawdzić swoją witrynę dla pewności.
Jak znaleźć (i wyczyścić) zduplikowaną zawartość

Naprawianie zduplikowanych treści jest stosunkowo łatwe. Znalezienie tego jest trudne. Jak wspomniałem powyżej, zduplikowana treść może być trudna do wykrycia — tylko dlatego, że nie masz żadnej powtarzającej się treści z perspektywy użytkownika, nie oznacza to, że nie masz powtarzającej się treści z perspektywy algorytmu wyszukiwania.
Twój pierwszy krok to ręczny; przejrzyj swoją witrynę i sprawdź, czy nie ma żadnych oczywistych powtórzeń treści. Na przykład, czy masz identyczny akapit zamykający każdą ze stron Twoich usług? Przepisz to. Czy ponownie wykorzystałeś część poprzedniego wpisu na blogu w nowym poście? Dokonaj rozróżnienia. Po zakończeniu wstępnego skanowania ręcznego dostępne są dwa główne narzędzia, których możesz użyć, aby znaleźć więcej, lepiej ukrytych wystąpień zduplikowanych treści.
Wykonaj własne wyszukiwanie
Po pierwsze, możesz przeprowadzić wyszukiwanie, aby spojrzeć oczami Google. Użyj tagu Site:, aby ograniczyć wyszukiwanie tylko do swojej witryny, a następnie dodaj tag intitle:, aby wyszukać określoną frazę. Powinno to wyglądać mniej więcej tak:
Site:thisisyoursite.comintitle:”thisisyourdocelphrase”
To wyszukiwanie wygeneruje wszystkie wyniki w podanej witrynie, które są skorelowane z wybraną frazą. Jeśli widzisz wiele identycznych wyników, wiesz, że masz problem ze zduplikowaną zawartością.
Sprawdź Narzędzia dla webmasterów
Prostszym sposobem sprawdzenia, czy nie ma duplikatów treści, jest użycie Narzędzi Google dla webmasterów do zindeksowania witryny i zwrócenia raportów o wszelkich błędach. Po utworzeniu i zweryfikowaniu konta Narzędzi dla webmasterów przejdź do karty Wygląd w wyszukiwarce i kliknij „Ulepszenia HTML”. Tutaj będziesz mógł zobaczyć i pobrać listę zduplikowanych opisów meta i tagów tytułu. Są to częste i łatwe do naprawienia problemy, których przepisanie wymaga tylko trochę czasu.
Aby określić, czy próbka zduplikowanych treści obniży Twoje rankingi, najpierw musisz określić, dlaczego w ogóle zamierzasz publikować takie treści.
Wszystko sprowadza się do twojego celu.
Jeśli twoim celem jest próba zepsucia systemu za pomocą fragmentu treści, który został opublikowany gdzie indziej, na pewno zostaniesz ukarany. Cel jest wyraźnie zwodniczy i ma na celu manipulowanie wynikami wyszukiwania.
Oto, co Google ma do powiedzenia na temat tego rodzaju zachowania:
Zduplikowana treść w witrynie nie stanowi podstawy do działania w tej witrynie, chyba że wydaje się, że jej celem jest wprowadzenie w błąd i manipulowanie wynikami wyszukiwania.
Copyscape

Za 5 centów za wyszukiwanie możesz poprosić Copyscape o weryfikację całego utworu. Ale jeśli Twój budżet nie pozwala na tego rodzaju wydatki, nadal możesz korzystać z Copyscape za darmo. Haczyk w darmowym Copyscape polega na tym, że musisz najpierw opublikować zawartość online, aby pobrać jej adres URL.
Skopiuj i wklej adres URL swojej nowo opublikowanej treści w polu wyszukiwania Copyscape. To, co robi Copyscape, to skanowanie całych sieci w poszukiwaniu kopii treści, które właśnie opublikowałeś.
Copyscape to niezawodne narzędzie, na którym wielu wydawców polega w dużym stopniu, aby sprawdzić jakość i oryginalność. Istnieją inne narzędzia bardzo podobne do Copyscape, których możesz użyć w tym samym celu, takie jak Plagiarism Detect i InterNIC.
Sprawdzanie duplikatów treści jest dość łatwe i proste. Jest to niezbędne zadanie SEO dla początkujących, ale nikt nie powinien brać tego za pewnik. Dzięki odpowiedniemu zestawowi narzędzi możesz wygodnie upewnić się, że Twoje treści są wyjątkowe na długo przed opublikowaniem ich w Internecie.
A dostarczając swoim czytelnikom wysokiej jakości i unikalne treści, zapewnisz sobie wielką wartość.
Jak wyczyścić zduplikowaną zawartość
Po zidentyfikowaniu krytycznych obszarów duplikacji w witrynie możesz zacząć podejmować działania, aby je poprawić. Im szybciej podejmiesz działania naprawcze, tym szybciej zaczniesz odreagowywać negatywne skutki. Na szczęście Google ułatwia również znajdowanie i poprawianie zduplikowanych treści w Twojej witrynie. Po zalogowaniu się do Narzędzi Google dla webmasterów przejdź do "Wygląd wyszukiwania", a następnie "Ulepszenia HTML". Umożliwi to wygenerowanie listy wszystkich stron, które Google wykryje jako duplikaty. Po uzyskaniu tej listy możesz zacząć eliminować duplikaty błędów jeden po drugim, korzystając z jednej z następujących metod:
- Wyeliminuj niepotrzebne powielanie. Pierwszy krok jest najłatwiejszy i najbardziej oczywisty, chociaż może być czasochłonny, jeśli masz kilka instancji. W każdej sytuacji, w której możesz przepisać fragment treści, aby rozwiązać duplikację, zrób to. Umieszczaj swoje pomysły w różnych słowach, używaj różnych narzędzi do kadrowania i nie bój się pisać od nowa.
- Płyty kotłowe . Long boilerplates or copyright notices should be removed from various pages and placed on a single page instead. In cases where you would have to call your readers' attention to boilerplate or copyright at the bottom of each of your pages or posts, insert a link to the single special page instead.
- Similar pages . There are cases when similar pages must be published, such as SEO for small and big businesses. Avoid publishing the same or similar information. Instead, expand on both services and make the information very specific to each business segment.
- Noindex . People could be syndicating your content. If there's no way to avoid this, include a note at the bottom of each page of your content that asks users to include a “noindex” metatag on your syndicated content to prevent the duplicate content from being indexed by the search engines.
- 301 redirects . Let the search engine spiders know that a page has permanently moved by using 301 redirects. This also alerts the search engines to remove the old URL from their index and replace it with the new address.
- Choosing only one URL . There might be several URLs you could use to point to your homepage, but you should choose only one. When choosing the best URL for your page, be sure to keep the users in mind. Make the URL user-friendly. This makes it easier not only for your users to find your page, but also for the search engines to index your site. Some duplicate content errors aren't due to actual duplicated content. They have to do with the URL structure that Google sees. For example, if you have one page that is associated with thisisyoursite.com/, thisisyoursite.com/?, and thisisyoursite.com/?sessionid=111, Google will see that page as repeating content three times. First, choose between www or non-www formatting and stick to that.
- Always create unique content . Affiliates almost always fall victim to the convenience of ready-made content provided by merchants. If you are an affiliate, be sure to create unique content for the merchant products you are promoting. Don't just copy and paste.
Wniosek
Let's do a brief recap. “Duplicate content” can refer to plagiarized material, copied content for the purposes of site inflation, but more importantly for the average user, pages that Google indexes twice. These duplicate forms of content are easy to track down with Google Webmaster Tools and fix with canonicalization adjustments or redirects, but if they go unnoticed, they can cumulatively bring your rankings down. Be proactive and scout for duplicate content at least once every few months—unless your site management process is flawless, it's probably that duplicate content will surface when you least expect it.
In the end, it all comes down to testing on a massive scale, getting solid data and making decisions based on that data. So here's what I'm going to do. I'm going to run a huge test and then update this post with my results. At the beginning of the post I mentioned that I am soon launching a massive Website with tons of unique content. I'm going to syndicate it all, completely unedited, as far and wide as I possibly can. As I do so, I'll monitor traffic sources to see what keywords people are using to find my content. Then, I'll replicate those keyword queries in Google and see where my site ranks in the search results. This should be the definitive test for the merits of syndication.
Thanks for sticking with me through this crazy post!
