Konten Duplikat: Panduan Utama untuk Menemukan & Memperbaiki Konten Duplikat untuk Peningkatan SEO

Diterbitkan: 2019-10-18

Konten duplikat buruk. Menggunakan konten yang sama, baik dalam bentuk total atau sebagian, di situs web Anda menyebabkan pengalaman pengguna yang buruk, dan memicu tanda bahaya di algoritme penelusuran Google. Di masa lalu SEO, duplikat konten sering digunakan sebagai trik murah untuk mendapatkan lebih banyak kata kunci dan lebih banyak konten di situs web Anda, jadi Google mengembangkan sistem untuk menyingkirkan spammer yang melanggar praktik terbaik dengan melakukan ini. Hari ini, jika Anda ketahuan menggunakan konten duplikat, otoritas domain Anda bisa menderita dan peringkat kata kunci Anda bisa turun.

Untungnya, Google cukup adil tentang masalah ini. Perusahaan memahami bahwa sebagian besar masalah duplikat konten tidak muncul sebagai upaya jahat untuk meningkatkan peringkat dengan murah. Pada kenyataannya, sebagian besar contoh konten duplikat adalah kecelakaan atau diabaikan oleh webmaster. Namun, memiliki terlalu banyak konten berulang di situs Anda dapat merusak, dan sebaiknya Anda menjalankan pengujian untuk melihat apakah ada duplikasi di situs Anda.

Daftar isi

pengantar

Sejak saya mulai basah kuyup dalam SEO, pertanyaan ini telah berputar-putar di forum dan blog. Di suatu tempat, seseorang di luar sana mengabadikan gagasan bahwa memiliki konten yang sama di halaman A situs web Anda dengan halaman B situs web Anda akan menyebabkan situs Anda dihukum di peringkat mesin pencari. Ide ini mulai meresap di komunitas pemasaran internet karena sekelompok spammer menyadari bahwa ketika mereka memiliki konten (yaitu, sebuah artikel) yang mendapatkan banyak lalu lintas pencarian, mereka dapat mengisi setiap halaman situs web mereka dengan konten yang sama untuk menarik lebih banyak lalu lintas dari mesin pencari. Jelas, artikel yang sama yang digandakan secara terang-terangan di ratusan halaman dalam satu domain adalah upaya jahat untuk mendapatkan lalu lintas mesin pencari tanpa benar-benar menambahkan nilai apa pun. Google dengan cepat menangkap metode ini dan memperbaiki algoritmenya untuk mendeteksi konten duplikat dan hanya menampilkan satu versi di peringkat pencarian. Situs web yang terlibat dalam aktivitas terang-terangan ini di-de-index dan mengaduk-aduk forum dan blog di seluruh komunitas pemasaran internet. Maka lahirlah ketakutan akan "hukuman konten duplikat."

Namun, dalam sebagian besar kasus, duplikat konten tidak berbahaya dan hanya merupakan produk dari CMS (sistem manajemen konten) mana pun yang menjalankan situs web tersebut. Misalnya, WordPress (CMS standar industri) secara otomatis membuat halaman "Kategori" dan "tag" yang mencantumkan semua posting blog dalam kategori atau tag tertentu. Ini membuat beberapa URL dalam domain yang berisi konten yang sama.

1) Google dapat memutuskan untuk membiarkan saya pergi dengan "peringatan" dan hanya memilih untuk tidak mengindeks 99 dari 100 posting duplikat saya, tetapi tetap salah satunya diindeks. CATATAN: Ini tidak berarti peringkat pencarian situs web saya akan terpengaruh dengan cara apa pun.

2) Google dapat memutuskan bahwa ini adalah upaya terang-terangan untuk mempermainkan sistem sehingga benar-benar menghapus indeks seluruh situs web saya dari semua hasil pencarian. Ini berarti, bahkan jika Anda mencari "Contoh.com" secara langsung, Google tidak akan menemukan hasil.

Jadi, salah satu dari dua skenario itu dijamin akan terjadi. Yang mana itu tergantung pada seberapa parah Google menentukan kesalahan Anda. Dengan kata-kata Google sendiri:

Konten duplikat di situs bukanlah alasan untuk melakukan tindakan di situs tersebut kecuali jika konten duplikat tampaknya dimaksudkan untuk menipu dan memanipulasi hasil mesin telusur. Jika situs Anda mengalami masalah duplikat konten, dan Anda tidak mengikuti saran yang tercantum di atas, kami melakukan pekerjaan yang baik untuk memilih versi konten yang akan ditampilkan di hasil pencarian kami.

Jenis duplikasi yang tidak berbahaya ini cukup umum, terutama karena banyak CMS yang tidak menangani ini dengan baik secara default. Jadi, ketika orang mengatakan bahwa memiliki jenis konten duplikat ini dapat memengaruhi situs Anda, itu bukan karena kemungkinan Anda akan dihukum; itu hanya karena cara kerja situs web dan mesin pencari.

Kebanyakan mesin pencari berusaha keras untuk tingkat variasi tertentu; mereka ingin menunjukkan kepada Anda sepuluh hasil berbeda pada halaman hasil pencarian, bukan sepuluh URL berbeda yang semuanya memiliki konten yang sama. Untuk tujuan ini, Google mencoba memfilter dokumen duplikat sehingga pengguna mengalami lebih sedikit redundansi.

Jadi, apa yang terjadi ketika crawler mesin pencari mendeteksi konten duplikat? (dari https://searchengineland.com/search-illustrated-how-a-search-engine-determines-duplicate-content-13980)

Bagaimana Google Menghukum Konten Duplikat

How Google Penalizes Duplicate Content

Google cukup terbuka tentang kebijakan duplikat kontennya. Menurut laporan mereka, jika Google menemukan dua versi berbeda dari halaman web yang sama, atau konten yang cukup mirip dengan konten di tempat lain, Google akan secara acak memilih versi "kanonik" untuk diindeks. Contoh yang mereka berikan adalah: bayangkan Anda memiliki halaman web standar dan versi ramah printer dari halaman web yang sama, lengkap dengan konten yang identik. Google akan memilih salah satu halaman ini secara acak untuk diindeks, dan sama sekali mengabaikan versi lainnya. Ini tidak menyiratkan apa pun tentang menderita penalti, tetapi demi kepentingan terbaik Anda untuk memastikan Google mengindeks dan mengatur situs Anda dengan benar.

Masalah sebenarnya datang ketika Google mencurigai konten Anda digandakan secara jahat atau manipulatif. Pada dasarnya, jika Google menganggap konten duplikat Anda adalah upaya untuk menipu algoritme peringkat mereka, Anda akan menghadapi tindakan hukuman. Adalah kepentingan terbaik Anda untuk menjernihkan kesalahan apa pun sebelumnya untuk mencegah nasib seperti itu bagi situs Anda.

Sindikasi: Konten Duplikat di Seluruh Domain

Terkadang, konten yang sama dapat muncul kata demi kata di URL yang berbeda. Beberapa contoh ini termasuk:

  • Artikel berita (pikirkan Associated Press)
  • Artikel yang sama dari direktori artikel diambil oleh Webmaster yang berbeda
  • Webmaster mengirimkan konten yang sama ke direktori artikel yang berbeda
  • Siaran pers didistribusikan di seluruh Web
  • Informasi produk dari produsen yang muncul di berbagai Situs Web e-niaga

Semua contoh ini dihasilkan dari sindikasi konten . Web penuh dengan konten sindikasi. Satu siaran pers dapat membuat konten duplikat di ribuan domain unik. Tetapi mesin pencari berusaha untuk memberikan pengalaman pengguna yang baik kepada pencari, dan memberikan halaman hasil yang terdiri dari bagian konten yang sama tidak akan membuat banyak orang senang. Jadi apa yang seharusnya dilakukan mesin pencari? Entah bagaimana, ia harus memutuskan lokasi konten mana yang paling relevan untuk ditampilkan kepada pencari. Jadi bagaimana melakukannya? Langsung dari G besar:

Saat menemukan konten duplikat seperti itu di situs yang berbeda, kami melihat berbagai sinyal untuk menentukan situs mana yang asli, yang biasanya bekerja dengan sangat baik. Ini juga berarti bahwa Anda tidak perlu terlalu khawatir melihat efek negatif pada kehadiran situs Anda di Google jika Anda melihat seseorang menggores konten Anda.

Yah, Google, saya mohon berbeda. Sayangnya, menurut saya Anda tidak pandai memutuskan situs mana yang merupakan pencetus konten. Begitu pula Michael Gray, yang mengeluhkan dalam posting blognya "Ketika Google Mendapat Duplikat Konten Salah" bahwa Google sering mengaitkan konten aslinya ke situs lain tempat ia mensindikasikan kontennya. Menurut Michael:

Namun masalahnya adalah dengan Google, algo peringkat mereka IMHO menempatkan terlalu banyak bias pada kepercayaan dan otoritas domain.

Dan saya setuju dengan Michael. Untuk sebagian besar karir pemasaran internet saya, saya telah mensindikasikan artikel lengkap ke berbagai direktori artikel untuk memperluas jangkauan konten saya sambil juga menggunakannya sebagai "bahan bakar SEO" untuk mendapatkan backlink topi putih ke situs web saya. Menurut Google, selama versi sindikasi Anda berisi tautan balik ke asli Anda, ini akan membantu kasus Anda ketika Google memutuskan bagian mana yang asli. Berikut buktinya:

Pertama, video yang menampilkan Matt Cutts, seorang blogger terkenal dan mantan insinyur algoritma mesin pencari untuk Google:

Diskusi tentang sindikasi dimulai sekitar 2:25. Pada 2:54 dia mengatakan Anda dapat memberi tahu orang-orang bahwa Anda adalah "penguasa konten" dengan memasukkan tautan dari karya sindikasi kembali ke karya asli Anda.

Lebih banyak bukti:

Jika Anda mensindikasikan konten Anda tetapi juga ingin memastikan situs Anda diidentifikasi sebagai sumber asli, sebaiknya minta mitra sindikasi Anda untuk menyertakan tautan kembali ke konten asli Anda.

Dan akhirnya:

Sindikasikan dengan hati-hati : Jika Anda mensindikasikan konten Anda di situs lain, Google akan selalu menampilkan versi yang menurut kami paling sesuai untuk pengguna dalam setiap penelusuran yang diberikan, yang mungkin atau mungkin bukan versi yang Anda inginkan. Namun, akan sangat membantu untuk memastikan bahwa setiap situs tempat konten Anda disindikasikan menyertakan tautan kembali ke artikel asli Anda. Anda juga dapat meminta mereka yang menggunakan materi sindikasi Anda untuk menggunakan tag meta noindex untuk mencegah mesin pencari mengindeks versi konten mereka.

Nah, yang menurut saya menarik dari kutipan terakhir dari Google ini adalah mereka sebenarnya mengakui bahwa konten yang mereka pilih mungkin tidak tepat. Dalam pengalaman saya, sangat mungkin untuk tidak memilih yang tepat jika situs yang menghasilkan konten relatif muda atau memiliki PageRank yang rendah. Jadi ini menimbulkan masalah besar berikutnya:

Bagaimana cara saya mendapatkan peringkat sebagai sumber asli untuk konten yang saya sindikasikan?

How do I get ranked as the original source for the content I syndicate?

Di kehidupan sebelumnya, saya mensindikasikan banyak artikel saya ke EzineArticles hanya untuk melihat Google mengkredit mereka dengan hasil pencarian yang lebih tinggi untuk konten saya, bahkan ketika saya memastikan sepenuhnya bahwa Google telah mengindeks konten saya di lokasi aslinya sebelum mengirimkannya ke Ezine. Vanessa Fox, yang sebelumnya bekerja di Google dan membangun Pusat Webmaster, mencoba menjawab pertanyaan ini dalam posting blognya, “Peringkat sebagai Sumber Asli untuk Konten yang Anda Sindikasikan.”

Sayangnya, dia menyimpulkan bahwa, pada dasarnya, tidak ada yang dapat Anda lakukan untuk memastikan bahwa Anda melakukannya. Dia menyarankan:

Buat versi konten yang berbeda untuk disindikasikan dari apa yang Anda tulis untuk situs Anda sendiri. Metode ini bekerja paling baik untuk hal-hal seperti umpan afiliasi produk. Saya tidak berpikir itu berfungsi dengan baik untuk hal-hal seperti posting blog atau jenis artikel lainnya. Sebagai gantinya, Anda dapat melakukan sesuatu seperti menulis artikel ringkasan tingkat tinggi untuk sindikasi dan posting blog dengan detail tentang topik itu untuk situs Anda sendiri.

Menulis ulang sebuah konten bukanlah definisi saya tentang sindikasi. Itu hanya menulis ulang artikel dengan kata-kata yang berbeda dan mendistribusikannya. Hampir semua informasi yang beredar di web telah diposting di tempat lain; bahkan posting blog ini terdiri dari banyak informasi yang saya temukan di tempat lain di internet. Jadi bagi saya, menulis artikel baru yang mengatakan hal yang sama dengan kata yang berbeda dan mendistribusikannya ke mitra sindikasi bukanlah sindikasi artikel asli. Ini sindikasi dari artikel yang berbeda. Jadi kita masih memiliki pertanyaan tentang hasil sindikasi konten yang sama persis yang sudah muncul di situs web Anda: apa efeknya? Bisakah itu membahayakan peringkat saya dengan cara apa pun ?

Bagi saya, ini adalah pertanyaan terpenting seputar konten duplikat. Sebelum saya masuk ke analisis itu, mari kita pertimbangkan pertanyaan mendasar yang penting.

Mengapa saya ingin mensindikasikan konten yang sama persis dari situs web saya di tempat lain?

Internet benar-benar beroperasi pada ekonomi sederhana memberi-dan-menerima. Dua komoditas yang dipertukarkan adalah unique content dan backlink . Konten Unik didefinisikan sebagai konten yang tidak diidentifikasi oleh Google sebagai duplikat. Ada berbagai teori tentang di mana tepatnya Google menarik garis untuk memutuskan apakah konten harus dianggap duplikat , tetapi satu angka yang saya dengar banyak dilontarkan adalah 30%. Pada dasarnya, menurut teori 30%, jika Google mengidentifikasi bahwa lebih dari 30% konten tertentu muncul di tempat lain di internet, itu akan dikategorikan sebagai duplikat. Sekarang, saya tidak bisa membuktikan keakuratan angka ini, jadi ambillah untuk apa nilainya. Ada juga berbagai perangkat lunak pendeteksi konten duplikat seperti CopyScape yang dirancang untuk membantu Webmaster memeriksa apakah konten mereka telah dicuri dan diduplikasi di domain lain. Ini juga merupakan alat yang baik untuk digunakan untuk menentukan apakah konten Anda kemungkinan akan dianggap duplikat oleh Google. Dan itulah yang benar-benar penting.

Tapi saya sudah sedikit keluar jalur, jadi mari kembali ke diskusi tentang mengapa Anda ingin mensindikasikan konten. Saya menyebutkan ekonomi internet dari backlink dan konten unik. Konten unik diinginkan karena akan diindeks oleh Google, memberikan Situs Web tertentu contoh lain dari "nama di topi" sehingga untuk berbicara. Pada dasarnya, semakin banyak konten yang diindeks situs web, semakin besar peluangnya untuk dikembalikan dalam hasil pencarian Google untuk kueri yang relevan.

Tapi bagaimana dengan backlink? Tautan balik hanyalah tautan dari situs web lain ke situs Anda sendiri. Mesin pencari menganggapnya sebagai "suara" ketika satu situs web menautkan ke situs lainnya. Vote ini digunakan untuk menentukan otoritas & relevansi dalam hasil pencarian Google. Faktanya, diperkirakan bahwa backlink adalah satu-satunya faktor terpenting dalam menentukan bagaimana peringkat situs web Anda untuk kueri tertentu. Ada banyak faktor yang berperan dalam backlink dan berapa banyak "suara" mereka diperhitungkan, tetapi saya akan membahasnya di posting blog mendatang. Untuk saat ini, yang perlu Anda ketahui adalah bahwa backlink berharga karena mereka meningkatkan peringkat Anda di mesin pencari, dan itu berarti lebih banyak lalu lintas ke situs web Anda.

Oke, jadi sekarang kita telah membahas komoditas dasar ekonomi mikro Web. Ini penting karena ketika Anda mensindikasikan konten Anda, dengan asumsi Anda telah menyertakan tautan balik di dalamnya yang menautkan kembali ke sumber asli Anda, Anda mendapatkan tautan balik dari setiap situs web tempat konten Anda disindikasikan. Mengagumkan, bukan?

Mungkin tidak. Pertanyaan pertama adalah seberapa tinggi Google menghargai backlink dari konten yang dikenal sebagai konten duplikat. Terus terang, saya tidak tahu. Di satu sisi, mudah untuk mensindikasikan konten ke sekelompok blog yang menerima secara otomatis jika satu-satunya tujuan Anda adalah mendapatkan backlink, dan ini tidak mengatakan apa pun tentang kualitas konten Anda atau berapa banyak pembuat konten yang harus dihargai. Di sisi lain, sindikasi juga bisa menjadi indikator kualitas konten tertentu. Lagi pula, mengapa begitu banyak sindikasi jika itu tidak benar-benar hebat?

Pada akhirnya, Google mungkin memiliki sinyal untuk menjawab dua pertanyaan ini, tetapi jawaban sebenarnya mungkin hanya diketahui oleh para insinyur perangkat lunak yang mengkodekan algoritme. Banyak orang mencoba untuk meningkatkan nilai konten sindikasi mereka dengan terlibat dalam konten "berputar" yang benar-benar sah selama itu bukan sampah yang sering disemburkan oleh perangkat lunak otomatis. Saya akan membahas lebih dalam tentang pemintalan konten di posting selanjutnya. Untuk saat ini, kami masih mencoba menjawab pertanyaan apakah mensindikasikan konten persis seperti yang muncul di situs web Anda adalah ide yang bagus atau ide yang buruk. Setelah pengujian yang cermat, saya sampai pada kesimpulan berikut:

.

…….

*drumroll*

……

*drumroll lagi*

…..

Mungkin.

Saya tahu saya tahu. Itu bukan jawaban yang Anda inginkan. Izinkan saya untuk menjelaskan.

Saya memiliki lebih dari 50 domain, dan saya suka melakukan banyak pengujian di seluruh domain tersebut. Saya menghabiskan beberapa jam tadi malam melakukan pencarian untuk konten saya yang telah saya sindikasikan ke berbagai blog dan direktori lain. Dan apa yang saya temukan mengecewakan sekaligus membesarkan hati.

Bagian yang mengecewakan adalah, dalam banyak kasus, konten sindikasi saya mengungguli konten asli saya sendiri. Bahkan jika sebuah situs berperingkat lebih tinggi dari milik saya untuk konten saya sendiri memiliki tautan balik ke situs saya, pencetus konten, itu seperti Google sepenuhnya mengabaikan tautan balik itu dan masih memberikan lebih banyak kredit ke situs lain. Dalam beberapa kasus, versi konten situs saya sendiri tidak dapat ditemukan, jelas-jelas jatuh ke dalam kluster URL duplikat Google dan disaring dari hasil pencarian. Ini berarti bahwa dengan mensindikasikan konten saya, sebenarnya saya membuat konten saya sendiri di-de-index.

Ini adalah skenario terburuk yang mungkin terjadi, tetapi itu terjadi. Kadang-kadang, setidaknya. Dan itulah bagian yang aneh; terkadang, konten saya diakui sebagai konten asli dan mendapat peringkat tertinggi. Dengan situs dan konten lain, situs ini menempati peringkat kedua di belakang situs otoritas tinggi, biasanya EzineArticles. Jadi saya harus menyimpulkan sebagai berikut:

Saat Anda mensindikasikan konten Anda, itu mungkin:

  • Menyebabkan sumber konten asli Anda sendiri (yaitu, situs web Anda), pada dasarnya, tidak diindeks untuk konten tersebut
  • Menyebabkan situs Anda mendapat peringkat tinggi untuk kueri yang relevan dengan konten Anda, tetapi bukan yang tertinggi
  • Menyebabkan situs Anda mendapat peringkat tertinggi untuk konten Anda

Nah, itu cukup banyak mencakup semua dasar, bukan? Ini semua hasil yang saya amati ketika melihat situs saya sendiri dan hasil sindikasi artikel yang berasal dari situs tersebut. Pada dasarnya, saya dapat menyimpulkan bahwa Google tidak selalu melakukannya dengan benar. Dan, Google tidak suka melakukan apa pun dengan konsistensi apa pun. Hal terakhir yang mereka inginkan adalah agar kami para SEO mengetahui algoritme mereka sepenuhnya, karena begitu itu terjadi, integritas hasil pencarian mereka akan hancur saat orang-orang memanipulasi mereka semua.

Bagian yang menggembirakan adalah ketika saya menemukan bahwa backlink dari konten sindikasi pasti membantu peringkat situs saya untuk kata kunci target saya. Jadi pasti ada setidaknya beberapa nilai backlink yang berasal dari konten yang diberi label oleh Google sebagai “duplikat.”

Jadi, pertanyaannya tetap: Haruskah saya mensindikasikan konten saya?

Mari kita lihat manfaat melakukannya:

Manfaat mensindikasikan konten Anda

  • Dapatkan backlink dari banyak situs
  • Perluas jangkauan dan kesadaran merek Anda ke situs dengan perdagangan tinggi
  • Dapatkan lalu lintas langsung melalui rujukan dari tautan balik di konten sindikasi Anda
  • Cara mendapatkan backlink yang jauh lebih murah daripada menulis konten baru (atau menulis ulang konten yang sudah ada) untuk distribusi/sindikasi

Kelemahan sindikasi konten Anda

  • Situs yang Anda sindikasikan mungkin benar-benar mengungguli Anda untuk konten Anda sendiri jika mereka memiliki otoritas lebih tinggi daripada situs Anda sendiri, bahkan jika Anda mengikuti saran Google dan menyertakan tautan balik ke sumber konten asli
  • Google mungkin mengelompokkan URL tempat konten Anda berada dengan sisa duplikat, menyembunyikannya dari halaman hasil mesin pencari (secara efektif menghapus indeksnya)

Jadi, sindikasi konten Anda berisiko. Anda pasti bisa mendapatkan yang terbaik dari kedua dunia jika Google memutuskan situs Anda adalah pencetus konten , sehingga memberi penghargaan pada konten Anda dengan posisi teratas dalam hasil pencarian dan juga mendapatkan semua backlink menarik yang berperan dalam peringkat keseluruhan Anda untuk kata kunci tertentu. Tetapi jika Google salah (dan memang, cukup sering, bertentangan dengan apa yang mungkin mereka pikirkan), Anda berisiko membuat konten Anda tidak pernah diberi peringkat untuk kueri mesin pencari yang relevan.

Dan ini benar-benar membuat saya khawatir, karena saya selalu berpendapat bahwa tidak ada yang bisa dilakukan orang lain untuk merusak peringkat situs web tertentu. Setelah menganalisis hasil ini, saya khawatir saya telah menemukan celah dalam argumen saya sendiri; jika orang lain mengunjungi situs web saya, menyalin semua konten saya, dan mensindikasikannya di seluruh Web, mungkin saja situs tempat konten saya disindikasikan akan benar-benar berperingkat lebih tinggi daripada situs saya sendiri. Google mencoba mengatasi masalah ini di sini dan juga di video Matt Cutts:

Dalam kebanyakan kasus, webmaster tidak memiliki pengaruh terhadap pihak ketiga yang mengikis dan mendistribusikan ulang konten tanpa persetujuan webmaster. Kami menyadari bahwa ini bukan kesalahan webmaster yang terpengaruh, yang berarti bahwa konten identik yang muncul di beberapa situs itu sendiri tidak dianggap sebagai pelanggaran terhadap pedoman webmaster kami. Ini hanya mengarah ke proses lebih lanjut dengan maksud untuk menentukan sumber asli konten—sesuatu yang cukup baik bagi Google, karena dalam kebanyakan kasus, konten asli dapat diidentifikasi dengan benar, sehingga tidak ada efek negatif bagi situs yang membuat konten tersebut.

Sekali lagi, sayangnya saya harus menunjukkan bahwa dalam pengalaman saya sendiri, berulang kali, saya telah melihat peringkat konten saya sendiri lebih buruk daripada situs yang disindikasikan. Jadi, meskipun Google menganggapnya bagus dalam mengidentifikasi sumber asli konten, data saya menyarankan sebaliknya. Pada waktunya, kami hanya dapat berharap bahwa Google meningkatkan aspek algoritme ini; tentu tidak ada lagi yang bisa kita lakukan sebagai Webmaster. Sebagai gantinya, Anda hanya perlu memahami manfaat dan kerugian sindikasi dan memutuskan apakah Anda merasa nyaman dengan mengambil risiko jika Google salah mengidentifikasi kepemilikan konten Anda.

Berikut adalah beberapa tips untuk meminimalkan risiko Google melakukan kesalahan (secara teori):

  • Selalu posting konten baru ke situs web Anda sendiri dan kemudian tunggu untuk mensindikasikannya di tempat lain sampai Google merayapi dan mengindeks konten Anda. Anda dapat memeriksa untuk melihat apakah halaman tertentu telah diindeks dengan melakukan kueri penelusuran dari URL persis Anda, dalam tanda kutip. Jika pencarian mengembalikan hasil yang benar (yaitu, bukan hasil nol) maka itu telah diindeks. Trik rapi lainnya yang dapat Anda coba adalah memilih 11-12 kata secara acak dari konten Anda dan mencari string itu, sekali lagi dalam tanda kutip. Anda tidak akan menyangka, tetapi kemungkinan 10-12 kata dalam urutan tertentu akan muncul di tempat lain di Web sangat kecil. Coba sekarang — salin dan tempel kalimat acak dari paragraf ini ke Google, beri tanda kutip, dan lihat berapa banyak hasil yang Anda dapatkan. Anda mungkin hanya akan menemukan URL ini sebagai hasilnya, kecuali artikel ini telah disindikasikan (ini juga merupakan cara yang bagus untuk memeriksa situs mana yang mengambil konten Anda saat Anda mensindikasikannya).
  • Selalu sertakan backlink dalam versi sindikasi Anda ke URL sumber konten asli. Google mengatakan ini adalah cara untuk melakukannya dengan benar, tetapi itu masih bukan hal yang pasti. Meskipun demikian, itu pasti tidak ada salahnya.

Bagaimana dengan menerima saran Vanessa dan menulis ulang konten Anda sebelum mensindikasikannya?

Ini pasti akan memecahkan masalah kemungkinan mendapatkan konten Anda sendiri yang pada dasarnya tidak diindeks ketika Google salah mengaitkan kepemilikan konten, tetapi ada beberapa masalah besar juga:

  • Ini benar-benar mahal jika Anda memiliki banyak konten. Pikirkan tentang berapa banyak waktu yang Anda perlukan untuk menulis ulang setiap artikel yang Anda miliki. Postingan ini saja sudah lebih dari 6.000 kata dan saya butuh berjam-jam untuk mengetik! Anda dapat mengalihdayakan penulisan ulang ke layanan seperti Human Rewriter tetapi itu akan dikenakan biaya sekitar $ 4 per 500 kata (kurang dari biaya SEO & pembuatan tautan), tetapi biayanya kemungkinan berlebihan. Itu bisa menjadi sangat mahal jika Anda memiliki banyak konten.
  • Anda masih mendistribusikan konten yang bertema topikal di sekitar kata kunci yang sama dengan konten asli Anda, jadi tidak berlebihan untuk berpikir bahwa konten yang ditulis ulang masih akan mengungguli konten asli Anda untuk permintaan pencarian yang relevan, terutama di situs otoritas tinggi seperti EzineArticles.

Konten Duplikat Pada Domain yang Sama

Kata terakhirnya adalah, kecuali Anda benar - benar secara terang - terangan menduplikasi konten Anda di banyak URL dalam domain yang sama, tidak ada yang perlu dikhawatirkan. Salah satu URL tempat konten duplikat berada akan diindeks dan dipilih sebagai "perwakilan" dari kluster URL tersebut. Saat pengguna melakukan kueri penelusuran di mesin telusur, konten tertentu akan ditampilkan sebagai hasil kueri yang relevan, dan URL lain di kluster penipuan tidak akan ditampilkan. Sederhana seperti itu.

Namun, sisi lain dari koin adalah konten duplikat di berbagai domain . Dan itu monster yang sama sekali berbeda. Siap untuk mengatasinya? Ini dia.

“Konten Duplikat” Tradisional

Traditional “Duplicate Content”

Konten duplikat tradisional adalah jenis konten yang muncul di benak Anda secara intuitif saat Anda mendengar frasa tersebut. Ini adalah konten yang identik dengan, atau sangat mirip dengan, konten yang ada di tempat lain di web (biasanya di situs Anda sendiri). Ada beberapa alasan mengapa situs sengaja menduplikasi konten ini:

  • Mereproduksi konten lama untuk membuat situs Anda tampak lebih diperbarui.
  • Menyalin materi berulang kali untuk menambahkan lebih banyak halaman ke situs Anda.
  • Menjiplak materi untuk dianggap sebagai milik Anda sendiri.

Semua situasi ini menipu, terkadang bagi pengguna dan terkadang bagi Google, dan sebagian besar, webmaster tahu untuk menjauhi praktik ini. Jika Anda terlibat di dalamnya, Anda mungkin pantas mendapatkan hukuman.

Konten Duplikat Licik

Saya menyebutnya konten duplikat "licik" karena betapa mudahnya hal itu dapat menyelinap pada Anda. Anda tidak berniat membuat halaman duplikat, tetapi hal itu tetap bisa terjadi. Biasanya, ini disebabkan oleh gangguan teknis atau reproduksi yang tidak disengaja; Misalnya:

  • Jika Anda memiliki dua versi situs web Anda untuk https:// dan https://, Google dapat mengindeks kedua versi setiap halaman secara terpisah, lalu menandai halaman tersebut sebagai contoh konten duplikat.
  • Jika Anda memiliki versi halaman web yang “ramah printer”, halaman tersebut akan ditampilkan sebagai URL terpisah dengan konten yang sama.
  • Bentuk halaman web yang lengkap dan dimodifikasi untuk seluler, seperti bagian forum.

Sayangnya, sebagian besar contoh ini dapat muncul secara alami saat Anda membangun dan memodifikasi situs web Anda, kecuali jika Anda secara khusus mengambil tindakan pencegahan untuk menghentikannya.

“Tapi Saya Tidak Menyalin Konten Saya”

Reaksi pertama Anda terhadap evaluasi ini mungkin berupa pemecatan. Anda tidak menyalin konten Anda dari satu halaman ke halaman lain. Anda sangat berhati-hati untuk memastikan setiap halaman situs Anda aslinya ditulis, tanpa frasa atau bagian yang digandakan.

Sayangnya, masih ada risiko untuk Anda. Apa yang didaftarkan Google sebagai "konten duplikat" tidak selalu dilihat oleh pengguna sebagai konten duplikat. Pengguna yang menjelajahi halaman Anda mungkin tidak akan pernah menemukan frasa berulang, tetapi Google mungkin merayapi situs Anda dan menemukan lusinan pengulangan di tag judul Anda, atau Anda mungkin memiliki beberapa URL non-kanonisasi yang menghosting konten di halaman yang sama. Bahkan jika Anda merasa yakin bahwa Anda tidak secara langsung memengaruhi beberapa bentuk konten duplikat, ada baiknya memeriksa situs Anda untuk memastikannya.

Cara Menemukan (dan Membersihkan) Konten Duplikat

How to Find (and Clean) Duplicate Content

Memperbaiki konten duplikat relatif mudah. Menemukannya adalah bagian yang sulit. Seperti yang saya sebutkan di atas, konten duplikat bisa sulit dideteksi—hanya karena Anda tidak memiliki konten berulang dari perspektif pengalaman pengguna, bukan berarti Anda tidak memiliki konten berulang dari perspektif algoritme penelusuran.

Langkah pertama Anda adalah langkah manual; buka situs Anda dan lihat apakah ada pengulangan konten yang jelas. Sebagai contoh, apakah Anda memiliki paragraf identik yang menyimpulkan setiap halaman layanan Anda? Tulis ulang. Apakah Anda menggunakan kembali bagian dari posting blog sebelumnya di posting baru? Buat perbedaan. Setelah Anda menyelesaikan pemindaian manual awal ini, ada dua alat utama yang dapat Anda gunakan untuk menemukan lebih banyak, contoh tersembunyi yang lebih baik dari konten duplikat.

Lakukan Pencarian Anda Sendiri

Pertama, Anda dapat melakukan pencarian untuk melihat melalui mata Google. Gunakan tag Site: untuk membatasi pencarian Anda ke situs Anda saja, dan tindak lanjuti dengan tag intitle: untuk mencari frasa tertentu. Seharusnya terlihat sedikit seperti ini:

Situs: thisisyoursite.comintitle:”thisisyourtargetphrase”

Pencarian ini akan menghasilkan semua hasil di situs Anda yang berkorelasi dengan frasa pilihan Anda. Jika Anda melihat beberapa hasil yang identik, Anda tahu bahwa Anda memiliki masalah konten duplikat.

Periksa Alat Webmaster

Cara yang lebih sederhana untuk memeriksa konten duplikat adalah dengan menggunakan Alat Webmaster Google untuk merayapi situs Anda dan melaporkan kembali kesalahan apa pun. Setelah Anda membuat dan memverifikasi akun Alat Webmaster Anda, buka tab Tampilan Pencarian dan klik “Peningkatan HTML.” Di sini, Anda dapat melihat dan mengunduh daftar deskripsi meta duplikat dan tag judul. Ini adalah masalah umum dan mudah diperbaiki yang hanya membutuhkan sedikit waktu untuk menulis ulang.

Untuk menentukan apakah sampel duplikat konten akan menurunkan peringkat Anda, pertama-tama Anda harus menentukan mengapa Anda akan mempublikasikan konten tersebut di tempat pertama.

Semuanya bermuara pada tujuan Anda.

Jika tujuan Anda adalah mencoba merusak sistem dengan menggunakan konten yang telah diterbitkan di tempat lain, Anda pasti akan dikenakan sanksi. Tujuannya jelas menipu dan dimaksudkan untuk memanipulasi hasil pencarian.

Inilah yang dikatakan Google tentang perilaku semacam ini:

Konten duplikat di situs bukanlah alasan untuk melakukan tindakan di situs tersebut kecuali jika konten duplikat tampaknya dimaksudkan untuk menipu dan memanipulasi hasil mesin telusur.

Copyscape

Copyscape

Untuk 5 sen per pencarian, Anda dapat meminta Copyscape memeriksa seluruh bagian untuk Anda. Tetapi jika anggaran Anda tidak memungkinkan pengeluaran semacam itu, Anda masih dapat menggunakan Copyscape secara gratis. Tangkapan dengan Copyscape gratis adalah Anda harus mempublikasikan konten online terlebih dahulu untuk mengambil URL-nya.

Salin dan tempel URL konten Anda yang baru diterbitkan di kotak pencarian Copyscape. Apa yang dilakukan Copyscape adalah memindai seluruh jalinan untuk setiap salinan konten yang baru saja Anda terbitkan.

Copyscape adalah alat andal yang sangat bergantung pada banyak penerbit untuk memeriksa kualitas dan orisinalitas. Ada alat lain yang sangat mirip dengan Copyscape yang dapat Anda gunakan untuk tujuan yang sama, seperti Plagiarism Detect dan InterNIC.

Memeriksa konten duplikat cukup mudah dan sederhana. Ini adalah tugas SEO yang sangat diperlukan untuk pemula, tetapi tidak ada yang harus menerima begitu saja. Dengan seperangkat alat yang tepat, Anda dapat dengan nyaman memastikan bahwa konten Anda unik dengan baik sebelum Anda mempublikasikannya secara online.

Dan dengan memberikan pembaca Anda konten berkualitas tinggi dan unik, Anda akan mendapatkan nilai yang luar biasa.

Cara Membersihkan Konten Duplikat

Setelah Anda mengidentifikasi area kritis duplikasi di situs Anda, Anda dapat mulai mengambil tindakan untuk memperbaikinya. Semakin cepat Anda mengambil tindakan korektif, semakin cepat Anda akan mulai pulih dari efek negatif. Untungnya, Google juga memudahkan Anda menemukan dan memperbaiki duplikat konten di situs Anda. Saat Anda masuk ke Alat Webmaster Google, buka "Penampilan Pencarian," dan kemudian "Peningkatan HTML." Ini akan memungkinkan Anda membuat daftar halaman apa pun yang dideteksi Google sebagai duplikat. Setelah Anda memiliki daftar ini, Anda dapat mulai menghilangkan kesalahan duplikat satu per satu dengan salah satu metode berikut:

  • Hilangkan Duplikasi yang Tidak Perlu. Langkah pertama adalah yang paling mudah dan paling jelas, meskipun bisa memakan waktu jika Anda memiliki beberapa contoh. Dalam situasi apa pun di mana Anda dapat menulis ulang suatu konten untuk mengatasi duplikasi, lakukanlah. Masukkan ide Anda ke dalam kata-kata yang berbeda, gunakan perangkat pembingkaian yang berbeda, dan jangan takut untuk menulis ulang dari awal.
  • Boilerplate . Long boilerplates or copyright notices should be removed from various pages and placed on a single page instead. In cases where you would have to call your readers' attention to boilerplate or copyright at the bottom of each of your pages or posts, insert a link to the single special page instead.
  • Similar pages . There are cases when similar pages must be published, such as SEO for small and big businesses. Avoid publishing the same or similar information. Instead, expand on both services and make the information very specific to each business segment.
  • Noindex . People could be syndicating your content. If there's no way to avoid this, include a note at the bottom of each page of your content that asks users to include a “noindex” metatag on your syndicated content to prevent the duplicate content from being indexed by the search engines.
  • 301 redirects . Let the search engine spiders know that a page has permanently moved by using 301 redirects. This also alerts the search engines to remove the old URL from their index and replace it with the new address.
  • Choosing only one URL . There might be several URLs you could use to point to your homepage, but you should choose only one. When choosing the best URL for your page, be sure to keep the users in mind. Make the URL user-friendly. This makes it easier not only for your users to find your page, but also for the search engines to index your site. Some duplicate content errors aren't due to actual duplicated content. They have to do with the URL structure that Google sees. For example, if you have one page that is associated with thisisyoursite.com/, thisisyoursite.com/?, and thisisyoursite.com/?sessionid=111, Google will see that page as repeating content three times. First, choose between www or non-www formatting and stick to that.
  • Always create unique content . Affiliates almost always fall victim to the convenience of ready-made content provided by merchants. If you are an affiliate, be sure to create unique content for the merchant products you are promoting. Don't just copy and paste.

Kesimpulan

Let's do a brief recap. “Duplicate content” can refer to plagiarized material, copied content for the purposes of site inflation, but more importantly for the average user, pages that Google indexes twice. These duplicate forms of content are easy to track down with Google Webmaster Tools and fix with canonicalization adjustments or redirects, but if they go unnoticed, they can cumulatively bring your rankings down. Be proactive and scout for duplicate content at least once every few months—unless your site management process is flawless, it's probably that duplicate content will surface when you least expect it.

In the end, it all comes down to testing on a massive scale, getting solid data and making decisions based on that data. So here's what I'm going to do. I'm going to run a huge test and then update this post with my results. At the beginning of the post I mentioned that I am soon launching a massive Website with tons of unique content. I'm going to syndicate it all, completely unedited, as far and wide as I possibly can. As I do so, I'll monitor traffic sources to see what keywords people are using to find my content. Then, I'll replicate those keyword queries in Google and see where my site ranks in the search results. This should be the definitive test for the merits of syndication.

Thanks for sticking with me through this crazy post!