Bagaimana Menghindari Masalah Duplikat Konten untuk Google?

Diterbitkan: 2021-11-01

Konten duplikat pada halaman memiliki banyak kesamaan dengan kelebihan anggaran. Hanya dalam kasus ini, kita berbicara tentang penurunan "Anggaran Kepercayaan" di situs robot pencari. Masalah ini menyangkut banyak pemilik situs, karena dapat muncul bahkan di belakang mereka. Setelah membaca sesuatu tentang masalah duplikat konten, situs Anda berubah menjadi bom waktu. Centang Tok pada jam dan sanksi Google menunggu Anda.

Sedih tapi benar, ada sekitar 25-30% konten duplikat di Web. Mantan Karyawan Google Matt Cutts memiliki pandangan ini. Meskipun duplikat konten dapat membawa Anda ke dunia yang bermasalah dengan optimasi mesin pencari, itu tidak terlalu dramatis. Ada solusinya — baca artikel ini dan ketahui cara menghindari masalah duplikat konten untuk Google.

Daftar Isi menunjukkan
  • Apa itu konten duplikat?
  • Fakta tentang duplikat konten
  • Apa jenis konten yang ada?
  • Apa itu KODE?
    • halaman HTTPS
    • Sistem manajemen konten membuat konten duplikat
    • Halaman untuk pencetakan atau beberapa opsi penyortiran
    • Konten duplikat di blog dan sistem pengarsipan
    • Konten duplikat yang dibuat pengguna (postingan berulang, dll.)
  • Kesimpulan

Apa itu konten duplikat?

konten-pemasaran-meja-laptop-catatan-kerja-menulis-artikel-blog
Ada 3 jenis utama konten duplikat.
  • Duplikat persis: Dua URL memiliki konten yang benar-benar identik;
  • Konten dengan sedikit perbedaan: Seperti urutan kalimat, sedikit gambar yang berbeda, dll;
  • Duplikat lintas-domain: Salinan yang sama persis atau sedikit diubah ada di banyak domain.

Selain itu, ada dua konsep terkait yang tidak dianggap oleh Google sebagai konten duplikat. Tetapi penerbit dan spesialis SEO yang tidak begitu berpengalaman dapat dengan mudah mencampurnya dengan konten duplikat.

  • Konten tipis: Ini adalah halaman dengan konten yang sangat sedikit. Kumpulan halaman yang dibuat berdasarkan daftar alamat organisasi, yang memiliki 6.000 alamat, tetapi setiap halaman hanya berisi satu alamat: hanya beberapa baris.
  • Konten irisan: Halaman yang sedikit berbeda satu sama lain. Situs ini menjual sepatu Timberland dengan ukuran 38, 38.5, 39, 40, 41, 42, dll. Jika situs memiliki halaman terpisah untuk setiap ukuran sepatu, akan ada sedikit perbedaan di antara semua halaman tersebut. Efek seperti itu yang dirasakan Google sebagai konten irisan.

Google tidak menyukai konten yang tipis dan teriris. Semua efek ini dapat dideteksi oleh Google Panda. Itulah mengapa penerbit harus menghindari membuat jenis halaman ini.

Konten duplikat dapat terjadi karena sejumlah alasan:
  • lisensi konten situs Anda;
  • cacat dalam arsitektur situs karena sistem manajemen konten tidak dioptimalkan untuk mesin pencari;
  • adanya plagiarisme.

Selama lima tahun terakhir, para pelaku spam, dengan kebutuhan konten yang luar biasa, telah mulai "mencuri" konten dari sumber yang sah, mengubah kata-kata dengan menggunakan berbagai proses yang rumit dan menempatkan teks yang dihasilkan pada halaman mereka untuk menarik operasi pencarian "ekor panjang". dan menunjukkan iklan kontekstual dan tujuan tidak jujur ​​lainnya. Jadi, saat ini orang hidup di dunia "masalah konten duplikat" dan "hukuman konten duplikat".

Direkomendasikan untuk Anda: 5 Cara Konten Bagus Dapat Mempercepat Upaya Pemasaran Anda.

Fakta tentang duplikat konten

pertanyaan-jawaban-faq-permintaan-bantuan
Lokasi konten duplikat

Jika semua konten tertentu ada di situs Anda, apakah itu duplikat konten?

Ya, karena duplikat konten bisa terjadi baik di situs yang sama maupun di situs yang berbeda.

Persentase konten duplikat

Berapa persentase halaman yang harus diduplikasi agar termasuk dalam filter konten duplikat? Sayangnya, mesin pencari tidak pernah mempublikasikan informasi ini karena akan mempengaruhi kemampuan mereka untuk mencegah masalah itu sendiri. Persentase ini terus berubah untuk semua mesin. Intinya adalah bahwa halaman tidak harus identik untuk dianggap duplikat.

Rasio kode ke teks

Bagaimana jika kode Anda sangat besar, tetapi ada beberapa elemen HTML unik di halaman? Tidakkah Google akan berpikir bahwa semua halaman adalah duplikat satu sama lain?

Tidak. Mesin pencari tidak peduli dengan kode Anda, tetapi tentang konten halaman Anda. Ukuran kode hanya menjadi masalah ketika tumbuh di luar proporsi.

Elemen navigasi dengan rasio konten unik

Semua halaman di situs Anda memiliki bilah navigasi yang besar, banyak header, dan footer, tetapi kontennya sangat sedikit. Tidakkah Google akan menganggap semua halaman ini sebagai duplikat?

Tidak. Google mempertimbangkan elemen navigasi bahkan sebelum mengevaluasi halaman untuk duplikasi.

Konten berlisensi

Anda ingin menghindari masalah duplikat konten. Tetapi apa yang harus dilakukan jika Anda memiliki konten dari sumber web lain yang Anda izinkan untuk ditampilkan kepada pengunjung Anda?

Gunakan meta name = "robots" content="noindex, follow". Letakkan di header halaman Anda, dan mesin pencari akan tahu bahwa konten ini bukan untuk mereka. Pilihan lainnya adalah mendapatkan hak eksklusif untuk memiliki dan mempublikasikan konten tersebut.

Apa jenis konten yang ada?

komputer-laptop-meja-kerja-kantor-konten-tulisan-catatan-riset
  • Konten unik ditulis oleh seseorang. Ini benar-benar berbeda dari kombinasi huruf, simbol, dan kata lainnya di web dan tidak terpengaruh oleh algoritma pemrosesan teks komputer.
  • Fragmen adalah bagian kecil dari konten (misalnya, kutipan) yang disalin dan digunakan berulang kali. Mereka jarang menimbulkan masalah bagi mesin pencari, terutama ketika dimasukkan dalam dokumen yang lebih besar dengan banyak konten unik.
  • Herpes zoster. Mesin pencari mencari segmen frase yang relatif kecil (lima sampai enam kata) di halaman web lain. Jika dua dokumen memiliki terlalu banyak sirap, mesin pencari dapat menafsirkan dokumen tersebut sebagai konten duplikat.

Apa itu KODE?

kode pemrograman pengembangan web

Ada banyak cara untuk membuat konten duplikat. Ini menjelaskan mengapa ada lebih dari cukup di web. Konten duplikat internal membutuhkan taktik khusus untuk mendapatkan hasil terbaik dalam hal pengoptimalan. Sejujurnya, halaman duplikat adalah halaman yang tidak bernilai bagi pengguna dan mesin pencari. Kemudian cobalah untuk menghindari masalah ini sepenuhnya. Pastikan hanya satu URL yang merujuk ke setiap halaman. Selanjutnya, lakukan redirect 301 untuk URL lama ke URL yang tersisa. Ini membantu robot pencari untuk melihat perubahan yang Anda buat secepat mungkin dan menyimpan "jus tautan" yang dimiliki halaman yang dihapus.

Jika ini tidak memungkinkan, ada banyak pilihan lain. Berikut adalah ikhtisar solusi termudah untuk berbagai skenario:

  • Anda dapat menggunakan file robots.txt untuk memblokir spider mesin telusur agar tidak merayapi versi duplikat halaman situs Anda;
  • gunakan elemen rel="canonical", yang merupakan solusi terbaik kedua untuk menghapus halaman duplikat;
  • gunakan CODE <meta name=”robots” content=”noindex”> untuk menginstruksikan mesin SEARCH agar tidak menampilkan halaman duplikat.

Namun, perhatikan: jika Anda menggunakan robots.txt untuk mencegah tampilan halaman, menerapkan noindex atau nofollow pada halaman tidak masuk akal. Karena laba-laba tidak dapat membaca halaman, ia tidak akan pernah melihat meta-tag noindex atau nofollow. Dengan mengingat alat-alat ini, pertimbangkan beberapa situasi khusus dari konten duplikat.

Anda mungkin menyukai: Mengapa Penulisan Konten Penting untuk Merek dan Bisnis?

halaman HTTPS

Jika Anda menggunakan protokol SSL (pertukaran data terenkripsi antara browser dan server web, yang sering digunakan untuk e-niaga), maka situs Anda memiliki laman yang dimulai dengan HTTPS: (bukan HTTP:). Masalahnya muncul ketika tautan di halaman HTTPS Anda mengarah ke halaman lain di situs menggunakan tautan relatif daripada absolut. Misalnya, tautan ke beranda Anda menjadi https://www.DomainAnda.com, bukan http://www.DomainAnda.com).

Jika situs Anda mengalami masalah ini, Anda dapat menggunakan pengalihan rel="canonical" atau 301 untuk memperbaikinya. Solusi alternatif adalah mengubah tautan menjadi absolut: http://www.DomainAnda.com/content.html alih-alih /contenthtml), yang juga membuat hidup sedikit lebih sulit bagi mereka yang mencuri konten Anda.

Sistem manajemen konten membuat konten duplikat

Terkadang sebuah situs dapat memiliki banyak versi halaman yang identik. Itu terjadi pada batasan di beberapa sistem manajemen konten yang merujuk ke konten yang sama dengan lebih dari satu URL. Ini biasanya merupakan duplikasi ekstra yang tidak bernilai bagi pengguna. Keputusan terbaik adalah menghapus halaman duplikat dan melakukan pengalihan 301 untuk halaman yang dihapus ke halaman yang tersisa. Jika tidak berhasil, coba metode lain.

Halaman untuk pencetakan atau beberapa opsi penyortiran

Banyak situs menawarkan halaman untuk pencetakan yang memberi pengguna konten yang sama dalam format yang disesuaikan dengan printer. Beberapa situs e-commerce menyediakan daftar produk mereka dengan beberapa penyortiran (berdasarkan ukuran, warna, merek, dan harga). Halaman-halaman ini bernilai bagi pengguna tetapi tidak bernilai bagi mesin pencari. Oleh karena itu, mereka berpikir bahwa itu adalah duplikat konten. Dalam situasi seperti itu, Anda dapat membuat spreadsheet CSS untuk dicetak.

Konten duplikat di blog dan sistem pengarsipan

Blog memiliki bentuk varian yang menarik pada masalah duplikat konten. Sebuah posting blog dapat muncul di beberapa halaman yang berbeda:

  • halaman awal blog;
  • halaman permalink untuk posting itu;
  • halaman arsip;
  • halaman kategori.

Setiap salinan posting adalah duplikat dari salinan lainnya. Sangat jarang penerbit mencoba menangani masalah keberadaan posting di halaman beranda blog dan halaman permalink. Dan mesin pencari tampaknya mengatasi masalah ini dengan cukup baik. Namun, mungkin masuk akal untuk hanya menampilkan cuplikan posting pada halaman kategori dan arsip.

Konten duplikat yang dibuat pengguna (postingan berulang, dll.)

Berbagai situs menggunakan struktur untuk mendapatkan konten buatan pengguna, seperti blog, forum, atau papan pesan. Ini bisa menjadi cara yang bagus untuk mengembangkan banyak konten dengan biaya yang sangat rendah. Masalahnya adalah bahwa pengguna dapat memublikasikan konten yang sama di situs Anda dan beberapa situs lain secara bersamaan, yang menyebabkan masalah konten duplikat. Sulit untuk mengontrol, tetapi untuk mengurangi masalah Anda dapat melanjutkan sebagai berikut:

  • Anda harus memiliki kebijakan yang jelas yang memberi tahu pengguna bahwa konten yang mereka berikan ke situs Anda harus unik dan tidak dapat diposting di situs lain. Tanpa pertanyaan, sulit untuk mendapatkan ini, tetapi itu akan membantu mewujudkan harapan Anda;
  • Memoles forum Anda dengan cara yang unik yang akan membutuhkan konten yang berbeda. Selain bidang entri data standar, tambahkan juga beberapa bidang unik (berbeda dari situs lain) yang akan berguna bagi pengunjung situs Anda.
Anda mungkin juga menyukai: Bagaimana Cara Memperkuat SEO Anda dengan Konten Video?

Kesimpulan

tanda-satu-arah-jalan-pemberitahuan-duplikat-motivasi-kerja

Jangan terlalu khawatir tentang duplikat konten. Ini biasanya bukan masalah besar. Sebagian besar Google sendiri tahu bagaimana menangani masalah seperti halaman master atau kutipan konten. Selain itu, banyak orang menghadapi masalah duplikat konten. Terkadang duplikat tidak muncul di tempat yang mereka harapkan, jadi Anda harus selalu memeriksa situsnya. Untuk mencegahnya, Anda perlu membuat konten unik untuk setiap halaman.



Penulis-Gambar-Isabelle-Jordan

Artikel ini ditulis oleh Isabelle Jordan. Isabelle adalah jurnalis bisnis dan pemasaran di perusahaan asuransi ektatraveling.com. Dia menulis untuk berbagai portal berita dan blog tematik yang membantunya tetap berada di jantung berita perjalanan dan asuransi. Pekerjaan semacam itu memberinya kesempatan untuk menulis artikel tentang topik paling relevan saat ini.