Paten Situs Berkualitas Tinggi Google

Diterbitkan: 2016-12-08

panda

Anda mungkin mengenali nama salah satu penemu paten yang saya tulis dalam posting ini. Dia memiliki salah satu Pembaruan Google yang paling banyak dibicarakan yang dinamai menurut namanya. Hal ini dikenal sebagai Panda.

Postingan Google Blog tentang Panda menyebutnya sebagai pembaruan “situs berkualitas tinggi”; paten ini berbicara tentang mengganti hasil pencarian peringkat tinggi dari situs berkualitas rendah dengan hasil pencarian peringkat tinggi dari situs berkualitas tinggi. Salah satu posting blog terbaik tentang Pembaruan Panda adalah yang ini dari Amit Singhal:

Panduan lebih lanjut tentang membangun situs berkualitas tinggi

Adalah baik bahwa posting blog banyak merinci tentang apa itu situs web berkualitas tinggi karena paten tidak memberi tahu kami cara membedakan antara situs berkualitas rendah dan berkualitas tinggi. Lebih banyak wawasan tentang bagaimana Google dapat mengidentifikasi situs berkualitas rendah dan berkualitas tinggi dijelaskan dalam wawancara Wired ini dengan Matt Cutts dan Amit Singhal:

TED 2011: 'Panda' yang Membenci Peternakan: Tanya Jawab Dengan Insinyur Penelusuran Teratas Google

Paten ini menarik karena memberikan sekilas di balik Pembaruan Panda untuk memberi kita gambaran tentang apa yang terjadi pada pencari alih-alih pemilik situs ketika mereka melakukan pencarian dan tidak berakhir di situs pertanian konten yang seharusnya dilakukan Pembaruan Panda mengalihkan mereka dari. Seperti yang dikatakan paten, "berfokus pada peningkatan hasil pencarian dengan mengganti situs web berkualitas rendah dengan situs yang telah diidentifikasi sebagai situs berkualitas tinggi."

Ini adalah masalah yang telah diidentifikasi di beberapa tempat dan dicatat di tempat-tempat penting, seperti New York Times, yang memperhatikan Pembaruan Panda Google:

Algoritma Google Tweaks untuk Menekan Situs Berkualitas Rendah

Paten ini mengidentifikasi halaman yang berperingkat baik untuk kueri tertentu dan melihat kualitas halaman tersebut. Jika jumlah ambang batas halaman peringkat tersebut adalah halaman berkualitas rendah, mesin pencari mungkin menggunakan kueri alternatif untuk menemukan kumpulan hasil pencarian kedua yang menyertakan halaman dari situs berkualitas tinggi. Hasil penelusuran dari kueri pertama tersebut kemudian dapat digabungkan dengan hasil dari kueri alternatif, dengan menghapus halaman dari situs berkualitas rendah sehingga hasil penelusuran menyertakan persentase halaman yang lebih besar dari situs berkualitas tinggi.
Aspek positif dari hasil ini adalah hasil yang memiliki ambang hasil tinggi dari situs berkualitas rendah menghilang, dan digantikan dengan hasil yang menyertakan situs berkualitas lebih tinggi. Hasil pencarian Google akhirnya terlihat lebih baik.

Hasil Pencarian Tergabung

Hasil Pencarian Tergabung

Paten tidak menentukan apa situs berkualitas tinggi atau berkualitas rendah bagi kami. Posting blog dari Amit Singhal melakukan pekerjaan yang lebih baik dalam memberikan "panduan" tentang arti istilah-istilah itu.

Paten tidak membahas hilangnya lalu lintas ke situs berkualitas rendah yang dihapus dari hasil pencarian. Kami mendengar dari orang-orang yang terkena dampak Panda berapa banyak lalu lintas yang hilang dari situs mereka.

patennya adalah:

Secara selektif menghasilkan kueri alternatif
Penemu Navneet Panda, April R. Lehman, Trystan G. Upstill
Penerima Asli Google Inc.
Nomor publikasi US9135307 B1
Jenis publikasi Hibah
Nomor aplikasi US 13/728.851
Tanggal publikasi 15 Sep 2015
Tanggal pengajuan 27 Desember 2012

Abstrak:

Metode, sistem, dan peralatan, termasuk program komputer yang dikodekan pada media penyimpanan komputer, untuk memperoleh hasil pencarian dari situs berkualitas tinggi. Salah satu metode termasuk menerima data yang mengidentifikasi sumber daya pertama yang responsif terhadap kueri pertama. Jika setidaknya nomor ambang pertama N dari sumber daya pertama peringkat teratas terletak di situs yang sebelumnya diidentifikasi sebagai situs berkualitas rendah, kueri kedua dan data yang mengidentifikasi sumber daya kedua yang responsif terhadap kueri kedua diperoleh, di mana setidaknya ambang kedua nomor M dari sumber daya kedua peringkat teratas terletak di situs yang sebelumnya diidentifikasi sebagai situs berkualitas tinggi. Hasil pencarian disediakan sebagai tanggapan atas kueri pertama, di mana hasil pencarian mengidentifikasi satu atau lebih sumber daya pertama dan juga mengidentifikasi sumber daya kedua tertentu dari sumber daya kedua.

Bagaimana sebuah "situs" didefinisikan dalam paten ini menarik, dan ini adalah alternatif yang disediakan:

(1) kumpulan sumber daya yang di-host di server tertentu.
(2) Sumber daya dalam domain, misalnya, "example.com," di mana sumber daya di domain, misalnya, "host.example.com/resource1," "www.example.com/folder/resource2," atau " example.com/resource3,” ada di situs.
(3) Sumber daya dalam subdomain, misalnya, "en.example.com," di mana sumber daya di subdomain, misalnya, "en.example.com/resource1" atau "en.example.com/folder/resource2," berada di situs.
(4) Sumber daya dalam subdirektori, misalnya, "example.com/subdirectory," di mana sumber daya di subdirektori, misalnya, "example.com/subdirectory/resource.html," berada di situs.

Ada penyebutan skor kualitas situs, tetapi tidak bagaimana mereka ditentukan. Paten memberi tahu kami bahwa mesin pencari mungkin menggunakan daftar putih situs berkualitas tinggi dan daftar hitam situs berkualitas rendah yang disiapkan secara manual atau dengan metode offline lainnya.

Kami juga diberi tahu bahwa informasi tentang kueri mungkin dikumpulkan selama beberapa waktu. Jika sejumlah halaman peringkat teratas untuk kueri awal berada di situs berkualitas rendah, kueri kedua berdasarkan kueri pertama tersebut dapat digunakan. Paten memberi tahu kita bahwa salah satu cara yang mungkin dilakukan adalah dengan menggunakan database yang "mencakup istilah kueri pengganti dan dapat menghasilkan kueri alternatif dengan mengganti istilah kueri pengganti untuk salah satu istilah kueri dalam kueri pertama." Ini mengingatkan saya pada beberapa posting yang saya tulis tentang paten Google yang mencakup istilah kueri pengganti seperti yang saya tulis di:

  • Bagaimana Google Dapat Mengganti Persyaratan Kueri dengan Kejadian Bersama
  • Bagaimana Mesin Pencari Dapat Mengganti Istilah Pencarian Lain untuk Anda
  • Menyelidiki Penggantian Istilah Google RankBrain dan Kueri

Sebagai alternatif, paten memberi tahu kita bahwa mesin pencari mungkin membuat "grafik konseptual kueri dan melintasi grafik untuk mendapatkan satu atau lebih kueri alternatif." Bahwa, “setiap simpul dalam grafik ditentukan oleh kueri dan serangkaian hasil penelusuran peringkat teratas yang diperoleh untuk kueri tersebut. Tautan antar node dalam grafik dapat menunjukkan bahwa kueri terkait atau bahwa satu kueri merupakan kueri alternatif untuk kueri lainnya.”

Itu akan sangat berbeda dari grafik tautan yang kami pikirkan ketika datang ke Google, tetapi cara berpikir yang menarik tentang bagaimana kueri alternatif dapat ditemukan. Paten dibangun di atas pendekatan grafik ini, dan sepertinya itu mungkin metode yang mereka gunakan.

Sistem pencarian ini mungkin mengevaluasi lebih dari satu kueri alternatif yang mungkin sebelum memilih satu dengan ukuran kepercayaan tertinggi.

Jika kumpulan hasil yang menyertakan jumlah ambang gabungan situs berkualitas tinggi, mungkin mencoba untuk memperoleh lebih banyak hasil kueri alternatif dari situs berkualitas tinggi.

Kesimpulan

Ini mungkin paten asli dari Pembaruan Panda. Navneet Panda Google adalah salah satu penemu paten, seperti yang diungkapkan dalam wawancara Wired dengan Cutts dan Singhal. Dan paten ini menargetkan situs pertanian konten, yang paling dikenal dengan Pembaruan Panda asli. Paten itu sendiri tidak mengungkapkan perbedaan antara situs berkualitas rendah dan situs berkualitas tinggi, dan kami mengetahui dalam Wired Interview bahwa insinyur pencari bernama Panda-lah yang mengajukan beberapa pertanyaan awal untuk mengidentifikasi perbedaan di antara keduanya.