Bagaimana Google Dapat Melakukan Penulisan Ulang Kueri dengan Melihat Kueri Sebelumnya dari Penelusur

Diterbitkan: 2019-08-24

Berapa Banyak Orang yang dimiliki Stadion Mudville (tempat Mighty Casey Struck Out) bertahan?

Google diberikan paten baru yang melibatkan penulisan ulang kueri awal pekan ini. Ini tidak bekerja dengan cara yang sama seperti yang dilakukan Hummingbird Google atau cara kerja Rankbrain Google.

Kami telah melihat paten tentang penulisan ulang kueri yang mungkin ditelusuri oleh penelusur dengan laman kembali yang memenuhi kebutuhan informasi situasional dari penelusur. Itu adalah ide di balik pembaruan Hummingbird Google dan paten Google lainnya tentang penggunaan sinonim untuk menulis ulang kueri.

Pada gambar di bawah dari paten Hummingbird, kata "tempat" untuk Chicago Style Pizza dapat ditulis ulang menjadi "restoran", yang lebih mudah dijawab oleh Google sebagai kueri.

Google Hummingbirs Sinonim berdasarkan Konteks

Saya menulis tentang paten yang menjelaskan pendekatan penulisan ulang kueri yang digunakan oleh Hummingbird dalam posting saya Paten Google Hummingbird? Dalam posting itu, saya menulis tentang Paten Google yang diberikan dua minggu sebelum Google mengumumkan Pembaruan Hummingbird, yang membagikan beberapa contoh penulisan ulang kueri dengan pengumuman tersebut. Patennya adalah identifikasi Sinonim berdasarkan istilah yang terjadi bersamaan.

Pada acara mengumumkan Hummingbird mereka membuat pernyataan berikut tentang pembaruan:

Secara khusus, Google mengatakan bahwa Hummingbird lebih memperhatikan setiap kata dalam kueri, memastikan bahwa seluruh kueri — seluruh kalimat atau percakapan atau makna — diperhitungkan, daripada kata-kata tertentu. Tujuannya adalah agar halaman yang cocok dengan artinya lebih baik daripada halaman yang hanya cocok dengan beberapa kata.

~ FAQ: Semua Tentang Algoritma “Hummingbird” Google yang Baru

Dalam Query “What is the best place for Chicago Style Pizza”, paten ini memberitahu kita bahwa kata “place” dapat diganti dengan kata “Restaurant” yang akan memudahkan mesin pencari untuk menjawabnya.

Paten baru ini mungkin melihat kata-kata pencari sendiri untuk menulis ulang kueri. Ini mungkin melihat kueri apa yang mungkin telah mereka lakukan sebelumnya untuk membantu mereka menemukan apa yang ingin mereka temukan. Saya akan memberikan ringkasan proses di balik paten, dan kemudian contoh bagaimana kueri sebelumnya dapat membantu menulis ulang kueri pencari.

Penulisan Ulang Kueri menggunakan Kueri Sebelumnya

Ini adalah langkah-langkah yang diidentifikasi dalam paten baru yang diberikan yang merinci proses di baliknya:

  1. Mesin pencari menerima permintaan dari seorang pencari
  2. Mesin pencari mungkin telah menerima beberapa pertanyaan sebelumnya dari pencari yang sama selama sesi yang sama
  3. Mesin telusur dapat membuat banyak penulisan ulang kueri kandidat, berdasarkan kueri penelusuran terbaru dan kueri penelusuran sebelumnya dari penelusur yang sama
  4. Penulisan ulang kueri kandidat tersebut dinilai berdasarkan penentuan kualitas penulisan ulang dari analisis hasil pencarian yang responsif terhadap penulisan ulang kueri kandidat
  5. Penulisan ulang kueri kandidat dipilih berdasarkan skor yang memenuhi nilai ambang batas
  6. Hasil pencarian tersebut dari penulisan ulang kueri kandidat yang dipilih ditampilkan kepada pencari

Paten memberi tahu kita bahwa ada beberapa fitur opsional yang terkait dengan pendekatan penulisan ulang kueri ini. Saya pikir menarik bahwa penyertaan entitas dalam kueri sebelumnya merupakan aspek yang menarik dari pendekatan penulisan ulang ini.

Langkah-langkah opsional ini menyempurnakan langkah-langkah yang tercantum di atas.

  1. Membuat jumlah penulisan ulang kueri kandidat dapat berarti menggabungkan kueri asli dengan setiap kueri penelusuran sebelumnya
  2. Setiap kueri sebelumnya memiliki stempel waktu, dan bagian dari penilaian penulisan ulang kueri kandidat dapat mencakup pembobotan penulisan ulang kandidat pada berapa lama kueri sebelumnya.
  3. Membuat jumlah penulisan ulang kueri kandidat tersebut dapat mencakup pengidentifikasian kueri dari kumpulan kueri dari beberapa pengguna yang serupa dengan kueri penelusuran.
  4. Penskoran penulisan ulang kueri kandidat juga mencakup penentuan seberapa populer untuk setiap penulisan ulang kueri kandidat, berdasarkan kumpulan kueri dari banyak pengguna.
  5. Menskor setiap penulisan ulang kueri kandidat juga dapat mencakup penentuan apakah itu menyertakan istilah referensial dari jenis tertentu (kemungkinan referensi entitas)
  6. Skor untuk penulisan ulang kueri kandidat dapat ditingkatkan sebagai respons untuk menentukan bahwa penulisan ulang kueri kandidat menyertakan entitas dari tipe tertentu.
  7. Penilaian setiap penulisan ulang kueri kandidat juga mencakup penentuan apakah kueri penelusuran memiliki istilah di dalamnya yang sangat berkorelasi dengan entitas tertentu.
  8. Skor penulisan ulang kueri kandidat dapat ditingkatkan sebagai respons untuk menentukan bahwa penulisan ulang kueri kandidat menyertakan entitas yang sangat berkorelasi dengan istilah kueri.
  9. Penentuan kualitas setiap penulisan ulang kueri kandidat berdasarkan analisis hasil pencarian yang responsif terhadap penulisan ulang kueri kandidat meliputi perolehan hasil pencarian yang responsif terhadap setiap penulisan ulang kueri kandidat dan penentuan kualitas hasil pencarian.

Pendekatan penulisan ulang kueri ini bukan tentang memahami konteks semua kata dalam kueri dan menulis ulang dengan cara yang lebih mungkin untuk mengembalikan hasil yang berguna bagi penelusur. Ini memperluas itu dengan membuat mesin pencari memahami konteks beberapa pertanyaan dari sesi kueri yang sama, dan apakah mereka dapat membantu memberikan jawaban yang memuaskan pencari atau tidak. Paten memberi tahu kita bahwa keuntungan di balik proses dari paten ini adalah untuk:

Menggunakan kueri sesi pengguna sebelumnya untuk menulis ulang kueri meningkatkan kemungkinan mengembalikan hasil penelusuran yang responsif terhadap maksud pengguna.

Paten Penulisan Ulang Kueri ini adalah:

Penulisan ulang kueri menggunakan informasi sesi
Penemu: Marcin M. Nowak-Przygodzki dan Behshad Behzadi
Penerima tugas: Google LLC
Paten AS: 10.387.437
Diberikan: 20 Agustus 2019
Diarsipkan: 13 Januari 2017

Abstrak

Metode, sistem, dan aparatus, termasuk program komputer yang dikodekan pada media penyimpanan komputer, untuk pemrosesan bahasa alami. Salah satu metode termasuk menerima permintaan pencarian dari pengguna selama sesi pengguna; memperoleh sejumlah permintaan pencarian sebelumnya oleh pengguna yang diterima selama sesi pengguna; menghasilkan sejumlah penulisan ulang kueri kandidat, di mana penulisan ulang kueri kandidat berasal dari kueri penelusuran dan sejumlah kueri penelusuran sebelumnya oleh pengguna; penilaian setiap penulisan ulang kueri kandidat, di mana penilaian setiap penulisan ulang kandidat mencakup penentuan kualitas setiap penulisan ulang kueri kandidat berdasarkan analisis hasil pencarian yang responsif terhadap penulisan ulang kueri kandidat; memilih kandidat penulisan ulang kueri yang memiliki skor yang memenuhi nilai ambang batas, dan memberikan hasil penelusuran yang responsif terhadap penulisan ulang kueri kandidat yang dipilih.

Pengujian dan Takeaways Penulisan Ulang Kueri

Saya memang mencoba kueri dari contoh yang tercantum dalam paten ini, dan itu tidak menulis ulang kueri saya untuk saya. Selalu uji hal-hal seperti ini, terlepas dari apakah saya menulisnya, atau jika Anda menemukan paten sendiri, dan kedengarannya menarik – lihat apakah Google melakukan apa yang dikatakan paten, atau apakah mereka telah menerapkan sesuatu yang menunjukkan bahwa mereka sedang bergerak ke arah itu.

Saya baru-baru ini menulis posting Skor Kunjungan Kualitas ke Bisnis Dapat Mempengaruhi Peringkat di Pencarian Lokal Google, dan tidak mungkin untuk mengetahui apakah mereka menggunakan skor kunjungan berkualitas untuk meningkatkan peringkat hasil lokal, tetapi ada tanda-tanda lain bahwa Google mungkin bergerak menuju hal seperti itu. Yang pertama adalah bahwa Google memamerkan informasi kunjungan berkualitas di Google Analytics 360. Yang kedua adalah bahwa posting terbaru di blog Google Webmaster memberi tahu kami bahwa Google akan memberikan lencana dalam kategori bisnis yang berbeda untuk bisnis yang termasuk dalam 5 besar % mengunjungi situs dalam kategorinya. Jadi carilah tanda-tanda bahwa proses yang dijelaskan dalam paten sedang digunakan.

Contoh dari paten ini termasuk pencarian menggunakan kueri berikut:

[Stadion Mudville]
[Mudville Sembilan]
[Barack Obama]

Kueri selanjutnya adalah:

[berapa kapasitasnya]

Dan itu akan merujuk ke pertanyaan pertama sebelumnya.

Penulisan ulang kueri kandidat berdasarkan penggabungan kueri itu dengan kueri sebelumnya yang pertama adalah:

[berapa kapasitas Stadion Mudville?]

Ini juga mengacu pada properti entitas yang disebutkan dalam kueri pertama (kapasitas stadion), yang sesuai dengan fitur opsional yang akan dinilai tinggi oleh kueri yang ditulis ulang oleh kandidat.

Google tidak menggabungkan kueri terakhir itu dengan kueri pertama dan mengembalikan hasil yang menunjukkan kepada saya kapasitas Stadion Mudville saat ini. Kemudian lagi, saya tidak yakin bahwa ada Stadion Mudville yang sebenarnya (di situlah Casey At the Bat terjadi, jadi saya mencoba Kumpulan kueri yang Sama, mengganti Stadion Mudville dengan Lincoln Financial Field (yang nyata) dan Google melakukannya jangan beri tahu saya kapasitas Lincoln Financial Field. Setidaknya belum. Saya akan mencoba lagi.