Apa Jawaban yang Baik untuk Pertanyaan yang Mengajukan Pertanyaan?
Diterbitkan: 2020-03-24Elemen Pertanyaan Mencari Jawaban dan Elemen Jawaban
Google baru-baru ini diberikan paten yang berfokus pada pertanyaan pencarian jawaban dan memberikan jawaban yang baik untuk pertanyaan tersebut.
Memiliki gagasan tentang elemen dari kueri pencarian jawaban dapat membantu orang memahami apa yang mungkin perlu mereka publikasikan untuk memberikan jawaban atas pertanyaan tersebut.
Jadi, menarik untuk melihat apa yang dikatakan paten ini tentang apa yang mungkin dicari Google dalam hal jawaban yang bagus untuk pertanyaan.
Paten ini berfokus pada:
Bagaimana sistem pencarian dapat mempelajari elemen karakteristik dari pertanyaan pencarian jawaban dan jawaban atas pertanyaan pencarian jawaban.
Deskripsi paten dimulai dengan memberi tahu kami lebih banyak tentang jawaban yang baik untuk pertanyaan:
Secara umum, sistem pencarian menerima permintaan pencarian dan memperoleh hasil pencarian yang memenuhi permintaan pencarian. Hasil pencarian mengidentifikasi sumber daya yang relevan atau responsif terhadap permintaan pencarian, misalnya, sumber daya yang dapat diakses melalui Internet. Sebuah sistem pencarian dapat mengidentifikasi berbagai jenis hasil pencarian dalam menanggapi permintaan pencarian yang diterima, misalnya, hasil pencarian yang mengidentifikasi halaman web, gambar, video, buku, atau artikel berita, hasil pencarian yang menyajikan petunjuk arah mengemudi, selain banyak lainnya. jenis hasil pencarian.
Ini dapat mencakup Google yang mengetahui informasi tentang entitas dalam kueri tersebut dan menggunakan informasi tersebut dalam jawaban:
Sistem pencarian dapat menggunakan berbagai subsistem untuk mendapatkan sumber daya yang relevan dengan kueri. Misalnya, sistem pencarian dapat mempertahankan basis pengetahuan yang menyimpan informasi tentang berbagai entitas dan memberikan informasi tentang entitas ketika kueri pencarian merujuk alias entitas. Sistem dapat menetapkan satu atau lebih alias string teks untuk setiap entitas. Misalnya, Patung Liberty dapat dikaitkan dengan alias "Patung Liberty" dan "Lady Liberty." Alias tidak perlu unik di antara entitas. Misalnya, "jaguar" bisa menjadi alias untuk hewan dan pabrikan mobil.
Ini juga dapat melibatkan Google memahami berbagai bagian pidato dalam kueri, dan menggunakan informasi itu dalam jawaban juga:
Contoh lain subsistem pencarian adalah tagger part-of-speech. Tagger part-of-speech menganalisis istilah dalam kueri dan mengklasifikasikan setiap istilah sebagai bagian tertentu dari pidato, misalnya, kata benda, kata kerja, atau objek langsung. Contoh lain subsistem pencarian adalah pengidentifikasi kata dasar. Mengingat kueri tertentu, pengidentifikasi kayu akar dapat mengklasifikasikan istilah dalam kueri sebagai kata dasar, yang merupakan kata yang tidak bergantung pada kata lain dalam kueri. Misalnya, dalam kueri "cara memasak lasagna", pengenal kata dasar dapat menentukan bahwa "memasak" adalah kata dasar kueri.
Di atas segalanya, paten ini secara khusus tentang menemukan jawaban singkat untuk pertanyaan yang berfokus pada menampilkan jawaban atas pertanyaan pencari:
Spesifikasi ini menjelaskan teknologi yang berkaitan dengan mengklasifikasikan kueri sebagai pencarian jawaban dan menghasilkan jawaban untuk pertanyaan pencarian jawaban. Kueri pencarian jawaban adalah kueri yang dikeluarkan oleh pengguna yang mencari jawaban singkat. Misalnya, "kapan George Washington lahir" akan diklasifikasikan oleh sistem sebagai kueri pencarian jawaban karena sistem dapat menentukan bahwa kemungkinan pengguna yang menerbitkannya akan mencari jawaban singkat, misalnya, "Feb. 22, 1732.”
Contoh permintaan pencarian jawaban, dari gambar paten:

Mengklasifikasikan kueri sebagai pencarian jawaban dan menghasilkan jawaban atas pertanyaan pencarian jawaban
Permintaan pencarian jawaban adalah pertanyaan yang dicari oleh seorang pencari yang mencari jawaban singkat.
Salah satu contohnya adalah, “Kapan George Washington lahir?” Itu dapat diklasifikasikan sebagai permintaan pencarian jawaban karena dapat ditentukan bahwa kemungkinan seorang pencari menginginkan jawaban seperti: “Feb. 22, 1732.”
Paten memberi tahu kita bahwa tidak semua pertanyaan adalah pencarian jawaban dan bahwa pertanyaan tersebut hanya dapat mengembalikan hasil pencarian dan bukan kotak jawaban dengan jawaban.
Untuk beberapa kueri, jawaban terbaik mungkin tampak seperti memberikan penelusur daftar terurut dari beberapa dokumen yang relevan dengan kueri. Seseorang menelusuri "restoran di new york" dan mereka mungkin menginginkan daftar dokumen tentang berbagai tempat makan di NYC.
Kami diarahkan ke tujuan di balik paten ini, dan diberitahu tentang mengapa itu ada:
Teknik yang dijelaskan di bawah ini terkait dengan bagaimana sistem dapat mengklasifikasikan kueri sebagai kueri pencarian jawaban dan bagaimana sistem dapat mengidentifikasi bagian dari dokumen responsif yang kemungkinan besar merupakan jawaban yang baik untuk kueri pencarian jawaban.
Ini adalah pertama kalinya saya melihat sesuatu dari Google yang memberi tahu kita tentang "jawaban bagus" untuk sebuah pertanyaan yang mungkin ada di kotak jawaban.
Mengidentifikasi Pertanyaan Mencari Jawaban
Deskripsi paten memberi tahu kita proses di balik mengenali pertanyaan pencarian jawaban.
Ini dimulai dengan ringkasan aspek paten dan menjabarkan aspek cara kerjanya, yang akan saya bahas lebih lanjut di posting ini.
Proses identifikasi kueri pencarian jawaban meliputi:
- Menerima kueri yang memiliki banyak istilah
- Mengklasifikasikan kueri sebagai kueri pencarian jawaban dari jenis pertanyaan tertentu
- Memperoleh satu atau lebih jenis jawaban yang terkait dengan jenis pertanyaan tertentu
- Di mana setiap jenis jawaban menentukan satu atau lebih elemen jawaban masing-masing yang mewakili karakteristik jawaban yang tepat untuk pertanyaan pencarian jawaban
- Mendapatkan hasil pencarian yang memuaskan kueri, di mana masing-masing mengidentifikasi dokumen
- Menghitung skor masing-masing untuk masing-masing dari satu atau lebih bagian teks di setiap dokumen yang diidentifikasi oleh hasil pencarian
- Dimana skor untuk setiap bagian teks didasarkan pada berapa banyak dari satu atau lebih jenis jawaban yang cocok dengan bagian teks
- Memberikan, sebagai tanggapan atas pertanyaan, presentasi yang mencakup informasi dari satu atau lebih bagian teks yang dipilih berdasarkan skor masing-masing

Beberapa fitur opsional lain yang terlibat dalam proses ini:
- Menyediakan bagian teks pertama dan satu atau lebih hasil penelusuran yang memenuhi kueri
- Menentukan bahwa bagian teks memiliki skor yang memenuhi ambang batas
- Memilih bagian teks yang memiliki skor yang memenuhi ambang batas untuk dimasukkan dalam presentasi
Apa itu Pertanyaan Pencarian Jawaban?
Mengklasifikasikan kueri sebagai "kueri pencarian jawaban" dari jenis tertentu dapat berarti:
- Mencocokkan istilah kueri dengan sejumlah jenis pertanyaan
- Di mana setiap jenis pertanyaan menentukan sejumlah elemen pertanyaan yang secara kolektif mewakili karakteristik dari jenis kueri yang sesuai
- Menentukan bahwa istilah kueri cocok dengan jenis pertanyaan pertama dari jumlah jenis pertanyaan
Bagaimana Persyaratan Kueri Mencocokkan Jenis Pertanyaan?
"n-gram" berarti urutan kata dengan panjang "n", jadi 2 gram terdiri dari dua kata, dan 3 gram terdiri dari 3 kata. dengan menyatakan ini sebagai "n-gram" proses dalam paten memberikan fleksibilitas untuk mengeksplorasi panjang yang berbeda.
Menentukan bahwa istilah kueri cocok dengan jenis pertanyaan tertentu berarti:
- Menentukan bahwa n-gram pertama dalam kueri mewakili instance entitas
- Menentukan bahwa jenis pertanyaan pertama mencakup elemen pertanyaan yang mewakili instance entitas
Menentukan bahwa istilah kueri cocok dengan jenis pertanyaan tertentu berarti:
- Memutuskan bahwa n-gram pertama dalam kueri mewakili turunan dari kelas
- Menentukan bahwa jenis pertanyaan termasuk elemen pertanyaan yang mewakili kelas
Menentukan bahwa bagian pertama teks cocok dengan jenis jawaban pertama dari satu atau lebih jenis jawaban
- Memutuskan bahwa bagian pertama dari teks memiliki n-gram yang cocok dengan satu atau lebih elemen jawaban dari jenis jawaban pertama
- Elemen jawaban pertama dari satu atau lebih elemen jawaban dapat mewakili pengukuran numerik
Di mana menentukan bahwa bagian pertama teks cocok dengan jenis jawaban pertama terdiri dari menentukan bahwa bagian pertama teks memiliki n-gram yang mewakili pengukuran numerik.
- Elemen jawaban pertama dari satu atau lebih elemen jawaban mewakili kelas kata kerja
- Menentukan bahwa bagian pertama teks cocok dengan jenis jawaban pertama terdiri dari menentukan bahwa bagian pertama teks memiliki n-gram yang mewakili turunan dari kelas kata kerja

Paten ini dapat ditemukan di:
Menghasilkan elemen pertanyaan pencarian jawaban dan elemen jawaban
Penemu: Yi Liu, Preyas Popat, Nitin Gupta, dan Afroz Mohiuddin
Penerima tugas: Google LLC
Paten AS: 10.592.540
Diberikan: 17 Maret 2020
Diarsipkan: 28 Juni 2016
Abstrak
Metode, sistem, dan aparatus, termasuk program komputer yang dikodekan pada media penyimpanan komputer, untuk menghasilkan jawaban atas pertanyaan pencarian jawaban.
Salah satu metode termasuk menerima kueri yang memiliki banyak istilah. Kueri diklasifikasikan sebagai kueri pencarian jawaban dari jenis pertanyaan tertentu, dan satu atau lebih jenis jawaban yang terkait dengan jenis pertanyaan tertentu diperoleh.
Hasil pencarian yang memenuhi kueri diperoleh, dan skor masing-masing dihitung untuk masing-masing dari satu atau lebih bagian teks yang terjadi di setiap dokumen yang diidentifikasi oleh hasil pencarian, di mana skor untuk setiap bagian teks didasarkan pada berapa banyak dari satu atau lebih banyak jenis jawaban yang cocok dengan bagian teks.
Presentasi yang mencakup informasi dari satu atau lebih bagian teks yang dipilih berdasarkan skor masing-masing disediakan sebagai tanggapan atas kueri.
Presentasi jawaban untuk pertanyaan pencarian jawaban
Halaman hasil pencarian dapat menyertakan hasil pencarian web serta kotak jawaban.
Saya menulis lebih banyak tentang kotak jawaban di pos, Bagaimana Google Dapat Memicu Hasil Kotak Jawaban untuk Pertanyaan.
Hasil pencarian web dapat memberikan tautan ke dokumen dari indeks web Google.
Itu adalah hasil yang dianggap mungkin relevan dengan kueri yang diajukan dan menyertakan judul, cuplikan, dan tautan tampilan.
Itu dapat dilihat di Hasil Pencarian untuk memberi penelusur gambaran tentang seberapa relevan tautan tertentu dengan kueri yang mereka lakukan. Dan mereka akan memungkinkan pencari untuk mengunjungi halaman dari mana mereka berasal.
Kotak jawaban dapat langsung menyertakan jawaban atas kueri. Jawaban itu kemungkinan diperoleh dari teks dokumen yang dirujuk dalam hasil pencarian web.
Saya menulis tentang jawaban seperti itu di pos, Cuplikan Unggulan – Hasil Pencarian Bahasa Alami untuk Kueri Intent. Itu kemungkinan dari dokumen otoritatif kemungkinan dari halaman pertama dari serangkaian hasil pencarian.
Google telah menunjukkan hasil kotak jawaban ini di atas hasil organik sebagai tanggapan atas kueri dan menunjukkan halaman itu untuk kedua kalinya di SERP, tetapi mereka memutuskan untuk memperlakukan jawaban seperti itu sebagai hasil tunggal baru-baru ini, seperti yang dijelaskan di The Search Engine Journal di Google: Halaman web dengan Cuplikan Unggulan Tidak Akan Muncul Dua Kali di Halaman 1
Paten ini memberi tahu kita bahwa Google dapat “menyediakan kotak jawaban setiap kali sistem memutuskan bahwa kueri tersebut adalah kueri pencarian jawaban.”
Ada beberapa cara berbeda agar Google dapat menganggap kueri sebagai kueri pencarian jawaban, berdasarkan apakah ia menggunakan istilah yang cocok dengan jenis pertanyaan tertentu.
Pertanyaan-pertanyaan ini dapat memicu kotak jawaban dengan memasukkan istilah pertanyaan seperti, "bagaimana", "mengapa", dll.
Paten ini memberi tahu kita bahwa istilah pertanyaan tersebut tidak diperlukan sepanjang waktu, dan kotak jawaban dapat ditampilkan bahkan saat kueri tidak diutarakan sebagai pertanyaan dan tidak menyertakan kata tanya.
Namun, jika ada pertanyaan seperti "Bagaimana cara memasak kentang?" atau “Bagaimana cara membuat Kentang Goreng?” atau “Bagaimana cara membuat Kentang Tumbuk?” kemungkinan mencari kotak jawaban.
Tetapi istilah pertanyaan dan pertanyaan aktual itu tidak perlu ada untuk memicu kotak jawaban. Google dapat melihat kueri dan memutuskan apakah pertanyaan tersebut paling baik dijawab dengan jenis jawaban:
Sebaliknya, jawaban di kotak jawaban diidentifikasi sebagai jawaban yang baik karena sistem pencarian telah menentukan bahwa jenis pertanyaan yang cocok dengan kueri sering dikaitkan dengan jenis jawaban yang cocok dengan teks dokumen yang dirujuk oleh hasil pencarian.
Mesin Skor Jawaban

Ketika seseorang melakukan pencarian. Permintaan mereka menghasilkan dokumen yang dikembalikan sebagai tanggapan atas permintaan itu.
Mesin penilaian Jawaban menerima ID dokumen dan dapat menghasilkan jawaban yang dapat dimasukkan dalam halaman hasil pencarian.
ID dokumen tersebut akan mengidentifikasi subset dokumen yang dirujuk oleh hasil pencarian.
Mesin penilaian jawaban dapat menghasilkan jawaban dengan menggunakan pasangan tipe pertanyaan/tipe jawaban yang diterima dari mesin pelatihan. (Ini bisa berupa pertanyaan dan jawaban yang ditampilkan di kotak jawaban.)
Mesin penilaian jawaban dapat mengidentifikasi untuk kueri satu atau beberapa jenis pertanyaan yang cocok dengan istilah kueri, dan untuk setiap jenis pertanyaan, satu atau beberapa jenis jawaban yang terkait dengan elemen pertanyaan.
Setiap jenis pertanyaan menentukan satu atau lebih elemen pertanyaan yang merupakan karakteristik dari kueri pencarian jawaban.
Demikian pula, setiap jenis jawaban yang sesuai menentukan satu atau lebih elemen jawaban yang merupakan karakteristik dari jawaban atas kueri pencarian jawaban.
Jenis pertanyaan dan jenis jawaban akan dijelaskan lebih rinci di bawah tentang Gambar. 3.
Mesin pelatihan mengidentifikasi pasangan jenis pertanyaan dan jenis jawaban.
Mesin pelatihan memproses contoh pelatihan dalam kumpulan data pelatihan, yang dapat mencakup pasangan pertanyaan dan jawaban atas pertanyaan tersebut.
Sebuah pertanyaan dan jawaban dapat dipilih untuk menjawab pertanyaan tersebut, seperti pertanyaan berikut tentang cara mengganti ban:

Google telah memberikan informasi tentang jenis pertanyaan tertentu seperti pertanyaan how-to yang saya tulis secara lebih rinci baru-baru ini di posting, Bagaimana Google Dapat Memilih Jawaban untuk Pertanyaan How-to.
Paten yang saya tulis di pos itu berfokus pada mencoba menemukan kepercayaan diri pada langkah-langkah yang mungkin menjawab pertanyaan semacam itu, daripada yang ini lebih tentang memutuskan apakah sebuah kueri adalah kueri pencarian jawaban dan apakah sebuah jawaban memberikan respons yang baik untuk permintaan itu.
Membangkitkan pasangan elemen pertanyaan/elemen jawaban
Sistem pencarian ini akan memproses pasangan pertanyaan/jawaban dalam data pelatihan untuk menentukan jenis pertanyaan dan jenis jawaban yang sesuai.
Ini akan menghitung statistik yang mewakili pasangan tipe pertanyaan/tipe jawaban mana yang paling mungkin menghasilkan jawaban yang baik untuk pertanyaan pencarian jawaban.
Penentuan itu terjadi pada sistem komputer yang disebut sebagai mesin pelatihan.
Ini dimulai dengan mengidentifikasi data pelatihan.
Data latih adalah data yang mengaitkan pertanyaan dengan jawaban, seperti pasangan tanya jawab.
Data pelatihan dapat mencakup kueri yang ditentukan sebagai pencarian jawaban dan cuplikan hasil pencarian yang dipilih oleh pencari, baik secara umum atau dipilih lebih sering daripada hasil pencarian lainnya.
Dalam data pelatihan ini, sistem dapat menyaring jenis kata dan frasa tertentu dari pertanyaan, seperti kata berhenti.

Jadi, "cara memasak lasagna" dapat disaring untuk menghasilkan "cara memasak lasagna".
Beberapa bagian mungkin dihapus dari pertanyaan, seperti kata sifat dan frasa preposisi dihapus dari kueri.
Jadi kueri seperti "di mana kerongkongan terletak di tubuh manusia" dapat disaring untuk menghasilkan "di mana kerongkongan berada."
Sistem juga dapat mengubah istilah dalam pertanyaan dan jawaban menjadi bentuk kanonik.
Ini berarti bahwa bentuk infleksi dari istilah "memasak", misalnya, "memasak", "memasak", "memasak", dan seterusnya, mungkin diubah menjadi bentuk kanonik "memasak".
Jenis pertanyaan dapat ditentukan dari elemen pertanyaan dalam data pelatihan.
Jenis pertanyaan adalah sekelompok elemen pertanyaan yang digabungkan mewakili karakteristik kueri pencarian jawaban.
Jenis pertanyaan (bagaimana, masak) menentukan dua elemen pertanyaan, "bagaimana," dan "memasak."
Kueri cocok dengan jenis pertanyaan ini jika memiliki istilah yang cocok dengan semua elemen pertanyaan dalam jenis pertanyaan.
Kueri "cara memasak pizza" cocok dengan jenis pertanyaan (bagaimana, memasak) karena kueri menyertakan semua elemen pertanyaan dari jenis pertanyaan.
Paten memberi tahu kita bahwa jenis pertanyaan dapat dipesan atau tidak diurutkan. (Tampaknya ini merupakan indikasi apakah kueri adalah kueri "cara" yang menunjukkan langkah-langkah spesifik untuk diikuti dalam urutan tertentu.)
Paten menggunakan kurung kurawal untuk mengidentifikasi apakah kueri menggunakan struktur terurut.
Jadi, kueri akan cocok dengan jenis pertanyaan {how, cook} jika dan hanya jika istilah "bagaimana" muncul dalam kueri sebelum istilah "cook".
Pasangan Pertanyaan dan Jawaban dicocokkan dengan melihat, untuk setiap pertanyaan, istilah pertanyaan mana yang cocok dengan serangkaian jenis elemen pertanyaan.
Setiap jenis elemen pertanyaan mewakili karakteristik n-gram yang terjadi dalam sebuah pertanyaan.
Jenis Elemen Pertanyaan Umum
Paten menyediakan beberapa jenis elemen pertanyaan umum yang meliputi:
Instance entitas – Tipe instance entitas cocok dengan n-gram yang mewakili instance entitas. Sebagai contoh, n-gram “Abraham Lincoln” cocok dengan tipe elemen pertanyaan karena n-gram ini adalah turunan dari suatu entitas. Ketika n-gram cocok dengan tipe elemen pertanyaan ini, tipe pertanyaan yang dihasilkan menyertakan elemen pertanyaan yang mewakili instance entitas dari n-gram, misalnya (entitas/Abraham_Lincoln). N-gram lain yang cocok dengan alias dari entitas yang sama juga akan cocok dengan elemen pertanyaan ini, misalnya, "Abe Lincoln", "President Lincoln", dan "Abe Jujur".
Kelas entitas – Tipe kelas entitas cocok dengan n-gram yang mewakili instance kelas entitas. Sebagai contoh, n-gram “lasagna” cocok dengan tipe elemen pertanyaan ini karena merupakan turunan dari kelas entitas yang mewakili hidangan makanan. Ketika n-gram cocok dengan tipe elemen pertanyaan ini, tipe pertanyaan yang dihasilkan menyertakan elemen pertanyaan yang mewakili kelas entitas, misalnya (entitas/piringan)
Kelas part of speech – Tipe kelas part-of-speech cocok dengan n-gram yang mewakili instance kelas part-of-speech. Misalnya, "run" n-gram cocok dengan tipe elemen pertanyaan ini karena ini adalah turunan dari "kata kerja" kelas part-of-speech. Ketika n-gram cocok dengan tipe elemen pertanyaan ini, tipe pertanyaan yang dihasilkan menyertakan elemen pertanyaan yang mewakili kelas part-of-speech yang cocok, misalnya, (part-of-speech/verb).
Kata dasar – Jenis kata dasar cocok dengan n-gram yang ditentukan sistem sebagai kata dasar dari sebuah pertanyaan. Secara umum, kata dasar adalah istilah yang tidak bergantung pada istilah lain dalam pertanyaan. Misalnya, dalam "cara memasak lasagna", "memasak" adalah kata dasar. Jadi, "cook" akan cocok dengan tipe elemen pertanyaan ini ketika "cook" muncul dalam kueri "how to cook lasagna." Jenis pertanyaan yang dihasilkan mencakup n-gram yang cocok, misalnya (cook).
N-gram –Tipe n-gram cocok dengan n-gram mana pun. Namun, paten memberi tahu kita bahwa untuk menghindari pembuatan tipe pertanyaan yang terlalu banyak dari data pelatihan, sistem dapat membatasi elemen pertanyaan n-gram ke kumpulan n-gram yang telah ditentukan sebelumnya.
Sistem pencarian dapat menentukan elemen pertanyaan n-gram untuk memasukkan kata dan frasa pertanyaan, seperti, "bagaimana", "bagaimana", "kapan", "kapan", "mengapa", "di mana", "apa", “siapa”, dan “siapa”.
Lebih dari satu jenis elemen pertanyaan ini mungkin muncul.
Jadi, n-gram "George Washington" cocok dengan kedua jenis entitas, menghasilkan entitas elemen pertanyaan/George_Washington, serta tipe kelas entitas, menghasilkan entitas elemen pertanyaan/us_presiden.
N-gram "George Washington" mungkin juga cocok dengan jenis n-gram tergantung pada bagaimana sistem membatasi jumlah jenis n-gram.
Juga, istilah "cook" cocok dengan jenis kata dasar, jenis instance entitas, dan jenis kelas entitas.
Contoh Pertanyaan Perluasan dan Jenis Jawaban
Setelah sistem ini mengidentifikasi jenis elemen pertanyaan yang cocok, Sistem ini kemudian dapat menghasilkan jenis pertanyaan dengan menghasilkan kombinasi elemen pertanyaan yang berbeda pada panjang yang bervariasi dan berbagai tingkat umum.
Hal ini dapat memungkinkan penemuan jenis pertanyaan yang memberikan keseimbangan yang baik antara umum dan spesifisitas.
Misalnya, “cara memasak lasagna”.
Istilah pertama "bagaimana" hanya cocok dengan tipe elemen n-gram.
Tapi, "cook" cocok dengan tipe elemen n-gram, tipe elemen root word, dan tipe elemen kelas entitas untuk kelas "hobi."
Dengan demikian, sistem dapat menghasilkan jenis pertanyaan dua elemen berikut dengan memilih kombinasi yang berbeda dari elemen pertanyaan yang cocok:
(bagaimana, memasak)
(bagaimana, entitas/hobi)
Istilah "lasagna" cocok dengan tipe elemen n-gram dan tipe elemen kelas entitas "piring". Dengan demikian, sistem dapat menghasilkan jenis pertanyaan tiga elemen berikut dengan memilih kombinasi yang berbeda dari elemen pertanyaan yang cocok:
(cara memasak, lasagna)
(cara, memasak, entitas/hidangan)
(cara, entitas/hobi, entitas/hidangan)
(cara, entitas/hobi, lasagna)
Memilih Jenis Elemen Jawaban
Paten mendefinisikan "tipe jawaban" sebagai sekelompok elemen jawaban yang secara kolektif mewakili karakteristik jawaban yang tepat untuk permintaan pencarian jawaban.
Pendekatan kueri pencarian jawaban ini dapat menghasilkan jenis jawaban dengan memproses jawaban tersebut dalam data pelatihan dan memutuskan, untuk setiap jawaban, istilah jawaban mana yang cocok dengan salah satu set jenis elemen jawaban.
Sistem pencarian dapat menghasilkan tipe jawaban dengan menemukan elemen jawaban yang sesuai dengan tipe elemen jawaban.
Beberapa jenis elemen jawaban yang umum, dan elemen jawaban yang sesuai, meliputi:
Pengukuran –Jenis ukuran mungkin cocok dengan istilah yang mewakili pengukuran numerik. Ini dapat mencakup:
- Tanggal, misalnya, “1997,” “Feb. 2, 1997,” atau “19/2/1997”
- Pengukuran fisik, misalnya, "1,85 cm", "12 inci"
- Durasi waktu, “10 menit”, “1 jam”
- Pengukuran numerik lain yang sesuai
N-gram –Tipe n-gram cocok dengan n-gram mana pun dalam jawaban. Untuk menghindari pembuatan tipe jawaban yang terlalu banyak, sistem dapat membatasi elemen jawaban n-gram menjadi n-gram di bawah nilai n tertentu dan itu tidak umum. Misalnya, sistem dapat membatasi elemen jawaban n-gram menjadi 1-gram dan 2-gram yang memiliki skor frekuensi dokumen terbalik yang memenuhi ambang batas.
Kata kerja –Jenis kata kerja cocok dengan istilah apa pun yang ditentukan oleh sistem sebagai kata kerja.
Preposisi –Jenis preposisi cocok dengan istilah apa pun yang ditentukan oleh sistem sebagai preposisi.
Kami diberi tahu bahwa suatu sistem dapat menentukan tipe elemen jawaban untuk setiap part-of-speech.
Namun, dalam beberapa implementasi, sistem mungkin hanya menggunakan jenis kata kerja dan kata depan.
Entity_instance –Jenis instance entitas cocok dengan n-gram yang mewakili instance entitas.
Jenis jawaban dapat mencakup elemen jawaban yang mewakili instance entitas, misalnya, (entitas/Abraham_Lincoln).
N-gram near entity – Tipe n-gram-near-entity menggunakan tipe elemen jawaban n-gram dan tipe elemen jawaban instance entitas dan juga memberlakukan batasan bahwa n-gram muncul di dekat instance entitas dalam sebuah jawaban. Sistem dapat menganggap n-gram berada di dekat instance entitas ketika n-gram:
- Terjadi dalam jawaban dalam jumlah ambang batas istilah dari instance entitas
- Terjadi dalam kalimat yang sama dengan instance entitas
- Terjadi di bagian yang sama dengan instance entitas
Misalnya, dalam jawaban “Obama lahir di Honolulu,” n-gram yang tidak umum “Honolulu” muncul dalam lima suku dari entitas instance “Obama. Jenis jawaban yang dihasilkan mencakup n-gram dan instance entitas, misalnya, (entitas/Obama dekat Honolulu)
Kata kerja di dekat entitas – tipe kata kerja-dekat-entitas menggunakan tipe elemen jawaban kata kerja dan tipe elemen jawaban instans entitas dan dengan cara yang sama memberlakukan batasan bahwa kata kerja muncul di dekat instans entitas dalam sebuah jawaban. Misalnya, untuk "Obama lahir di Honolulu", jenis jawaban yang dihasilkan dapat menyertakan elemen jawaban (entitas/Obama hampir lahir).
Preposisi dekat entitas –Tipe preposisi-dekat-entitas menggunakan tipe elemen jawaban preposisi dan tipe elemen jawaban instans entitas dan dengan cara yang sama memberlakukan batasan bahwa preposisi muncul di dekat instans entitas dalam jawaban. Misalnya, untuk "Obama lahir di Honolulu", jenis jawaban yang dihasilkan dapat menyertakan elemen jawaban (entitas/Obama di dekat)
Kelas kata kerja – Jenis kelas kata kerja cocok dengan n-gram yang mewakili instance kelas kata kerja. Misalnya, sistem dapat mengidentifikasi semua kata kerja berikut sebagai turunan dari kata kerja kelas/campuran: tambah, campur, gabungkan, campur, sambungkan, krim, sekering, gabung, hubungkan, gabungkan, campur, campur, jaringan, pool. Jenis jawaban yang dihasilkan mencakup elemen pertanyaan yang mewakili kelas kata kerja, misalnya (kata kerja/campuran).
Lewati gram –Jenis lewati gram menentukan bigram, serta sejumlah istilah, muncul di antara suku-suku bigram. Misalnya, jika nilai skip adalah 1, skip-gram “where * the” cocok dengan semua n-gram berikut: “where is the,” “where was the,” “where does the,” dan “where has the itu." Jenis jawaban yang dihasilkan mencakup elemen jawaban yang mewakili bigram dan nilai lompatan, misalnya, (di mana * the), di mana tanda bintang tunggal mewakili nilai lompatan 1.
Sistem menghitung jumlah pasangan tipe pertanyaan/tipe jawaban.
Menskor Pasangan Soal dan Jawaban
Paten memberitahu kita bahwa sistem akan menghitung skor untuk setiap jenis pertanyaan/pasangan jenis jawaban.
Skor ini didasarkan pada “kualitas prediktif dari tipe pertanyaan/pasangan tipe jawaban tertentu sebagaimana tercermin dari data pelatihan.”
Pasangan tipe pertanyaan/tipe jawaban dengan skor yang baik cenderung memiliki tipe jawaban dengan satu atau lebih elemen jawaban yang secara kolektif mewakili karakteristik jawaban yang tepat untuk pertanyaan pencarian jawaban yang diwakili oleh tipe pertanyaan.
Sistem biasanya akan menunggu sampai semua hitungan telah dihitung sebelum menghitung skor untuk pasangan jenis pertanyaan/jenis jawaban tertentu.
Dalam beberapa implementasi, sistem menghitung skor informasi timbal balik poin-bijaksana (PMI) untuk setiap pasangan. Skor PMI nol menunjukkan bahwa pertanyaan dan jawaban independen dan tidak ada hubungannya. Skor tinggi, di sisi lain, mewakili kemungkinan yang lebih tinggi untuk menemukan jenis jawaban yang cocok dengan jawaban untuk pertanyaan yang cocok dengan jenis pertanyaan yang sesuai.
Sistem memilih pasangan tipe pertanyaan/tipe jawaban dengan skor terbaik. Mereka mungkin diberi peringkat dan pasangan dapat dipilih yang memiliki skor yang memenuhi ambang batas.
Jenis jawaban dari pasangan yang dipilih cenderung mewakili jawaban yang tepat untuk pertanyaan pencarian jawaban yang diwakili oleh jenis pertanyaan yang sesuai.
Sistem kueri pencarian jawaban ini kemudian dapat mengindeks pasangan jenis pertanyaan/jenis jawaban yang dipilih berdasarkan jenis pertanyaan sehingga sistem dapat secara efisien memperoleh semua jenis jawaban yang terkait dengan jenis pertanyaan tertentu selama penilaian online.
Ini dapat mengurutkan indeks jenis pertanyaan berdasarkan skor untuk membuat keputusan waktu nyata tentang berapa banyak jenis jawaban yang harus dicoba.
Sistem ini dapat mengurutkan setiap jenis jawaban yang terkait dengan jenis pertanyaan berdasarkan skor sehingga jenis jawaban yang memiliki skor tertinggi kemudian dapat diproses terlebih dahulu pada saat permintaan.
Proses Menghasilkan Jawaban untuk Pertanyaan Pencarian Jawaban
Paten ini mengingatkan saya pada paten lain yang pernah saya tulis sebelumnya yang melibatkan menjawab pertanyaan. Paten itu adalah salah satu yang saya tulis di pos, Apakah Google Menggunakan Skema untuk Menulis Bagian Jawaban untuk Cuplikan Unggulan?
Posting itu memberi tahu kami tentang bagaimana Google dapat memilih antara jawaban tekstual yang ditulis dengan baik untuk pertanyaan yang juga memiliki data terstruktur yang terkait dengannya untuk memberikan fakta tambahan pada jawaban tersebut, tetapi tidak memberikan analisis yang dilakukan paten ini dengan melihat elemen jawaban- mencari pertanyaan dan elemen dari jawaban tersebut.
Deskripsi dalam paten ini diakhiri dengan memberikan rincian lebih lanjut tentang bagaimana jawaban dihasilkan secara khusus untuk pertanyaan pencarian jawaban.
Itu dimulai dengan menerima permintaan dan memperoleh hasil pencarian untuk itu
Kemudian menentukan jenis pertanyaan yang cocok dengan kueri tersebut.
Jika kueri tidak cocok dengan salah satu jenis pertanyaan yang dihasilkan, sistem dapat menentukan bahwa kueri tersebut bukan kueri pencarian jawaban.
Jika demikian, ia merespons tanpa kotak jawaban, menampilkan halaman hasil pencarian tanpa jawaban.
Jenis kueri pencarian jawaban ditentukan oleh elemen dari jenis pertanyaan yang cocok. Sistem pencarian kemudian dapat memutuskan bagian teks yang mungkin merupakan jawaban yang baik untuk pertanyaan pencarian jawaban.
Untuk melakukan ini, mungkin mengakses indeks jenis pertanyaan yang mengaitkan setiap jenis pertanyaan yang cocok dengan satu atau lebih jenis jawaban.
Sistem pencarian dapat menghitung skor jawaban sesuai dengan jenis jawaban yang diperoleh dari pencarian.
Sistem pencarian dapat menentukan apakah skor jawaban dengan skor tertinggi memenuhi ambang batas. Jika skor tidak memenuhi ambang batas, sistem dapat memutuskan bahwa jawabannya bukan jawaban yang baik untuk kueri dan dapat menolak untuk menampilkan jawaban tersebut pada halaman hasil pencarian.
Jika skor memenuhi ambang batas, sistem pencarian dapat menyertakan jawaban dengan skor tertinggi di halaman hasil pencarian dan memberikan halaman hasil pencarian sebagai tanggapan atas kueri.
Takeaways Akhir pada Pertanyaan Pencarian Jawaban
Paten ini memberikan beberapa aspek tambahan tentang bagaimana proses yang dijelaskan dalam paten ini bekerja dan menyatakan bahwa itu mungkin juga melibatkan langkah-langkah lain yang belum tentu tercakup.
Saya telah menunjuk setidaknya satu paten lain (yang ada di pertanyaan cara), yang menjelaskan lebih banyak aspek tentang bagaimana jawaban dapat dipilih yang tidak dirinci dalam paten ini juga.
Jadi, masuk akal untuk melihat paten lain yang mencakup aspek tambahan dalam menanggapi pertanyaan yang berfokus secara khusus pada mencari jawaban, seperti yang saya tautkan di atas tentang jawaban bahasa alami dan menanggapi pertanyaan menggunakan bagian jawaban.
Saya juga menulis tentang bagaimana Google dapat menghasilkan grafik pengetahuan dalam menanggapi pertanyaan, dan mempertimbangkan skor asosiasi antara entitas dan klasifikasi dan atribut entitas tersebut untuk menjawab pertanyaan di pos Menjawab Pertanyaan Menggunakan Grafik Pengetahuan.
Kami tidak memiliki panduan yang jelas tentang bagaimana pendekatan dalam berbagai paten yang terkait dengan postingan tersebut mungkin cocok, tetapi perlu diketahui bahwa mereka ada dan mungkin harus dipertimbangkan dalam menentukan bagaimana semuanya cocok bersama ketika Google dapat menanggapi pertanyaan pencarian jawaban mungkin bermanfaat.
