Menjawab Pertanyaan dengan Data Terstruktur
Diterbitkan: 2018-03-21Hanya Fakta, Cepat
Kembali pada tahun 2005, The Official Google Blog menerbitkan sebuah postingan berjudul, Just the Facts, Fast. Baru-baru ini, Google telah menunjukkan jawaban hasil tunggal untuk pertanyaan yang telah menarik banyak perhatian dalam posting seperti, SERP hasil nol: Selamat datang di Masa Depan yang Seharusnya Kita Ketahui Akan Datang.
Menampilkan hanya satu jawaban untuk sebuah pertanyaan, sebagai lawan dari cuplikan unggulan di bagian atas serangkaian pertanyaan tampaknya menarik banyak perhatian.
Penjawab pertanyaan di Google telah berupa jawaban berbasis fakta atas pertanyaan di bagian atas hasil pencarian yang oleh industri SEO disebut sebagai Jawaban Langsung. Kami telah mendengar dari Eric Schmidt bahwa Google ingin menjawab pertanyaan yang mungkin diajukan orang sejauh tahun 2011, seperti yang dicakup dalam posting berjudul, Eric Schmidt: Google ingin menjadi sangat pintar sehingga dapat menjawab pertanyaan Anda tanpa harus menautkan Anda ke tempat lain .
Saya menulis tentang bagaimana Google menemukan fakta untuk pertanyaan seperti itu di pos: Bagaimana Google Menguatkan Fakta untuk Jawaban Langsung, yang mungkin mengingatkan beberapa orang tentang konsistensi NAP (nama-alamat-telepon) yang telah diketahui membantu hasil pencarian lokal.
Saya juga menulis tentang pendekatan yang sedikit berbeda yang mungkin digunakan Google untuk menjawab pertanyaan di mana mereka mungkin merayapi halaman, dan mengumpulkan pertanyaan dan jawaban dan membuat penyimpanan data dari informasi tersebut dari mana mereka dapat memberikan jawaban, dalam posting, Jawaban Langsung – Alami Hasil Pencarian Bahasa untuk Intent Query.

Berbasis Data Terstruktur
Tapi, pertanyaan yang ada di benak saya, seperti mungkinkah Google menggunakan Data Terstruktur, seperti markup Skema untuk menjawab pertanyaan. Itu adalah pertanyaan yang belum dijawab oleh Google, bahkan baru-baru ini ketika kami melihat Google menerbitkan posting berjudul Pengenalan kembali cuplikan fitur Google (Dalam salah satu hal pertama yang diterbitkan oleh Danny Sullivan setelah dia bergabung dengan Google.)
Kami mendapatkan jawaban yang sedikit berbeda dari paten yang baru saja diberikan di Google; yang berfokus pada menjawab pertanyaan. Ini dimulai dengan memberi tahu kami bahwa pencari sering kali menginginkan jawaban atas pertanyaan yang mereka ajukan:
Pengguna sistem pencarian sering mencari jawaban untuk pertanyaan tertentu, daripada daftar sumber daya. Misalnya, pengguna mungkin ingin mengetahui cuaca di lokasi tertentu, harga saham saat ini, ibu kota negara bagian, dll. Saat kueri dalam bentuk pertanyaan diterima, beberapa mesin telusur mungkin melakukan operasi pencarian khusus dalam menanggapi format pertanyaan dari kueri. Misalnya, beberapa mesin pencari dapat memberikan informasi yang responsif terhadap pertanyaan semacam itu dalam bentuk "jawaban", seperti informasi yang diberikan dalam bentuk "satu kotak" untuk sebuah pertanyaan.
Di mana paten ini tampaknya menyimpang dari yang lain tentang menjawab pertanyaan adalah dengan baris berikutnya dalam deskripsi paten:
Beberapa pertanyaan pertanyaan adalah pencarian fakta, dan dengan demikian dilayani dengan baik oleh fakta yang disebutkan dalam data terstruktur, seperti tabel fakta.
Kami telah melihat Skema diperkenalkan pada tahun lalu dalam bentuk informasi tentang fakta Howto tentang bagaimana menyelesaikan beberapa jenis tugas dengan mengikuti urutan kejadian. Itu akan menjadi jawaban yang bagus untuk cuplikan unggulan.
Jadi, ringkasan paten ini masuk ke detail tentang proses di baliknya. Ini memberitahu kita bagaimana itu unik dengan cara ini:
Secara umum, satu aspek inovatif dari materi pelajaran yang dijelaskan dalam spesifikasi ini dapat diwujudkan dalam metode yang mencakup tindakan menerima kueri yang ditentukan menjadi kueri pertanyaan yang mencari jawaban jawaban dan sumber daya pengidentifikasi data yang ditentukan untuk responsif terhadap kueri dan diurutkan menurut peringkat, kueri memiliki istilah kueri; mengidentifikasi kumpulan konten terstruktur dalam subset peringkat teratas dari sumber daya, setiap kumpulan konten terstruktur menjadi konten yang diatur menurut atribut terkait di salah satu sumber daya; untuk setiap kumpulan konten terstruktur yang teridentifikasi, menentukan apakah kueri cocok dengan kumpulan konten terstruktur berdasarkan persyaratan kueri yang cocok dengan atribut terkait dari kumpulan konten terstruktur; memilih salah satu kumpulan konten terstruktur yang kuerinya ditentukan untuk dicocokkan; menghasilkan, dari kumpulan konten terstruktur yang dipilih, kumpulan fakta terstruktur dari atribut terkait yang cocok dengan persyaratan kueri; dan menyediakan kumpulan fakta terstruktur dengan hasil penelusuran yang mengidentifikasi sumber daya yang ditentukan untuk responsif terhadap kueri dan terpisah serta berbeda dari hasil penelusuran.
Keuntungan Menggunakan Data Terstruktur untuk Menjawab Pertanyaan
Ringkasan paten memberikan daftar "keuntungan" di balik penggunaan proses tanya jawab ini:
1. Beberapa sinyal kualitas memastikan bahwa sistem pencarian mendapatkan kecocokan presisi tinggi.
2. Sistem dapat memberikan hasil yang unik dari sumber terstruktur tanpa perlu kurasi manusia.
3. Sistem dapat dengan mudah memberikan jawaban fakta untuk berbagai properti yang kurang dikenal dari entitas terkemuka, misalnya [kepadatan populasi Mongolia], [berapa titik tertinggi di India], [tingkat pertumbuhan populasi Prancis], [quarterback Nebraska Heisman], dll.
4. Kumpulan fakta berdasarkan data terstruktur dapat diberikan sebagai tanggapan atas pertanyaan pertanyaan pencarian fakta.
5. Dengan terlebih dahulu mengidentifikasi konten terstruktur dalam sumber daya dan memproses subset dari konten terstruktur, daya pemrosesan yang diperlukan pada waktu kueri berkurang, yang, pada gilirannya, meningkatkan area teknologi pemrosesan kueri penelusuran.
6. Ini juga memungkinkan akses lebih cepat ke informasi yang paling relevan dengan pencarian pengguna, dan pada gilirannya, meningkatkan pengalaman pengguna.
7. Selain itu, hal ini meningkatkan kemungkinan bahwa kumpulan fakta yang secara langsung menjawab kebutuhan informasi diberikan kepada pengguna, dan pada gilirannya, semakin meningkatkan pengalaman pengguna.
Paten terbaru ini adalah:
Jawab fakta dari konten terstruktur
Penemu: Jayant Madhavan, Hongrae Lee, Warren H.Y Shen dan Sreeram Viswanath Balakrishnan;
Penerima: Google LLC (Mountain View, CA)
Paten AS: 9.916.348
Diberikan: 13 Maret 2018
Diarsipkan: 12 Agustus 2015
Abstrak
Dalam satu aspek, suatu metode termasuk menerima kueri yang ditentukan sebagai kueri pertanyaan yang mencari respons jawaban dan sumber daya pengidentifikasi data yang ditentukan untuk responsif terhadap kueri; mengidentifikasi kumpulan konten terstruktur dalam subset peringkat teratas dari sumber daya, setiap kumpulan konten terstruktur menjadi konten yang diatur menurut atribut terkait di salah satu sumber daya; untuk setiap kumpulan konten terstruktur yang teridentifikasi, menentukan apakah kueri cocok dengan kumpulan konten terstruktur berdasarkan persyaratan kueri yang cocok dengan atribut terkait dari kumpulan konten terstruktur; memilih salah satu kumpulan konten terstruktur yang kuerinya ditentukan untuk dicocokkan; menghasilkan, dari kumpulan konten terstruktur yang dipilih, kumpulan fakta terstruktur dari atribut terkait yang cocok dengan persyaratan kueri; dan menyediakan kumpulan fakta terstruktur dengan hasil penelusuran yang mengidentifikasi sumber daya yang ditentukan untuk responsif terhadap kueri.
Pertanyaan Menjawab Take-Aways
Anda mungkin ingat ketika Google meminta dokter dan orang-orang dari klinik Mayo memperbarui panel pengetahuan dengan cara yang dikuratori oleh manusia. Itu akan sulit dilakukan untuk berbagai domain fakta.
Google memang mengeluarkan makalah beberapa tahun yang lalu yang mencoba menilai sumber fakta yang ditemukan di Web, yang disebut Kepercayaan Berbasis Pengetahuan: Memperkirakan Keterpercayaan Sumber Web. Itu akan menjadi salah satu cara untuk mencoba memastikan bahwa jawaban atas pertanyaan berasal dari sumber yang diketahui benar hampir sepanjang waktu (meskipun bukan jaminan bahwa semua jawaban dari sumber adalah benar.)
Paten tersebut mencakup contoh pertanyaan yang menjawab pertanyaan tentang biaya bagasi untuk maskapai tertentu dan menggunakan tabel data yang berisi informasi biaya bagasi, untuk menghasilkan kotak jawaban yang berisi jawaban fakta dari data terstruktur sebagai tanggapan atas permintaan tersebut.
Paten memberi tahu kita bahwa data terstruktur mungkin berasal dari beberapa jenis sumber daya berbeda yang dapat diidentifikasi menggunakan proses seperti "deteksi tag bahasa markup, instruksi pemformatan, pengidentifikasi file, dll."
Kami juga mempelajari tentang bagaimana templat kueri data terstruktur dapat dibuat dan diindeks untuk memberikan jawaban atas kueri pertanyaan.
Deskripsi dalam paten ini tampaknya berfokus pada tabel berbasis data sebagai sumber data terstruktur yang digunakan sebagai sumber fakta untuk menjawab pertanyaan, seperti biaya bagasi untuk maskapai tertentu. Ini memberikan beberapa contoh terperinci, tentang bagaimana templat kueri yang dapat menjawab kueri semacam itu dapat dibuat.
Kami mungkin mulai melihat Penjawaban Pertanyaan menggunakan Data Terstruktur untuk menjawab pertanyaan di masa mendatang, dan mereka mungkin menggunakan pendekatan yang berbeda dari tabel, seperti dalam contoh dari paten. Itu bisa menggunakan data terstruktur dari sumber seperti JSON-LD. Kita mungkin harus menjelajahinya lebih jauh ketika kita melihatnya,

