SEO Beralih ke Grafik Data untuk Mempelajari Tentang Web

Diterbitkan: 2021-02-23

Web sebagai Grafik Data adalah Arah Baru untuk SEO

Banyak artikel yang ditulis orang tentang SEO melibatkan halaman web dan tautan antar halaman. Namun, posting ini adalah tentang entitas dan hubungan antara entitas dan fakta yang ditulis di halaman web. Itu juga melihat tanggapan terhadap kueri dari grafik data di web tentang fakta dan atribut yang terkait dengan entitas yang ditemukan di halaman web. Baru-baru ini saya menemukan pengajuan paten di situs WIPO (Organisasi Kekayaan Intelektual Dunia) yang menurut saya layak untuk ditulis. Paten dimulai dengan memberi tahu kami bahwa ini tentang:

Grafik data besar menyimpan data dan aturan yang menggambarkan pengetahuan tentang data dalam bentuk yang menyediakan penalaran deduktif.

Judul paten memberi tahu kita bahwa ini idealnya tentang mengirimkan kueri ke mesin pencari dalam bahasa alami (cara orang berbicara dan komputer mencoba memahami.)

Paten menunjukkan kepada kita contoh yang terkait dengan grafik data, entitas, seperti orang, tempat, benda, konsep, dll., yang dapat disimpan sebagai node. Tepi antara node tersebut dapat menunjukkan hubungan antara node (fakta yang dapat ditemukan orang keluar tentang entitas tersebut Dalam SEO, kita terbiasa mendengar tentang halaman web dan node dan link antara halaman tersebut sebagai tepi.

Pendekatan entitas ini adalah cara yang berbeda dalam melihat node dan edge. Kami baru-baru ini melihat orang berbicara tentang penyebutan entitas sebagai ganti tautan yang menyebutkan halaman. Ini adalah salah satu cara SEO bergerak maju untuk memikirkan objek dunia nyata seperti entitas ketika berbicara tentang database besar seperti web. Paten kedua dari Google (yang sementara) yang saya ketahui adalah tentang fakta dan basis data yang besar. Saya menulis tentang itu di Penemuan Pencarian Semantik Pertama Google telah Dipatenkan pada tahun 1999.

Saya menulis tentang paten yang lebih baru di Google tentang bagaimana mesin pencari dapat membaca web dan mengekstrak informasi entitas darinya dan menggunakan Web sebagai basis data besar yang tersebar. Posting itu adalah Ekstraksi Entitas untuk Grafik Pengetahuan di Google. Kami telah melihat informasi online tentang program pra-pelatihan seperti BERT yang dapat menandai kata-kata dalam dokumen dengan part of speech. Itu juga dapat mengidentifikasi dan mengenali entitas yang diekstraksi dari halaman dan dipelajari oleh mesin pencari.

Paten terbaru ini memberi tahu kita bahwa dalam grafik data seperti itu, simpul seperti "Maryland" dan "Amerika Serikat" dapat dihubungkan oleh tepi "dalam negara" dan/atau "telah dinyatakan".

Kami juga diberitahu bahwa unit dasar grafik data tersebut adalah tupel yang mencakup dua entitas dan hubungan antara entitas.

Tupel tersebut mungkin mewakili fakta dunia nyata, seperti "Maryland adalah negara bagian di Amerika Serikat."

Tuple juga dapat mencakup informasi lain, seperti informasi konteks, informasi statistik, informasi audit, dll.

Menambahkan entitas dan hubungan ke grafik data biasanya merupakan proses manual, membuat grafik data besar menjadi sulit dan lambat.

Dan kesulitan dalam membuat grafik data yang besar dapat mengakibatkan banyak entitas “hilang” dan hubungan “hilang” antar entitas yang ada sebagai fakta tetapi belum ditambahkan ke grafik.

Entitas dan hubungan yang hilang tersebut mengurangi kegunaan kueri grafik data.

Beberapa implementasi mengekstrak pengetahuan sintaksis dan semantik dari teks, seperti dari Web, dan menggabungkannya dengan pengetahuan semantik dari grafik data.

Membangun Keyakinan Tentang Hubungan Antara Entitas dan Fakta

Pengetahuan yang diekstraksi dari teks dan grafik data digunakan sebagai input untuk melatih algoritma pembelajaran mesin untuk memprediksi tupel untuk grafik data.

Algoritme pembelajaran mesin yang terlatih dapat menghasilkan beberapa fitur berbobot untuk hubungan tertentu, setiap fitur mewakili kesimpulan tentang bagaimana dua entitas mungkin terkait.

Nilai absolut dari bobot suatu fitur dapat mewakili kepentingan relatif dalam pengambilan keputusan. Google telah menunjukkan dalam paten lain bahwa mereka mengukur kepercayaan antara hubungan semacam itu dan menyebut bobot itu "skor asosiasi."

Algoritme pembelajaran mesin yang terlatih kemudian dapat membuat tupel tambahan dari grafik data dari analisis dokumen dalam korpus besar dan informasi yang ada dalam grafik data.

Metode ini menyediakan banyak tupel tambahan untuk grafik data, sangat memperluas grafik data tersebut.

Dalam beberapa implementasi, setiap tupel yang diprediksi dapat dikaitkan dengan skor kepercayaan, dan hanya tupel yang memenuhi ambang yang secara otomatis ditambahkan ke grafik data.

Fakta yang diwakili oleh tupel yang tersisa dapat diverifikasi secara manual sebelum ditambahkan ke grafik data.

Beberapa implementasi memungkinkan pertanyaan bahasa alami dijawab dari grafik data.

Modul pembelajaran mesin dapat memetakan fitur ke kueri dan fitur yang digunakan untuk memberikan kemungkinan hasil kueri.

Pelatihan mungkin melibatkan penggunaan contoh-contoh positif dari catatan pencarian atau hasil kueri yang diperoleh dari mesin pencari berbasis dokumen.

Modul pembelajaran mesin yang terlatih dapat menghasilkan beberapa fitur berbobot, di mana setiap fitur mewakili satu kemungkinan jawaban kueri, yang diwakili oleh jalur dalam grafik data.

Nilai absolut dari bobot fitur merepresentasikan kepentingan relatif dalam pengambilan keputusan.

Setelah modul pembelajaran mesin dilatih dengan benar dengan beberapa fitur berbobot, modul ini dapat merespons kueri bahasa alami menggunakan informasi dari grafik data.

Buat Grafik Data

Metode yang diterapkan komputer mencakup menerima modul pembelajaran mesin yang dilatih untuk menghasilkan model dengan beberapa fitur berbobot untuk kueri. Setiap fitur berbobot mewakili jalur dalam grafik data.

Metode ini juga mencakup menerima kueri penelusuran yang menyertakan istilah penelusuran pertama, memetakan kueri penelusuran ke kueri, memetakan istilah penelusuran pertama ke entitas pertama dalam grafik data, dan mengidentifikasi entitas kedua dalam grafik data menggunakan entitas pertama dan setidaknya satu dari beberapa fitur berbobot.

Fitur tersebut juga dapat mencakup penyediaan informasi yang berkaitan dengan entitas kedua sebagai tanggapan atas permintaan pencarian.

Kueri mungkin merupakan kueri bahasa alami.

Sebagai contoh lain, metode tersebut dapat mencakup pelatihan model pembelajaran mesin untuk menghasilkan model, yang merupakan fokus dari paten ini.

Memperoleh Hasil Pencarian Dari Kueri Bahasa Alami Dari Grafik Data

Melatih modul pembelajaran mesin dapat mencakup menghasilkan jawaban kueri yang berisik dan membuat contoh pelatihan positif dan negatif dari jawaban kueri yang berisik.

Menghasilkan jawaban kueri yang bising dapat mencakup memperoleh hasil pencarian dari mesin pencari untuk korpus dokumen, setiap hasil memiliki skor kepercayaan dan menghasilkan contoh pelatihan dapat mencakup memilih sejumlah dokumen dengan skor tertinggi yang telah ditentukan sebagai contoh pelatihan positif dan memilih sejumlah dokumen yang telah ditentukan sebelumnya. dokumen dengan skor di bawah ambang batas sebagai contoh pelatihan negatif.

Memperoleh hasil pencarian dapat mencakup membaca hasil pencarian dari catatan pencarian untuk kueri sebelumnya.

Membuat contoh pelatihan positif dan negatif dapat mencakup melakukan pencocokan entitas pada jawaban kueri dan memilih entitas yang paling sering muncul sebagai contoh pelatihan positif.

Metode ini juga dapat mencakup penentuan skor kepercayaan (seperti skor asosiasi yang dirujuk di atas) untuk entitas kedua berdasarkan bobot setidaknya satu fitur berbobot.

Mengidentifikasi entitas kedua dalam grafik juga dapat mencakup pemilihan entitas kedua berdasarkan skor keyakinan, dan menentukan skor keyakinan untuk entitas kedua dapat mencakup penentuan bahwa dua atau lebih fitur terhubung ke entitas kedua dan menggunakan kombinasi bobot dua atau lebih fitur sebagai skor kepercayaan untuk entitas kedua.

Metode yang diterapkan komputer mencakup pelatihan modul pembelajaran mesin untuk membuat beberapa fitur berbobot untuk kueri dan meminta kueri.

Metode ini juga mencakup penentuan entitas pertama dari permintaan kueri, entitas pertama yang ada dalam grafik data yang memiliki entitas dan tepi, dan menyediakan entitas pertama dan kueri ke modul pembelajaran mesin.

Metode ini juga dapat mencakup menerima subset dari beberapa fitur berbobot dari modul pembelajaran mesin; dan menghasilkan respons terhadap permintaan yang mencakup informasi yang diperoleh dengan menggunakan subset dari beberapa fitur berbobot.

Ini dapat mencakup satu atau beberapa fitur berikut. Misalnya, pelatihan modul pembelajaran mesin dapat mencakup:

  • Memilih contoh positif dan contoh negatif dari grafik data untuk kueri
  • Memberikan contoh positif, contoh negatif, dan grafik data ke modul pembelajaran mesin untuk pelatihan
  • Menerima beberapa fitur berbobot dari modul pembelajaran mesin, setiap fitur mewakili perjalanan dalam grafik data
  • Menyimpan setidaknya beberapa fitur berbobot ganda dalam model yang terkait dengan kueri

Beberapa fitur yang akan mengikuti proses ini dapat mencakup membatasi panjang jalur untuk fitur hingga panjang yang telah ditentukan, panjang jalur adalah jumlah tepi yang dilalui di jalur untuk fitur tertentu, dan/atau contoh positif dan negatif dihasilkan dari catatan pencarian untuk mesin pencari berbasis dokumen.

Fitur berbobot ganda dapat mengecualikan fitur yang muncul kurang dari beberapa kali yang telah ditentukan sebelumnya dalam grafik data.

Membangkitkan respons terhadap kueri dapat mencakup penentuan entitas kedua dalam grafik data dengan bobot tertinggi dan menyertakan informasi dari entitas kedua dalam respons.

Bobot entitas kedua dapat berupa jumlah bobot setiap fitur yang terkait dengan entitas kedua. Dengan demikian, kueri dapat mewakili sekelompok kueri.

Juga, sistem komputer dapat mencakup memori yang menyimpan grafik data berlabel tepi terarah yang dibangun menggunakan tupel, di mana setiap tupel mewakili dua entitas yang dihubungkan oleh suatu hubungan, setidaknya satu prosesor, dan instruksi penyimpanan memori yang, ketika dieksekusi oleh setidaknya satu prosesor , dapat menyebabkan sistem komputer melakukan operasi.

Operasi tersebut dapat mencakup:

  • Menerima permintaan
  • Menghasilkan jawaban kueri untuk kueri
  • Menghasilkan contoh pelatihan positif dan negatif dari jawaban kueri
  • Memberikan contoh positif, contoh negatif, dan grafik data ke modul pembelajaran mesin untuk pelatihan

Operasi juga dapat mencakup menerima sejumlah fitur dari modul pembelajaran mesin untuk kueri dan menyimpan sejumlah fitur sebagai model yang terkait dengan kueri dalam modul pembelajaran mesin.

Fitur berikut harus digunakan: fitur berbobot dan kueri menjadi kueri bahasa alami.

Jumlah fitur juga dapat mengecualikan fitur yang muncul kurang dari frekuensi yang telah ditentukan sebelumnya dalam grafik data dan fitur dengan kemungkinan mencapai target yang benar yang berada di bawah ambang batas yang telah ditentukan.

Sebagai bagian dari menghasilkan jawaban kueri, instruksi, ketika dijalankan oleh setidaknya satu prosesor, dapat:

  • Menyebabkan sistem komputer mengidentifikasi templat kueri untuk kueri
  • Periksa catatan pencarian untuk kueri yang cocok dengan template kueri
  • Dapatkan hasil pencarian dari catatan pencarian untuk kueri yang cocok dengan template kueri

Sebagai bagian dari menghasilkan contoh pelatihan positif dan negatif, instruksinya:

  • Menyebabkan sistem komputer mengekstrak entitas sumber dari kueri dalam rekaman pencarian yang cocok dengan templat kueri
  • Ekstrak entitas dari hasil pencarian kueri yang cocok dengan template kueri
  • Tentukan berapa kali entitas target muncul di hasil pencarian kueri yang cocok dengan template kueri
  • Gunakan entitas sumber dan entitas target sebagai contoh pelatihan positif jika berapa kali memenuhi ambang batas

Fitur mungkin berbobot.

Masing-masing fitur dapat memiliki bobot terkaitnya sendiri.

Fitur dapat berupa jalur melalui grafik data dengan skor kepercayaan terkait. Jalur dapat mewakili urutan tepi dalam grafik data.

Paten memberi tahu kita tentang keuntungan berikut dari penggunaan proses dalam paten Grafik Data Kueri:

  1. Implementasi dapat secara otomatis memperluas grafik data dengan membaca informasi relasional dari korpus teks besar, seperti dokumen yang tersedia melalui Internet atau korpora lain dengan lebih dari satu juta dokumen, dan menggabungkan informasi ini dengan informasi yang ada dari grafik data
  2. Implementasi tersebut dapat membuat jutaan tupel baru untuk grafik data dengan akurasi tinggi
  3. Beberapa implementasi juga dapat memetakan kueri bahasa alami ke jalur dalam grafik data untuk menghasilkan hasil kueri dari grafik data
  4. Satu kesulitan dengan kueri bahasa alami adalah menemukan kecocokan antara hubungan atau tepi dalam grafik data dengan kueri
  5. Beberapa implementasi melatih modul pembelajaran mesin untuk melakukan pemetaan, membuat kueri bahasa alami dari grafik menjadi mungkin tanpa tabel sinonim yang dimasukkan secara manual yang bisa sulit untuk diisi, dipelihara, dan diverifikasi
  6. habis-habisan

Paten ini dapat ditemukan di sini:

Membuat Kueri Grafik Data Menggunakan Kueri Bahasa Alami
Penemu Amarnag Subramanya, Fernando Pereira, Ni Lao, John Blitzer, Rahul Guptag
Pelamar GOOGLE LLC
US20210026846
Tanggal Pengajuan Paten 13 Oktober 2020
Nomor Paten 20210026846
Diberikan: 28 Januari 2021

Abstrak

Implementasinya meliputi sistem dan metode query grafik data. Metode contoh termasuk menerima modul pembelajaran mesin yang dilatih untuk menghasilkan model dengan beberapa fitur untuk kueri, setiap fitur mewakili jalur dalam grafik data.

Metode ini juga mencakup menerima kueri penelusuran yang menyertakan istilah penelusuran pertama, memetakan kueri penelusuran ke kueri, dan memetakan istilah penelusuran pertama ke entitas pertama dalam grafik data.

Metode ini juga dapat mencakup pengidentifikasian entitas kedua dalam grafik data menggunakan entitas pertama dan setidaknya satu dari beberapa fitur berbobot dan memberikan informasi yang berkaitan dengan entitas kedua sebagai tanggapan atas kueri penelusuran.

Beberapa implementasi juga dapat mencakup pelatihan modul pembelajaran mesin dengan, misalnya, menghasilkan contoh pelatihan positif dan negatif dari jawaban atas kueri.

Memahami Grafik Data Lebih Baik

Sistem inferensi sintaksis-semantik seperti yang dijelaskan dalam paten dengan contoh implementasi.

Sistem ini dapat digunakan untuk melatih modul pembelajaran mesin untuk mengenali beberapa fitur berbobot atau berjalan dalam grafik data, untuk menghasilkan tupel baru untuk grafik data berdasarkan informasi yang sudah ada dalam grafik dan/atau berdasarkan dokumen teks yang diuraikan, seperti yang saya periksa dalam paten Ekstraksi Entitas yang saya tautkan di atas atau paten lain tentang rekonsiliasi grafik Pengetahuan yang juga telah saya tulis.

Sistem dapat bekerja untuk menghasilkan hasil pencarian dari grafik data dari kueri bahasa alami.

Paten ini menjelaskan sistem yang akan menggunakan dokumen yang tersedia melalui Internet.

Namun, kami diberitahu bahwa konfigurasi dan aplikasi lain dapat digunakan.

Ini dapat mencakup dokumen yang berasal dari korpus dokumen lain, seperti dokumen internal yang tidak tersedia melalui Internet atau korpus pribadi lainnya, dari perpustakaan, buku, korpus data ilmiah, atau korpus besar lainnya.

Sistem inferensi sintaksis-semantik dapat berupa perangkat komputasi atau perangkat yang berbentuk beberapa perangkat yang berbeda, misalnya, server standar, sekelompok server tersebut, atau sistem server rak.

Sistem inferensi sintaksis-semantik dapat mencakup grafik data. Graf data dapat berupa graf berlabel sisi berarah. Grafik data seperti itu menyimpan node dan edge.

Node dalam grafik data mewakili suatu entitas, seperti orang, tempat, item, ide, topik, konsep abstrak, elemen konkret, hal lain yang cocok, atau kombinasi dari semuanya.

Entitas dalam grafik data mungkin terkait satu sama lain dengan tepi yang mewakili hubungan antar entitas.

Misalnya, grafik data mungkin memiliki entitas yang sesuai dengan aktor Kevin Bacon. Selain itu, grafik data mungkin telah bertindak dalam hubungan antara entitas Kevin Bacon dan entitas yang mewakili film yang dibintangi Kevin Bacon.

Grafik data dengan banyak entitas dan bahkan sejumlah hubungan terbatas mungkin memiliki miliaran koneksi.

Dalam beberapa implementasi, grafik data dapat disimpan dalam perangkat penyimpanan eksternal yang dapat diakses dari sistem.

Dalam beberapa implementasi, grafik data dapat didistribusikan ke beberapa perangkat penyimpanan dan/atau beberapa perangkat komputasi, misalnya, beberapa server.

Paten memberikan detail lebih lanjut tentang penilaian kepercayaan fakta, penandaan bagian ucapan kata-kata dalam korpus, ekstraksi entitas.

Ini secara khusus melihat Miles Davis, John Coltrane, dan New York dan menggunakan resolusi koreferensi untuk memahami kata ganti dalam dokumen dengan lebih baik.

Grafik teks yang dihasilkan menurut paten juga dapat ditautkan ke grafik data.

Paten memberi tahu kita bahwa penautan dapat terjadi melalui resolusi entitas atau menentukan entitas mana dari grafik data yang cocok dengan frasa kata benda dalam dokumen.

Kami kembali ke gagasan menggunakan penyebutan dalam SEO dengan pernyataan seperti ini dari paten:

Pencocokan dapat menerima tautan penyebutan antara entitas dan frasa kata benda, seperti yang ditunjukkan oleh tautan dan 210′ ​​dari Gambar. 2.

Ini berbeda dari tautan yang kita lihat di HTML tetapi patut diperhatikan. Paten memberi tahu kita tentang hubungan antara node dan edge seperti ini dalam grafik data:

Tepi mewakili tepi dari entitas grafik data ke frase kata benda dalam dokumen. Tepi′ mewakili tepi sebaliknya, dari frase kata benda ke entitas.

Jadi, seperti yang ditunjukkan pada Gambar. 2, tepi yang menghubungkan grafik data ke grafik teks dapat mengarah dari entitas ke frasa kata benda dalam arah maju dan dari frasa kata benda ke arah sebaliknya entitas.

Tentu saja, Tepi depan mungkin memiliki tepi terbalik yang sesuai, dan Tepi terbalik′ mungkin memiliki tepi depan yang sesuai, meskipun tepi ini tidak ditunjukkan pada gambar.

Paten menjelaskan penggunaan skor kepercayaan dan bobot fitur untuk mempercayai entitas menggunakan kueri seperti ini, di mana kita diberitahu tentang pelatihan menggunakan sistem ini:

Dalam beberapa implementasi, mesin pelatihan dapat dikonfigurasi untuk menggunakan grafik teks yang dihasilkan oleh mesin pengurai sintaksis-semantik dari dokumen yang dirayapi yang ditautkan ke grafik data untuk menghasilkan data pelatihan untuk modul pembelajaran mesin.

Mesin pelatihan dapat menghasilkan data pelatihan dari jalan-jalan yang dibatasi jalur secara acak dalam grafik yang ditautkan.

Jalan acak dapat dibatasi oleh panjang lintasan, yang berarti bahwa lintasan dapat melintasi jumlah tepi maksimum.

Menggunakan data pelatihan, mesin pelatihan dapat melatih modul pembelajaran mesin untuk menghasilkan beberapa fitur berbobot untuk hubungan tertentu, atau dengan kata lain, untuk menyimpulkan jalur untuk hubungan tertentu.

Fitur yang dihasilkan oleh modul pembelajaran mesin adalah grafik walk-in-the-data saja atau kombinasi grafik data dan grafik teks.

Misalnya, jika entitas A terkait dengan entitas B oleh tepi t1, dan B terkait dengan entitas C oleh tepi t2, A terkait dengan C oleh fitur {t1, t2}.

Bobot fitur dapat mewakili keyakinan bahwa jalur mewakili fakta.

Paten menunjukkan kepada kita contoh pelatihan positif yang mengajarkan algoritme pembelajaran mesin untuk menyimpulkan profesi entitas seseorang berdasarkan profesi orang lain yang disebutkan bersama dengan orang kueri.

Lihat gambar unggulan di halaman pertama blog ini yang menyertakan orang dan sebutan untuk profesi orang-orang itu (tersedia di bawah juga sekarang). Paten memberi tahu kita bahwa fitur tersebut dapat muncul sebagai {Sebutkan, konj, Sebutkan 1, Profesi}, di mana Sebutan mewakili tepi yang disebutkan yang menghubungkan grafik data ke grafik teks, konj adalah tepi dalam grafik teks, Sebutkan 1 mewakili tepi yang disebutkan yang menghubungkan grafik teks ke grafik data, dan Profesi adalah tepi dalam grafik data yang menghubungkan entitas untuk seseorang ke entitas yang mewakili profesi.

Membuat Kueri Grafik Data Diunggulkan

Kami kemudian diberitahu dalam paten:

Jika entitas orang dalam grafik data ditautkan ke entitas profesional dalam grafik data melalui jalur atau fitur ini, mesin penemuan pengetahuan dapat menyimpulkan bahwa grafik data harus menyertakan keunggulan profesional antara dua entitas.

Fitur tersebut mungkin memiliki bobot yang membantu mesin penemuan pengetahuan memutuskan apakah tepi harus ada dalam grafik data atau tidak.

Kami juga mempelajari contoh dengan modul pembelajaran mesin yang dilatih untuk memetakan kueri untuk “pasangan”, “istri”, “suami”, “orang penting lainnya”, dan “menikah dengan” ke berbagai jalur dalam grafik data, berdasarkan data pelatihan.

Kueri tersebut dapat dikelompokkan sehingga modul pembelajaran mesin dapat dilatih untuk kelompok kueri.

Dan kueri dapat merujuk ke sekelompok kueri dengan arti serupa.

Paten memberikan banyak contoh bagaimana grafik data tentang beberapa entitas dapat dipelajari menggunakan contoh di atas. Pelatihan tersebut kemudian dapat digunakan untuk menjawab pertanyaan dari grafik data. Selain itu, paten memberi tahu kita bahwa ia dapat menggunakan informasi dari sumber selain internet, seperti indeks berbasis dokumen, dan dapat menggabungkan hasil dari grafik data dengan hasil dari indeks berbasis dokumen.

Paten ini juga memiliki bagian besar tentang bagaimana Google dapat memperluas grafik data. Prosesnya terdengar sangat mirip dengan yang saya jelaskan ketika saya menulis tentang ekstraksi entitas, yang saya tautkan di atas. Kami diberitahu bahwa grafik data dapat melibatkan pembelajaran dari jutaan dokumen.

Paten juga memiliki bagian tentang mengaitkan tupel yang disimpulkan dengan skor kepercayaan menggunakan modul Pembelajaran Mesin. Ini juga memberi tahu kita tentang memeriksa skor kepercayaan untuk tupel yang disimpulkan terhadap ambang batas.

Tujuan Query Data Graph Menggunakan Natural Language Queires

Paten ini memberi tahu kita tentang bagaimana grafik data dapat dibuat untuk mengidentifikasi entitas dan tupel yang terkait dengannya. Itu bisa membangun grafik data yang memahami skor kepercayaan antara entitas dan fakta yang terkait dengannya dan memahami entitas serupa dengan atribut serupa. Itu akan menggunakan grafik data tersebut untuk menjawab pertanyaan tentang semua entitas tersebut. Pendekatan ini akan mendapat manfaat dari membaca Web dan mengumpulkan informasi tentang entitas dan fakta tentang mereka saat menemukan mereka. Saya telah merangkum banyak aspek paten dan merekomendasikan membacanya untuk mempelajari lebih lanjut tentang detailnya secara lebih mendalam. Terakhir, saya ingin menjelaskan bagaimana ia belajar dari web yang ditemuinya dan membangun pengetahuan itu untuk menjawab pertanyaan yang diajukan orang.

Saya menduga bahwa kita akan menemukan lebih banyak paten yang menjelaskan pendekatan terkait yang mungkin digunakan mesin pencari untuk lebih memahami dunia melalui apa yang dibacanya.