Google Mengubah Cara Mereka Memahami Nama Tempat dalam Grafik Pengetahuan

Diterbitkan: 2018-02-16

Nama Tempat di Grafik Pengetahuan Google

Sebelum Google memiliki Grafik Pengetahuan, Google telah membangun Gudang Fakta. Google telah mengajukan paten untuk Browseable Fact Repository mereka pada tahun 2006, dan saya menulis tentang paten itu dalam sebuah posting berjudul, Google's Browseable Fact Repository – sebuah Grafik Pengetahuan Awal. Salah satu penemu Fact Repository adalah Andrew W. Hogue, yang bertanggung jawab atas sebuah proyek di Google yang disebut sebagai Annotation Framework dan juga terlibat dalam akuisisi Meta Web oleh Google, yang telah membangun basis pengetahuan. dikenal sebagai Freebase, dan yang mengarah pada pembuatan Grafik Pengetahuan di Google. Ketika Anda melihat Repositori Fakta direferensikan di Google, pikirkan Basis Pengetahuan.

Salah satu jenis fakta penting yang muncul dalam kumpulan dokumen seperti Web adalah nama tempat.

Google telah diberikan paten yang awalnya diajukan pada tahun 2007 dengan nama Menentukan lokasi geografis untuk nama tempat dalam repositori fakta.

Seperti yang baru-baru ini saya tulis dalam posting Skor Entitas Terkait dalam Pencarian Berbasis Pengetahuan, Google dapat menggunakan informasi tentang properti entitas untuk memberikan hasil pencarian. Jadi, ketika Google mengekstrak data untuk basis pengetahuan, seperti nama tempat, itu adalah fakta penting yang dapat membantu untuk memperbaikinya. Basis pengetahuan lebih kaya dan lebih berguna untuk memiliki jenis informasi yang benar.

Paten Nama Tempat yang Diperbarui dari Google

Google diberikan versi lanjutan dari paten mereka tentang nama tempat dan repositori fakta minggu ini. Paten lanjutan adalah paten yang diperbarui yang menggunakan tanggal pengajuan asli dari paten yang dilanjutkan dan biasanya berisi teks dan gambar deskripsi yang sangat mirip tetapi memiliki klaim yang diperbarui. Jika kita melihat paten asli yang diajukan pada tahun 2007 dan paten lanjutan yang diajukan pada tahun 2012, kita dapat melihat bahwa klaim telah berubah dari paten sebelumnya menjadi paten yang lebih baru dan baru saja diberikan.

Salah satu perhatian yang tampaknya memainkan peran penting dalam versi pertama dari paten adalah untuk mendapatkan fakta tentang nama tempat yang benar. Paten memberi tahu kami tentang masalah ini:

Nama tempat yang diambil dari sumber yang berbeda memiliki berbagai format dan mungkin mengandung kesalahan ketik, kelalaian, atau bahasa yang tidak jelas. Mungkin juga ada ambiguitas tentang apakah sebuah kata mewakili nama tempat dan apakah nama tempat yang berbeda mewakili lokasi yang sama. Hal ini berguna untuk memiliki cara untuk mengidentifikasi lokasi yang tepat dari nama tempat.

Klaim dari versi pertama paten mengingatkan saya pada posting yang saya tulis berjudul Bagaimana Google Menguatkan Fakta untuk Jawaban Langsung.

Kami melihat baris seperti ini yang telah dihapus dari klaim dalam versi kedua paten:

2. Metode klaim 1, di mana mengidentifikasi nama tempat potensial pertama, terdiri dari pemeriksaan urutan satu atau lebih kata dengan huruf kapital.

3. Metode klaim 1, di mana mengidentifikasi nama tempat potensial pertama, terdiri dari mengidentifikasi nama tempat potensial kedua dalam nilai dan memeriksa kata-kata yang mengelilingi nama tempat potensial kedua.

4. Metode klaim 1, di mana mengidentifikasi nama tempat potensial pertama, terdiri dari mengidentifikasi berbagai representasi dari nama tempat yang sama.

5. Metode klaim 1, dimana atribut telah ditentukan sesuai dengan nama tempat dengan membandingkan fakta yang mengandung atribut yang sama

Saya teringat konsistensi NAP (Nama, alamat, nomor telepon) yang dibahas dalam penyebutan tempat dalam pencarian lokal untuk Google.

Versi baru paten lebih berfokus pada penandaan nama tempat karena disebutkan dengan koordinat geografis, seperti garis lintang dan garis bujur (seperti yang terlihat pada ilustrasi paten). Jika kita melihat beberapa klaim awal untuk paten baru, kita melihat fokus baru ini:

2. Metode klaim 1, di mana menyimpan koordinat lokasi geografis pertama, termasuk menandai nama tempat potensial pertama dengan koordinat lokasi geografis pertama.

3. Metode klaim 2, di mana penandaan mencakup pengubahan nama tempat potensial pertama menjadi hyperlink ke tampilan peta.

4. Metode klaim 1, dimana disambiguasi antara kemungkinan koordinat lokasi geografis yang bertentangan, termasuk memeriksa dokumen sumber dari dokumen sumber untuk konteksnya.

5. Metode klaim 1, dimana penentuan koordinat lokasi geografis untuk nama tempat potensial pertama terdiri dari pemeriksaan sejumlah nama tempat. Masing-masing pluralitas nama tempat telah diberi tag sebelumnya dengan koordinat lokasi geografisnya masing-masing.

Versi baru paten ada di sini:

Menentukan lokasi geografis untuk nama tempat di gudang fakta
Penemu: David J. Vespe dan Andrew Hogue
Penerima tugas: Google LLC
Paten AS: 9.892.132
Diberikan: 13 Februari 2018
Diarsipkan: 31 Desember 2012

Abstrak

Sebuah sistem dan metode untuk menandai nama tempat dengan koordinat lokasi geografis, nama tempat yang terkait dengan kumpulan objek dalam memori sistem komputer. Sistem dan metode memproses string teks dalam objek yang disimpan dalam memori untuk mengidentifikasi nama tempat potensial pertama. Sistem dan metode menentukan apakah koordinat lokasi geografis diketahui untuk nama tempat potensial pertama. Sistem dan metode mengidentifikasi nama tempat potensial pertama yang terkait dengan objek dalam memori sebagai nama tempat. Sistem dan metode menandai nama tempat pertama yang diidentifikasi terkait dengan objek dalam memori dengan koordinat lokasi geografisnya ketika koordinat lokasi geografis untuk nama tempat yang diidentifikasi pertama diketahui. Sistem dan metode membedakan nama tempat ketika beberapa nama tempat ditemukan.

Renungan tentang Nama Tempat

Saya memiliki seseorang yang bertanya kepada saya di Twitter apakah paten terkadang menjadi tidak berguna dan berhenti digunakan oleh mesin pencari, atau jika mesin pencari terpaksa menggunakan penemuan yang mereka patenkan karena masih ada waktu tersisa untuk mereka. Paten memang kedaluwarsa. Paten satu klik yang diperoleh Amazon telah kedaluwarsa, dan paten PageRank asli yang dimiliki oleh Universitas Stanford (dan dilisensikan ke Google) telah kedaluwarsa. Ketika suatu proses dikembangkan dan dipatenkan, proses di balik paten dapat berubah, dan paten lanjutan seperti yang saya tulis di posting ini dapat diajukan.

Jika Anda mengawasinya, paten lanjutan dapat memberikan petunjuk tentang perubahan pendekatan yang mungkin diambil perusahaan. Misalnya, dalam paten nama tempat ini, fokus tampaknya bergeser dari fakta yang menguatkan berdasarkan konsistensi ejaan dan fakta yang disebutkan tentang entitas tertentu ke beberapa fakta yang mungkin tidak berubah, seperti koordinat geografis. Jadi, ya, paten memang berubah, begitu pula proses di belakangnya. Sangat menarik untuk menemukan paten lanjutan dan mencoba memahami apa yang mungkin telah berubah.