Bagaimana Google Dapat Menggunakan Ulasan untuk Mempelajari Tentang Atribut Entitas
Diterbitkan: 2018-09-06
Tentang Atribut Entitas
Ketika kita melihat Google berbicara tentang properti entitas yang berbeda, mereka sering menyebutnya sebagai atribut entitas dan sering mendefinisikannya dalam pasangan kunci/nilai. Misalnya, Abraham Lincoln memiliki tinggi 6'4″. Alphabet adalah perusahaan induk dengan kantor pusat di Mountain View, California. Paul Newman memiliki mata biru. Fortnite adalah gim multipemain.
Beberapa ulasan online secara khusus tentang entitas seperti produk, pembuat produk, dan/atau vendor produk. Tinjauan ini mungkin berisi informasi tentang atribut entitas yang mungkin diminati oleh penelusur. Paten yang diberikan kepada Google minggu lalu memberi tahu kita bahwa paten tersebut dapat mengumpulkan informasi tentang atribut entitas dari ulasan yang mungkin diminati oleh penelusur, dan bagaimana mereka dapat melakukannya. Ini penting, karena seperti yang dikatakan paten kepada kita:
Jenis tinjauan pengguna ini dapat mencakup informasi tentang entitas yang mungkin tidak disediakan atau dibuat, misalnya, oleh entitas itu sendiri.
Informasi Tentang Entitas Atribut Beralih Dari Ulasan ke Indeks Google
Proses yang melibatkan atribut entitas ini mungkin melibatkan:
(1) Mengidentifikasi , berdasarkan kumpulan kueri pengguna, satu atau lebih kategori minat pengguna yang diamati;
(2) Mendeteksi , dalam satu atau lebih ulasan pengguna yang terkait dengan suatu produk, satu atau lebih segmen teks yang terkait dengan satu atau lebih kategori minat pengguna yang diamati;
(3) Dan berdasarkan pendeteksian, pengindeksan , dalam database yang dapat dicari, produk pada satu atau lebih kategori minat pengguna yang diamati.
Jadi. mesin telusur dapat melihat kueri tentang suatu entitas untuk mengidentifikasi apa yang mungkin diminati oleh pencari tentang entitas tersebut dan menggunakan kueri tersebut untuk mengidentifikasi teks dalam ulasan yang mungkin diminati oleh pencari, dan mengindeks teks tersebut sehingga pencari dapat menemukan jawaban atas pertanyaan tersebut. kueri yang mereka miliki tentang entitas seperti produk, produsen produk, dan vendor produk.
Google dapat menghitung jumlah kueri yang menanyakan tentang atribut entitas tertentu untuk memahami seberapa besar minat yang ada pada jawaban atas kueri tersebut, atau minat pengguna terhadapnya.
Pembelajaran mesin dapat digunakan untuk mengidentifikasi apakah kueri tertarik pada produk itu sendiri, atau produsen produk.
Entitas atribut paten yang dimaksud, diberikan minggu lalu, dapat ditemukan di:
Menganalisis ulasan pengguna untuk menentukan atribut entitas
Penemu: Advay Mengle, Jindong Chen, Charmaine Cynthia Rose D'Silva dan Anna Patterson
Penerima Tugas: GOOGLE LLC
Paten AS: 10.061.767
Diberikan: 28 Agustus 2018
Diarsipkan: 16 Juni 2017
Abstrak
Metode dan peralatan dijelaskan di sini untuk mengklasifikasikan ulasan pengguna atau bagiannya sebagai yang terkait dengan berbagai entitas, dan untuk mengaitkan segmen deskriptif teks yang diekstraksi yang terkandung dalam ulasan pengguna atau bagiannya dengan entitas berdasarkan klasifikasi. Dalam berbagai implementasi, satu atau lebih kategori minat pengguna yang diamati dapat diidentifikasi berdasarkan kumpulan kueri pengguna. Satu atau beberapa segmen teks yang terkait dengan satu atau beberapa kategori minat pengguna yang diamati dapat dideteksi dalam satu atau beberapa ulasan pengguna yang terkait dengan suatu produk. Berdasarkan pendeteksian, produk dapat diindeks pada satu atau lebih kategori minat pengguna yang diamati dalam database yang dapat dicari. Dalam beberapa implementasi, database yang dapat dicari dapat diakses oleh satu atau lebih perangkat klien jarak jauh, dan dapat dicari oleh satu atau lebih kategori minat pengguna yang diamati untuk memberikan hasil pencarian yang akan diberikan oleh satu atau lebih perangkat klien jarak jauh.
Ulasan pengguna, seperti yang dijelaskan dalam paten ini, dapat berasal dari sumber seperti:
- blog
- postingan jejaring sosial
- artikel yang ditulis untuk situs web atau untuk publikasi cetak seperti majalah atau surat kabar
- posting yang dibuat ke bagian ulasan pengguna dari vendor atau pasar online
- ulasan pengguna dikirimkan ke berbagai lembaga kliring ulasan pengguna yang ada
Tinjauan tersebut kemudian dapat diklasifikasikan berdasarkan kategori minat yang mungkin mereka cakup, dan entitas yang mungkin berisi informasi terkait. Ini menarik karena paten ini memberi tahu kita tentang bagaimana pembelajaran mesin dapat menjadi bagian dari proses yang terlibat dalam mengambil langkah-langkah ini.

Dalam beberapa implementasi, satu atau lebih "kategori minat" dalam entitas dapat digunakan untuk mengklasifikasikan ulasan pengguna dan/atau bagiannya sebagai terkait dengan entitas tertentu. Deteksi kata atau frasa dalam ulasan pengguna yang sesuai dengan kategori ini (misalnya, cukup mirip) dapat ditafsirkan sebagai sinyal untuk mengklasifikasikan ulasan pengguna atau bagiannya sebagai terkait dengan suatu entitas. Kategori minat dapat datang dalam berbagai bentuk, seperti kategori minat yang diprediksi dan kategori minat yang diamati. Dalam berbagai implementasi, mesin kategori dapat mempertahankan indeks kategori yang dapat digunakan oleh mesin pengklasifikasi untuk mengklasifikasikan ulasan pengguna dan/atau bagiannya.
Jika Anda adalah penggemar game online, paten memberikan beberapa contoh yang berfokus pada hal tersebut untuk menggambarkan bagaimana proses di balik paten bekerja:
Kategori minat yang diamati, sebaliknya, dapat ditentukan, misalnya, berdasarkan mesin kategori, berdasarkan pola yang diamati dalam aktivitas pengguna, seperti di antara sejumlah (atau korpus) kueri pengguna. Misalnya, dan melanjutkan dengan contoh pasar aplikasi online, beberapa pengguna dapat menelusuri aplikasi menggunakan istilah atau frasa yang sama atau serupa. Jika cukup banyak pengguna yang mengirimkan kueri yang berisi kata atau frasa tertentu (atau variasi serupa darinya), maka mesin kategori dapat menganggap kata atau frasa tersebut sebagai kategori minat yang diamati dan dapat memperbarui indeks yang sesuai. Jadi, jika cukup banyak pengguna yang mencari di pasar online untuk “game role-playing online multipemain masif” atau “MMORPG”, kategori MMORPG dapat dibuat.
Proses yang melibatkan penggalian teks dari ulasan juga dijelaskan dan mencakup hal-hal seperti perbandingan antara entitas yang berbeda (seperti "Produk X lebih baik daripada produk Y.")
Paten menghabiskan banyak perhatian tentang bagaimana informasi dan kata-kata dan frasa tertentu dapat diekstraksi dari ulasan, dan responsif terhadap pertanyaan, seperti jika ada banyak pertanyaan tentang "kamera yang memiliki kemampuan zoom optik yang hebat", informasi mungkin diekstraksi yang menjawab pertanyaan itu untuk kamera tertentu. Dan informasi semacam ini mungkin diambil dari ulasan pengguna kamera.
Kami diberi petunjuk tentang implikasi dari ekstraksi tersebut:
Mesin grafik dapat melakukan berbagai tindakan dengan atribut dan/atau skor entitas yang baru dikaitkan ini. Misalnya, dalam beberapa implementasi, mesin grafik dapat berinteraksi dengan mesin pencari (tidak digambarkan) dan dapat mengindeks satu atau lebih entitas berdasarkan satu atau lebih segmen teks deskriptif yang terkait dengan satu atau lebih entitas tersebut, misalnya, dengan teks deskriptif mesin asosiasi.
Penggunaan Ulasan untuk Mempelajari Atribut Entitas
Menarik bahwa Google dapat menggunakan konten buatan pengguna seperti ulasan produk untuk mempelajari produk tersebut, produsen produk tersebut, dan distributor produk tersebut.
Kami telah melihat bahwa Google tertarik pada ulasan produk dan bisnis, dan tempat karena para pencari telah menelusuri hal-hal tersebut. Kami juga melihat Google berbicara tentang bagaimana mereka dapat menggunakan ulasan untuk mempelajari sentimen terkait entitas. Paten ini membawa minat itu selangkah lebih maju, lebih dari sekadar membuat ulasan tersedia untuk pencari atau menunjukkan kalimat yang diisi sentimen. Ia berusaha mempelajari hal-hal yang ditinjau sehingga dapat mencocokkan minat tertentu dengan informasi yang menjawabnya.
Paten memberi tahu kami tentang di mana ulasan dapat ditemukan secara online, bagaimana teks dari ulasan tersebut dapat diklasifikasikan dan diekstraksi, bagaimana minat dari kueri pencari dapat dikumpulkan untuk memahami apa yang mungkin menarik untuk dipelajari oleh pencari tersebut, dan bahwa mesin pencari dapat menunjukkan kepada pencari informasi yang responsif terhadap kepentingan tersebut tentang atribut entitas tertentu.
Mungkin ulasan adalah tempat yang baik untuk mempelajari informasi tentang atribut entitas yang tidak dibagikan sendiri oleh entitas tersebut. Bagaimana menurut anda?
