Peringkat Hasil Penelusuran yang Dipersonalisasi di Google

Diterbitkan: 2020-12-02

Bagaimana Personalisasi Peringkat Hasil Pencarian Dihitung di Google?

Saya menulis tentang versi sebelumnya dari paten ini ketika masih aplikasi paten pada tahun 2012 di posting Personalisasi Profil Pengguna Google dan Google Plus. Paten ini telah diajukan 4 kali oleh Google dan tidak diberikan sampai versi keempat, yang saya tulis hari ini.

Bagian penting dari paten apa pun adalah bagian klaim, yang dilihat oleh kantor paten saat memutuskan apakah akan memberikan paten.

Versi pertama dari paten (Personalisasi pencarian web) diajukan pada tanggal 30 September 2003. Awalnya diberikan penolakan nonfinal berdasarkan kesamaan paten dari Microsoft, Utopy, dan NEC USA.

Tiga versi pertama dari paten ditinggalkan oleh Google di kantor paten, sepertinya mereka tidak dapat menunjukkan bagaimana pengajuan Google cukup berbeda dari paten yang diajukan sebelumnya dari perusahaan lain.

Mereka terdaftar sebagai versi sebelumnya dari paten yang diberikan terbaru ini, paten lanjutan, mengambil tanggal pengajuan dari versi sebelumnya. Jadi itu dianggap sebagai versi paten yang diperbarui.

Berikut adalah 3 versi sebelumnya dari pengajuan paten ini:

  1. Diarsipkan 30 September 2003 – Personalisasi pencarian web
  2. Diajukan 12 Mei 2010 – Personalisasi Hasil Pencarian Web Menggunakan Istilah, Kategori, dan Profil Pengguna Berbasis Tautan
  3. Diarsipkan November 11, 2011 – Personalisasi Hasil Pencarian Web Menggunakan Istilah, Kategori, dan Profil Pengguna Berbasis Tautan

Klaim pertama dari paten Personalization of Web Search versi 2003 berbunyi seperti ini:

1. Metode personalisasi hasil pencarian mesin pencari, yang terdiri dari: mengakses profil pengguna untuk pengguna berdasarkan informasi tentang pengguna, informasi pengguna termasuk informasi yang berasal dari sekumpulan dokumen, kumpulan dokumen yang terdiri dari sejumlah dokumen dipilih dari kumpulan yang terdiri dari dokumen yang diidentifikasi oleh hasil pencarian dari mesin pencari, dokumen yang diakses oleh pengguna, dokumen yang ditautkan ke dokumen yang diidentifikasi oleh hasil pencarian dari mesin pencari, dan dokumen yang ditautkan ke dokumen yang diakses oleh pengguna;

– menerima permintaan pencarian dari pengguna;
– mengidentifikasi sekumpulan dokumen hasil pencarian yang cocok dengan permintaan pencarian; menetapkan skor generik untuk masing-masing setidaknya sejumlah dokumen hasil pencarian;
– menetapkan skor yang dipersonalisasi untuk setiap dokumen dari sejumlah dokumen hasil pencarian mengikuti skor umum yang ditetapkan untuk dokumen dan profil pengguna;
– dan memberi peringkat pada kumpulan dokumen hasil pencarian sesuai dengan skor yang dipersonalisasi.

Dari versi kedua permohonan paten yang diajukan pada tahun 2011, berikut adalah klaim paten pertama yang menjelaskan cara kerjanya:

2. Metode yang diterapkan komputer, terdiri dari: mengakses profil pengguna untuk pengguna dan profil grup untuk pengguna; menerima permintaan pencarian dari pengguna;

– mengidentifikasi sekumpulan dokumen hasil pencarian umum yang cocok dengan permintaan pencarian; menetapkan skor generik untuk setiap dokumen setidaknya sebagian dari kumpulan dokumen hasil pencarian generik;
– menetapkan skor yang dipersonalisasi untuk setiap dokumen dari subset dokumen hasil pencarian mengikuti skor umum yang ditetapkan untuk dokumen, profil pengguna, dan profil grup;
– memberi peringkat subset dokumen hasil pencarian per skor yang dipersonalisasi masing-masing;
– menyediakan, ke sistem klien yang terkait dengan pengguna, informasi yang mengidentifikasi sejumlah dokumen dalam subset peringkat dokumen hasil pencarian;
– dan memperbarui profil pengguna berdasarkan dokumen yang dipilih oleh pengguna dari sejumlah dokumen.

Berikut adalah klaim pertama dari versi paten yang baru saja diberikan pada November 2020:

1. Metode personalisasi hasil pencarian mesin pencari, metode tersebut terdiri dari:

– mengakses profil pengguna untuk pengguna, di mana profil pengguna didasarkan setidaknya sebagian pada informasi tentang pengguna, profil pengguna termasuk informasi yang berasal dari sekumpulan dokumen, kumpulan dokumen termasuk dokumen yang diidentifikasi oleh hasil pencarian dari pencarian mesin, dokumen yang diakses oleh pengguna, dokumen yang ditautkan ke dokumen yang diidentifikasi oleh hasil pencarian dari mesin pencari, dan dokumen yang ditautkan ke dokumen yang diakses pengguna; menerima permintaan pencarian dari pengguna;

– mengidentifikasi sekumpulan dokumen sebagai tanggapan atas permintaan pencarian, setiap dokumen dikaitkan dengan skor umum yang tidak bergantung pada profil pengguna;
– menetapkan skor yang dipersonalisasi untuk masing-masing setidaknya sebagian dari kumpulan dokumen yang diidentifikasi, skor yang dipersonalisasi didasarkan, setidaknya sebagian, pada profil pengguna;
– dan menentukan skor akhir untuk setiap dokumen dalam subset dari kumpulan dokumen yang diidentifikasi, skor akhir merupakan fungsi dari skor yang dipersonalisasi untuk dokumen, skor generik yang terkait dengan dokumen, dan skor kepercayaan yang mencakup satu atau lebih dari: jumlah informasi yang diperoleh tentang pengguna, seberapa mirip kueri penelusuran dengan profil pengguna, dan usia profil pengguna;
– dan memberikan, mengikuti skor akhir, hasil yang mengidentifikasi setidaknya sebagian dari kumpulan dokumen yang diidentifikasi ke sistem klien yang terkait dengan pengguna, di mana memberikan hasil termasuk memberikan setidaknya satu hasil berdasarkan setidaknya sebagian pada skor yang dipersonalisasi untuk dokumen terkait dan memberikan hasil lain dari hasil pencarian yang diperoleh di bawah skor umum untuk dokumen yang sesuai dengan hasil lain tetapi tidak bergantung pada profil pengguna.

Skor Keyakinan dan Peringkat Hasil Pencarian yang Dipersonalisasi

Bagian paling menarik dari klaim pertama dari versi paten yang diberikan tahun 2020 yang menonjol bagi saya adalah penyebutan "skor kepercayaan" di paruh terakhir klaim itu:

Menentukan skor akhir untuk setiap dokumen dalam subset dari kumpulan dokumen yang diidentifikasi, skor akhir merupakan fungsi dari skor yang dipersonalisasi untuk dokumen, skor generik yang terkait dengan dokumen, dan skor kepercayaan yang mencakup satu atau lebih dari: jumlah informasi yang diperoleh tentang pengguna, seberapa mirip kueri penelusuran dengan profil pengguna, dan usia profil pengguna; dan memberikan, berdasarkan skor akhir, hasil yang mengidentifikasi setidaknya sebagian dari kumpulan dokumen yang diidentifikasi ke sistem klien yang terkait dengan pengguna, di mana memberikan hasil termasuk memberikan setidaknya satu hasil berdasarkan setidaknya sebagian pada skor yang dipersonalisasi untuk dokumen yang sesuai dan memberikan hasil lain dari hasil pencarian yang diperoleh mengikuti skor umum untuk dokumen yang sesuai dengan hasil lain tetapi tidak bergantung pada profil pengguna.

Skor kepercayaan itu didasarkan pada:

  • Sejumlah informasi yang diperoleh tentang pengguna
  • Seberapa mirip kueri penelusuran dengan profil pengguna
  • Usia profil pengguna

Skor kepercayaan tidak disebutkan dalam versi pertama paten tetapi ditambahkan ke versi kedua.

Peringkat yang Dipersonalisasi Menggunakan Istilah, Kategori, dan Profil Pengguna Berbasis Tautan

Perbedaan mencolok lainnya dalam 4 paten adalah bahwa judul diubah dari yang pertama, “Personalisasi Pencarian Web” menjadi “Personalisasi Hasil Pencarian Web Menggunakan Istilah, Kategori, dan Profil Pengguna Berbasis Tautan” pada 3 versi terakhir. Ini karena paten pertama menyebutkan Istilah, Kategori, dan Profil Pengguna Berbasis Tautan, tetapi mereka lebih menonjol dalam tiga versi terakhir.

Seperti yang saya tulis di postingan saya sebelumnya:

Alih-alih menggunakan satu fokus untuk profil pengguna yang dihasilkan, profil tersebut mungkin terdiri dari banyak sub-profil, yang masing-masing dapat mencirikan minat pencari dari perspektif yang berbeda. Ini dapat mencakup:

Profil berbasis istilah dengan beberapa istilah membawa indikasi bobot kepentingannya relatif terhadap istilah lain.

Profil berbasis kategori yang menggunakan beberapa kategori, mungkin diatur ke dalam peta hierarkis (seperti hierarki yang Anda lihat di DMOZ diatur).

Profil berbasis tautan dengan beberapa tautan yang mungkin secara langsung atau tidak langsung terkait dengan halaman atau dokumen yang diidentifikasi dalam riwayat pencarian pengguna, dengan setiap tautan memiliki bobot yang menunjukkan pentingnya tautan (seperti PageRank).

Mengapa Menggunakan Personalisasi di Hasil Pencarian?

Saya suka bahwa paten ini menjelaskan mengapa Google memutuskan bahwa ada nilai dalam memberikan personalisasi dalam hasil pencarian.

Sebagian, mereka menempatkan nilai dalam profil pengguna untuk pencari, yang dapat membantu menyesuaikan hasil pencarian ketika mereka dikembalikan ke pencari sebagai tanggapan atas permintaan yang mungkin telah diajukan pencari ke mesin pencari.

Paten memberi tahu kami bahwa kueri biasanya ringkas (rata-rata 2-3 kata, dan seiring bertambahnya jumlah dokumen dalam indeks mesin telusur, jumlah hasil yang dapat dikembalikan juga dapat bertambah. Namun, mereka memberi tahu kami bahwa "tidak setiap dokumen yang cocok dengan kueri sama pentingnya dari sudut pandang pengguna.”

Masalah yang ingin dipecahkan oleh paten personalisasi ini adalah untuk menjaga agar para pencari tidak kewalahan oleh banyak hasil pencarian yang mungkin dikembalikan untuk sebuah kueri. Mesin pencari akan melakukan ini dengan mengurutkan hasil pencarian berdasarkan relevansinya dengan permintaan pengguna. Itu akan menggunakan personalisasi untuk memberikan hasil yang lebih relevan bagi pencari tertentu.

Salah satu pendekatan untuk meningkatkan relevansi hasil pencarian dengan permintaan pencarian adalah dengan menggunakan struktur tautan dari halaman web yang berbeda untuk menghitung skor “kepentingan” global yang dapat digunakan untuk mempengaruhi peringkat hasil pencarian. (Beginilah cara paten ini mengacu pada PageRank.)

Personalisasi hasil adalah sebagai tanggapan terhadap Model Peselancar Acak, yang diikuti oleh PageRank. Paten memberitahu kita bahwa:

Pada kenyataannya, pengguna seperti peselancar acak tidak pernah ada.

Setiap pengguna memiliki preferensinya sendiri ketika dia mengirimkan kueri ke mesin pencari.

Kualitas hasil pencarian yang dikembalikan oleh mesin harus dievaluasi oleh kepuasan penggunanya.

Ketika kueri itu sendiri dapat dengan baik mendefinisikan preferensi pengguna, atau ketika preferensi pengguna serupa dengan preferensi peselancar acak mengenai kueri tertentu, pengguna lebih mungkin puas dengan hasil pencarian.

Namun, jika preferensi pengguna dibiaskan secara signifikan oleh beberapa faktor pribadi yang tidak tercermin dengan jelas dalam kueri penelusuran itu sendiri, atau jika preferensi pengguna sangat berbeda dari preferensi pengguna acak, hasil penelusuran dari mesin telusur yang sama mungkin kurang bermanfaat. untuk pengguna, jika tidak berguna.

Terkadang saya menemukan diri saya menyempurnakan pencari saya untuk mengembalikan hasil yang jauh lebih relevan dengan apa yang mungkin saya cari.

Paten juga membahas hasil pemurnian seperti ini, memberi tahu kami bahwa penyempurnaan kueri terkadang membutuhkan lebih banyak pengetahuan tentang subjek atau bahkan lebih banyak keahlian dengan mesin pencari daripada yang mungkin dimiliki pencari, membutuhkan lebih banyak waktu dan usaha daripada yang bersedia dikeluarkan oleh pencari.

Personalisasi Berdasarkan Profil Pengguna untuk Menyesuaikan Hasil Pencarian

Profil pengguna terdiri dari beberapa item yang mencirikan preferensi pencari.

Barang-barang ini dapat diambil dari berbagai sumber informasi:

  • Kueri penelusuran sebelumnya yang dikirimkan oleh pengguna
  • Tautan dari atau ke dokumen yang diidentifikasi oleh pertanyaan sebelumnya
  • Konten sampel dari dokumen yang diidentifikasi serta informasi pribadi yang secara implisit atau eksplisit disediakan oleh pengguna

Cara kerja Personalisasi di Google:

  1. Ketika mesin pencari menerima kueri dari seorang pencari, itu dimulai dengan mengembalikan dokumen yang cocok dengan kueri
  2. Setiap hasil pencarian memiliki peringkat umum berdasarkan PageRank, teks yang terkait dengan dokumen, dan kueri
  3. Profil pencari diidentifikasi, dan itu berkorelasi dengan masing-masing dokumen yang diidentifikasi
  4. Korelasi antara dokumen dan profil pengguna menghasilkan peringkat profil untuk dokumen, yang menunjukkan relevansi dokumen bagi pengguna
  5. Mesin pencari kemudian akan menggabungkan peringkat generik dokumen dan peringkat profil menjadi peringkat yang dipersonalisasi dan mengurutkan hasil tersebut sesuai dengan peringkat yang dipersonalisasi.

Proses Peringkat Hasil Pencarian yang Dipersonalisasi

Profil pencari dapat didasarkan pada beberapa sub-profil, dan setiap sub-profil dapat mencirikan minat pencarian dari perspektif yang berbeda.

Profil berbasis istilah didasarkan pada banyak istilah, dengan masing-masing istilah memiliki bobot yang menunjukkan kepentingannya relatif terhadap istilah lain. Istilah ini dapat ditemukan di halaman web, dan istilah penting dan tidak penting dapat diidentifikasi pada halaman untuk menentukan apakah itu cocok untuk pencari yang cocok dengan profil berdasarkan istilah, seperti yang ditunjukkan dalam gambar dari paten ini:

Peringkat yang Dipersonalisasi dari Peringkat Kategori Hasil Pencarian

Penggunaan Ketentuan pada halaman akan diberi bobot:

Hasil Pencarian yang Dipersonalisasi - Tertimbang Istilah

Profil berbasis kategori berdasarkan beberapa kategori, yang dapat diatur ke dalam peta hierarkis, seperti yang ditunjukkan pada gambar paten berikut:

Profil kategori hasil pencarian yang dipersonalisasi

Dan preferensi pencarian pencari dapat dikaitkan dengan setidaknya beberapa dari beberapa kategori, masing-masing kategori memiliki bobot terkait yang menunjukkan minat pencari pada dokumen yang mungkin termasuk dalam kategori tersebut. Kategori yang berbeda dapat memiliki bobot berbeda yang terkait dengannya:

Peta profil hasil pencarian yang dipersonalisasi

Mungkin juga ada beberapa profil berbasis kategori untuk pengguna.

Dan sub-profil dapat mencakup profil berbasis tautan, yang mencakup beberapa tautan yang secara langsung atau tidak langsung terkait dengan dokumen yang diidentifikasi, dengan setiap tautan memiliki bobot yang menunjukkan pentingnya tautan bagi pencari. Tautan dalam profil berbasis tautan dapat diatur lebih lanjut mengenai host dan domain yang berbeda.

Google dapat mengumpulkan bobot Profil Berbasis Istilah ini, bobot Profil berbasis Kategori, dan bobot Profil berbasis tautan dan menggunakannya untuk menentukan dokumen mana yang harus dikembalikan sebagai hasil penelusuran yang dipersonalisasi seperti yang terlihat dalam gambar paten:

Kategori istilah pencarian yang dipersonalisasi menautkan profil

Peringkat hasil pencarian yang dipersonalisasi ditentukan mengikuti diagram alur berikut dari paten:

Peringkat Hasil Pencarian yang Dipersonalisasi

Personalisasi hasil pencarian web menggunakan istilah, kategori, dan profil pengguna berbasis tautan
Penemu: Stephen R. Lawrence;
Penerima Tugas: GOOGLE LLC
Paten AS: 10.839.029
Diberikan: 17 November 2020
Diarsipkan: 3 Maret 2016

Abstrak

Sistem dan metode untuk membuat profil pengguna dan menggunakan profil pengguna untuk memesan hasil pencarian yang dikembalikan oleh mesin pencari. Profil pengguna didasarkan pada permintaan pencarian yang diajukan oleh pengguna, interaksi spesifik pengguna dengan dokumen yang diidentifikasi oleh mesin pencari, dan informasi pribadi yang diberikan oleh pengguna. Profil pengguna dapat dipilih dari dokumen yang diakses oleh pengguna dengan melakukan sampling paragraf atau analisis konteks. Profil pengguna memodulasi skor umum yang terkait dengan hasil pencarian untuk mengukur relevansinya dengan preferensi dan minat pengguna. Hasil pencarian diurutkan ulang sesuai sehingga hasil yang paling relevan muncul di bagian atas daftar. Profil pengguna dapat dibuat dan/atau disimpan di sisi klien atau sisi server dari lingkungan jaringan klien-server.

Peringkat Penelusuran Web yang Dipersonalisasi di Google

Jika Anda telah menggunakan Google Now untuk melihat hasil berita yang dipersonalisasi, Anda telah melihat bagaimana Google dapat memengaruhi hasil penelusuran yang Anda lihat dengan mempersonalisasikannya.

Dengan Google Now, Anda terkadang dapat secara tegas menunjukkan minat Anda pada topik tertentu dengan mengisi formulir yang memberi tahu Google tentang minat Anda.

Pilihan cerita Anda untuk diklik dan dibaca juga memengaruhi apa yang mungkin Anda lihat di masa mendatang. Keputusan Anda untuk tidak memilih beberapa cerita mungkin juga berperan dalam apa yang dipilih untuk ditampilkan kepada Anda.

Google sekarang juga memiliki fitur yang memungkinkan Anda untuk menunjukkan bahwa Anda ingin melihat lebih banyak artikel dari jenis tertentu atau lebih sedikit dari jenis itu.

Jika Anda membuat konten untuk audiens untuk menarik mereka ke halaman web atau situs web tertentu, memahami apa yang disukai dan tidak disukai audiens tersebut mungkin dapat membantu Anda dan memiliki gagasan tentang tempat yang mungkin ingin mereka kunjungi di Web.

Deskripsi tentang bagaimana peringkat hasil pencarian yang dipersonalisasi ini memberikan lebih banyak detail tentang cara kerja personalisasi di Google dibandingkan dengan paten lain yang telah saya tulis dari Google seperti paten di Hasil Pencarian yang Dipersonalisasi di Google, yang memberi tahu kami tentang dokumen bias yang akan ditambahkan ke hasil pencarian yang tidak dipersonalisasi.