Pengindeksan Berbasis Frasa Google Diperbarui

Diterbitkan: 2018-06-06

Google telah memperbarui salah satu paten terpenting mereka hari ini

Apa yang Dicakup Pengindeksan Berbasis Frasa

Saat halaman mencakup topik seperti “Presiden Amerika Serikat”, kemungkinan besar halaman tersebut akan menyertakan frasa bermakna di halaman tersebut yang dapat dikatakan untuk memprediksi tentang halaman tersebut, seperti “Gedung Putih” atau “Taman Mawar ” atau “Konferensi Pers” atau “Sekretaris Negara.” Jika Anda melihat frasa seperti itu di halaman, itu mungkin petunjuk tentang topik halaman itu, yang menjelaskan cara kerja pengindeksan berbasis frasa Google. Ini adalah pendekatan yang bisa dikatakan menggunakan tema semantik untuk menunjukkan makna halaman. Itu dilakukan dengan memahami dan mengindeks frasa bermakna yang muncul bersama pada halaman yang berperingkat tinggi untuk suatu istilah.

Hanya Karena Google Memiliki Paten… Pengindeksan Berbasis Frase Diperbarui

Matt Cutts menerbitkan video ini sekitar 5 tahun yang lalu, dan dia memberi tahu kami di dalamnya bahwa hanya karena Google memiliki paten atas sesuatu; itu tidak berarti mereka menggunakannya

Tetapi, Ketika Google Terus Memperbarui Paten, Mereka Dapat Menggunakannya

Saya melihat banyak paten dari Google, dan beberapa argumen dapat dibuat yang memberi tahu kami bahwa mereka mungkin menggunakan pengindeksan berbasis frase yang diperbarui paten yang diberikan hari ini.

1. Ada lebih dari 20 paten terkait yang diberikan kepada Anna Patterson dan ditugaskan ke Google tentang proses yang melibatkan pengindeksan berbasis frasa.

2. Paten tampaknya menjadi salah satu yang penting dan yang pernah saya sebut sebagai salah satu dari 10 paten SEO terpenting sepanjang masa:

10 Paten SEO Paling Penting, Bagian 5 – Pengindeksan Berbasis Frase

3. Proses di balik paten pertama kali muncul saat diajukan di kantor paten pada tahun 2004, dan mereka telah menambahkan proses tersebut dengan setidaknya 20 paten yang menambahkan fitur, seperti memerangi spam dan pembuatan cuplikan, dan beri tahu kami detail tentang kemungkinan penerapannya ke dalam indeks Google. Saya pertama kali menulis tentang paten itu pada tahun 2006, di pos, Pindahkan PageRank: Google melihat frasa?

4. Paten lanjutan adalah versi paten di mana deskripsi paten tidak diubah, tetapi klaim dalam paten telah diperbarui, untuk mencerminkan perubahan dalam proses yang dimaksudkan untuk dilindungi oleh paten. Tanggal pengajuan paten tetap tanggal pengajuan asli, tetapi kemampuan untuk mengecualikan orang lain dari menggunakan proses di balik paten menjadi didasarkan pada klaim baru. Klaim dalam paten telah berubah secara signifikan dari tahun 2004 hingga 2018. Salah satu alasan signifikan untuk mengubah klaim tersebut adalah untuk mencerminkan proses sebenarnya (jika paten digunakan) di balik paten.

Perlu membandingkan tiga klaim pertama dari yang asli dengan versi paten yang diberikan hari ini. Berikut adalah tiga klaim pertama dari aslinya:

1. Metode pemilihan dokumen dalam kumpulan dokumen sebagai tanggapan atas suatu kueri, metode tersebut terdiri dari: menerima kueri; mengidentifikasi pluralitas frasa dalam kueri, di mana setidaknya satu frasa adalah frasa banyak kata; mengidentifikasi ekstensi frasa dari setidaknya satu frasa yang diidentifikasi, dan memilih dokumen dari kumpulan dokumen yang berisi satu frasa dari kumpulan termasuk frasa dalam kueri dan ekstensi frasa.

2. Metode klaim 1, dimana memilih dokumen terdiri dari: menggabungkan daftar pengeposan dari frasa yang diidentifikasi dan daftar pengeposan ekstensi frasa dari frasa yang diidentifikasi untuk membentuk daftar pengeposan gabungan, dan memilih dokumen yang muncul dalam daftar pengeposan gabungan dan daftar posting frase diidentifikasi lainnya.

3. Metode pemilihan dokumen dalam kumpulan dokumen sebagai tanggapan atas suatu query, metode tersebut terdiri dari: menerima suatu query; mengidentifikasi frasa yang tidak lengkap dalam kueri; mengganti frasa yang tidak lengkap dengan ekstensi frasa, dan memilih dokumen dari kumpulan dokumen yang berisi ekstensi frasa.

Apa yang tampak berbeda dari klaim lama hingga klaim baru berikutnya, adalah bahwa klaim tersebut memberikan lebih banyak informasi tentang bagaimana pengindeksan berbasis frase sekarang dapat memberi peringkat halaman.

Yang diklaim adalah:

1. Metode yang diterapkan komputer yang terdiri dari: memperoleh, dari indeks berbasis frasa untuk mesin pencari Internet, daftar dokumen dari kumpulan dokumen yang tersedia melalui Internet yang berisi frasa pertama, frasa pertama yang relevan dengan kueri ; untuk setiap dokumen dalam daftar: menentukan, menggunakan informasi frasa terkait yang disimpan dalam indeks untuk setiap dokumen dalam daftar dokumen, apakah dokumen tersebut menyertakan satu atau lebih frasa terkait dari frasa pertama, di mana setiap frasa terkait memiliki kejadian bersama yang sebenarnya tingkat frasa terkait dan frasa pertama dalam kumpulan dokumen yang melebihi tingkat kemunculan bersama yang diharapkan dari frasa terkait dan frasa pertama dalam kumpulan dokumen; memberi peringkat dokumen dalam daftar berdasarkan jumlah frasa terkait yang ditentukan untuk setiap dokumen, sehingga dokumen dengan frasa terkait lebih berperingkat lebih tinggi daripada dokumen dengan frasa terkait lebih sedikit; dan memilih setidaknya beberapa dokumen berperingkat tertinggi untuk disertakan dalam hasil kueri.

2. Metode klaim 1, di mana menentukan apakah dokumen tersebut mencakup satu atau lebih frasa terkait dari frasa pertama meliputi: mengakses daftar pengeposan untuk frasa pertama, daftar pengeposan termasuk, untuk setiap dokumen yang diidentifikasi dalam daftar pengeposan, indikasi jumlah frasa terkait yang ada dalam dokumen.

3. Metode klaim 1, di mana dokumen dengan frekuensi istilah kueri yang rendah tetapi pluralitas frasa terkait untuk frasa pertama menempati peringkat lebih tinggi daripada dokumen dengan frekuensi istilah kueri yang lebih tinggi tetapi tanpa frasa terkait.

Paten yang diperbarui pengindeksan berbasis frase dapat ditemukan di:

Pencarian berbasis frasa dalam sistem temu kembali informasi
Penemu: Anna L. Patterson
Penerima tugas: Google LLC
Paten AS: 9.990.421
Diberikan: 5 Juni 2018
Diarsipkan: 2 Februari 2017

Abstrak

Sistem temu kembali informasi menggunakan frase untuk mengindeks, mengambil, mengatur, dan mendeskripsikan dokumen. Frase diidentifikasi yang memprediksi keberadaan frase lain dalam dokumen. Dokumen kemudian diindeks menurut frasa yang disertakan. Frasa terkait dan ekstensi frasa juga diidentifikasi. Frase dalam kueri diidentifikasi dan digunakan untuk mengambil dan memberi peringkat pada dokumen. Frase juga digunakan untuk mengelompokkan dokumen dalam hasil pencarian, membuat deskripsi dokumen, dan menghilangkan dokumen duplikat dari hasil pencarian, dan dari indeks.

Saya menulis posting sekitar setahun yang lalu, dengan fokus pada pengindeksan berbasis frasa, Apakah Anda Menggunakan Pengindeksan Berbasis Frasa Google?, yang mencakup paten yang memberi tahu kita bagaimana indeks terbalik Google telah diperbarui untuk memasukkan frasa - yang akan menjadi sangat mahal melakukan tetapi akan membuat metode dalam paten pertama yang diperbarui ini pada pengindeksan berbasis frase bekerja jauh lebih efektif.

Saya juga menulis satu pada tahun 2016 yang disebut Pemodelan Tematik Menggunakan Kata Terkait dalam Dokumen dan Anchor Text. Ini memberi tahu kita tentang bagaimana halaman dapat ditingkatkan dalam hasil pencarian berdasarkan penggunaan hit tubuh (frasa terkait dalam teks halaman) dan hit jangkar (frasa terkait yang digunakan sebagai teks jangkar yang ditunjuk dari halaman tempat frasa terkait telah dibuat. ) Dengan peringkat yang ditentukan secara lebih rinci dalam paten pengindeksan berbasis fase pertama ini, kami juga dapat melihat pembaruan pada paten lain tentang pengindeksan berbasis frasa.

Apakah pengindeksan berbasis frase terlihat cukup menarik bagi Anda untuk menguji dan meneliti lebih lanjut?