Indexación basada en frases de Google actualizada
Publicado: 2018-06-06Google ha actualizado hoy una de sus patentes más importantes

Qué cubre la indexación basada en frases
Cuando una página cubre un tema como "Presidente de los Estados Unidos", es muy probable que incluya frases significativas en esa página que podrían predecir de qué trata la página, como "Casa Blanca" o "Jardín de rosas". "O" Conferencia de prensa "o" Secretario de Estado ". Si ve frases como esa en una página, pueden ser pistas sobre el tema de esa página, que describe cómo funciona la indexación basada en frases de Google. Es un enfoque que podría decirse que utiliza temas semánticos para mostrar el significado de las páginas. Lo hace al comprender e indexar las frases significativas que coexisten en las páginas que tienen una alta clasificación para un término.
Solo porque Google tiene una patente ... Se actualizó la indexación basada en frases
Matt Cutts publicó este video hace unos 5 años, y nos dice en él que solo porque Google tiene una patente sobre algo; eso no significa que lo usen
Pero, cuando Google procede a actualizar una patente, pueden usarla
Miro muchas patentes de Google, y se pueden hacer algunos argumentos que nos dicen que pueden estar usando la patente actualizada de indexación basada en frases otorgada hoy.
1. Hay más de 20 patentes relacionadas otorgadas a Anna Patterson y asignadas a Google sobre procesos que involucran la indexación basada en frases.
2. La patente parece ser importante y una vez llamé una de las 10 patentes de SEO más importantes de todos los tiempos:
Las 10 patentes de SEO más importantes, parte 5: indexación basada en frases
3. El proceso detrás de la patente apareció por primera vez cuando se presentó en la oficina de patentes en 2004, y han estado agregando al proceso al menos 20 patentes que agregan características, como la lucha contra el correo no deseado y la generación de fragmentos, y Cuéntenos detalles sobre cómo probablemente se implemente en el índice de Google. Escribí por primera vez sobre esa patente en 2006, en la publicación Move over PageRank: ¿Google está mirando frases?
4. Una patente de continuación es una versión de una patente en la que la descripción de la patente no se ha modificado, pero las reivindicaciones de la patente se han actualizado para reflejar los cambios en el proceso que la patente pretende proteger. La fecha de presentación de la patente sigue siendo la fecha de presentación original, pero la capacidad de excluir a otros del uso del proceso detrás de la patente se basa en las nuevas reivindicaciones. Las afirmaciones de la patente han cambiado significativamente de 2004 a 2018. Una razón importante para cambiar esas afirmaciones es reflejar el proceso real en el lugar (si se está utilizando la patente) detrás de la patente.
Vale la pena comparar las tres primeras reivindicaciones del original con la versión de la patente que se otorgó hoy. Aquí están las tres primeras afirmaciones del original:
1. Un método para seleccionar documentos en una colección de documentos en respuesta a una consulta, comprendiendo el método: recibir una consulta; identificar una pluralidad de frases en la consulta, en la que al menos una frase es una frase de múltiples palabras; identificar una extensión de frase de al menos una de las frases identificadas, y seleccionar documentos de la colección de documentos que contienen una frase de un conjunto que incluye frases en la consulta y la extensión de frase.
2. El método de la reivindicación 1, en el que seleccionar documentos comprende: combinar una lista de publicación de una frase identificada y una lista de publicación de la extensión de frase de la frase identificada para formar una lista de publicación combinada, y seleccionar documentos que aparecen en la lista de publicación combinada y las listas de publicación de las otras frases identificadas.
3. Un método para seleccionar documentos en una colección de documentos en respuesta a una consulta, comprendiendo el método: recibir una consulta; identificar una frase incompleta en la consulta; reemplazar la frase incompleta con una extensión de frase y seleccionar documentos de la colección de documentos que contienen la extensión de frase.
Lo que parece ser diferente de las afirmaciones anteriores a las más nuevas que siguen es que brindan más información sobre cómo la indexación basada en frases ahora puede clasificar las páginas.
Lo reclamado es:
1. Un método implementado por computadora que comprende: obtener, a partir de un índice basado en frases para un motor de búsqueda de Internet, una lista de documentos de una colección de documentos disponibles a través de Internet que contienen una primera frase, siendo la primera frase relevante para una consulta ; para cada documento en la lista: determinar, utilizando información de frases relacionadas almacenada en el índice para cada documento en la lista de documentos, si el documento incluye una o más frases relacionadas de la primera frase, donde cada frase relacionada tiene una co-ocurrencia real tasa de la frase relacionada y la primera frase en la colección de documentos que excede una tasa de co-ocurrencia esperada de la frase relacionada y la primera frase en la colección de documentos; clasificar los documentos en la lista en función de una cantidad de frases relacionadas determinadas para cada documento, de modo que los documentos con más frases relacionadas se clasifiquen más alto que los documentos con menos frases relacionadas; y seleccionar al menos algunos de los documentos mejor clasificados para incluirlos en un resultado de la consulta.
2. El método de la reivindicación 1, en el que determinar si el documento incluye una o más frases relacionadas de la primera frase incluye: acceder a una lista de publicación para la primera frase, la lista de publicación incluye, para cada documento identificado en la lista de publicación, una indicación del número de frases relacionadas presentes en el documento.
3. El método de la reivindicación 1, en el que un documento con una frecuencia baja de términos de consulta pero una pluralidad de frases relacionadas para la primera frase ocupa un lugar más alto que un documento con una frecuencia más alta de términos de consulta pero sin frases relacionadas.
La patente actualizada de indexación basada en frases se puede encontrar en:
Búsqueda basada en frases en un sistema de recuperación de información
Inventores: Anna L. Patterson
Cesionario: Google LLC
Patente de EE. UU .: 9,990,421
Concedido: 5 de junio de 2018
Archivado: 2 de febrero de 2017
Abstracto
Un sistema de recuperación de información utiliza frases para indexar, recuperar, organizar y describir documentos. Se identifican frases que predicen la presencia de otras frases en documentos. Luego, los documentos se indexan de acuerdo con las frases incluidas. También se identifican frases relacionadas y extensiones de frases. Las frases de una consulta se identifican y se utilizan para recuperar y clasificar documentos. Las frases también se utilizan para agrupar documentos en los resultados de la búsqueda, crear descripciones de documentos y eliminar documentos duplicados de los resultados de la búsqueda y del índice.
Escribí una publicación hace aproximadamente un año, centrándome en la indexación basada en frases, ¿Está utilizando la indexación basada en frases de Google ?, que cubre una patente que nos dice cómo se ha actualizado el índice invertido de Google para incluir frases, lo que sería muy costoso emprendiendo, pero haría que el método en esta primera patente actualizada sobre indexación basada en frases funcionara mucho más eficazmente.
También escribí uno en 2016 llamado Modelado temático usando palabras relacionadas en documentos y texto de anclaje. Nos informa sobre cómo las páginas pueden mejorarse en los resultados de búsqueda en función del uso de hits corporales (frases relacionadas en el texto de las páginas) y hits de anclaje (frases relacionadas utilizadas como texto de anclaje apuntado desde una página para la que se han generado frases relacionadas. ) Con las clasificaciones definidas con más detalle en esta primera patente de indexación basada en fase, es posible que también veamos actualizaciones de otras patentes sobre indexación basada en frases.
¿La indexación basada en frases parece lo suficientemente intrigante como para que pueda probar e investigar más?

