Cómo Google puede reescribir consultas al observar las consultas anteriores de un buscador

Publicado: 2019-08-24

¿Cuántas personas tiene el estadio de Mudville (donde Mighty Casey salió despedido)?

Google recibió una nueva patente que involucra la reescritura de consultas a principios de esta semana. No funciona de la misma manera que Hummingbird de Google o cómo funciona Rankbrain de Google.

Hemos visto patentes sobre la reescritura de consultas que los buscadores pueden buscar con páginas que regresan y que satisfacen las necesidades situacionales de información de un buscador. Esas son ideas detrás de la actualización Hummingbird de Google y otras patentes de Google sobre el uso de sinónimos para reescribir consultas.

En el siguiente dibujo de la patente de Hummingbird, la palabra "lugar" para Chicago Style Pizza se puede reescribir como "restaurante", que es más fácil para Google responder como una consulta.

Sinónimos de Google Hummingbirs por contexto

Escribí sobre una patente que describe un enfoque de reescritura de consultas utilizado por Hummingbird en mi publicación ¿La patente de Google Hummingbird? En esa publicación, escribí sobre una patente de Google otorgada dos semanas antes de que Google anunciara la actualización Hummingbird, que compartía algunos ejemplos de reescritura de consultas con el anuncio. La patente fue la identificación de sinónimos basada en términos coexistentes.

En el evento que anunció Hummingbird, hicieron la siguiente declaración sobre la actualización:

En particular, Google dijo que Hummingbird está prestando más atención a cada palabra en una consulta, asegurándose de que se tenga en cuenta toda la consulta, la oración completa, la conversación o el significado, en lugar de palabras en particular. El objetivo es que las páginas que coincidan con el significado funcionen mejor, en lugar de las páginas que coinciden solo con unas pocas palabras.

~ Preguntas frecuentes: Todo sobre el nuevo algoritmo "Hummingbird" de Google

En la consulta "Cuál es el mejor lugar para Chicago Style Pizza", esta patente nos dice que la palabra "lugar" podría sustituirse por la palabra "Restaurante", lo que facilitaría la respuesta del motor de búsqueda.

Esta nueva patente puede mirar las propias palabras de un buscador para reescribir una consulta. Puede ver qué consultas pueden haber realizado antes para ayudarlos a encontrar lo que quieren encontrar. Voy a proporcionar un resumen del proceso detrás de la patente y luego un ejemplo de cómo las consultas anteriores pueden ayudar a reescribir la consulta de un buscador.

Reescritura de consultas utilizando consultas anteriores

Estos son los pasos identificados en la nueva patente otorgada que detallan el proceso detrás de ella:

  1. El motor de búsqueda recibe una consulta de un buscador.
  2. El motor de búsqueda puede haber recibido varias consultas anteriores del mismo buscador durante la misma sesión.
  3. El motor de búsqueda puede crear muchas reescrituras de consultas candidatas, basadas en la última consulta de búsqueda y las consultas de búsqueda anteriores del mismo buscador.
  4. Esas reescrituras de consultas candidatas se puntúan en función de la determinación de la calidad de la reescritura a partir de un análisis de los resultados de búsqueda que responden a la reescritura de la consulta candidata.
  5. La reescritura de una consulta candidata se selecciona en función de una puntuación que satisface un valor de umbral
  6. Los resultados de la búsqueda de la reescritura de la consulta del candidato seleccionado se muestran al buscador

La patente nos dice que hay algunas características opcionales asociadas con este enfoque de reescritura de consultas. Me pareció interesante que la inclusión de entidades en consultas anteriores fuera un aspecto interesante de este enfoque de reescritura.

Estos pasos opcionales completan los pasos enumerados anteriormente.

  1. Crear el número de reescrituras de consultas candidatas puede significar concatenar la consulta original con cada consulta de búsqueda anterior.
  2. Cada consulta anterior tiene una marca de tiempo, y parte de la puntuación de las reescrituras de la consulta candidata puede incluir la ponderación de la reescritura del candidato según la antigüedad de las consultas anteriores.
  3. La creación de esa cantidad de reescrituras de consultas candidatas puede incluir la identificación de consultas de una colección de consultas de varios usuarios que son similares a la consulta de búsqueda.
  4. La puntuación de las reescrituras de consultas candidatas también incluye determinar qué tan popular es la reescritura de cada consulta candidata, en función de una colección de consultas de muchos usuarios.
  5. La puntuación de cada una de las reescrituras de consultas candidatas también puede incluir determinar si incluye un término de referencia de un tipo en particular (probablemente una referencia de entidad)
  6. La puntuación para la reescritura de una consulta candidata se puede aumentar en respuesta a la determinación de que la reescritura de la consulta candidata incluye una entidad del tipo particular.
  7. La puntuación de cada reescritura de consulta candidata también incluye determinar si la consulta de búsqueda tiene términos que están altamente correlacionados con entidades particulares.
  8. La puntuación de una reescritura de la consulta candidata se puede incrementar en respuesta a la determinación de que la reescritura de la consulta candidata incluye la entidad altamente correlacionada con el término de la consulta.
  9. La determinación de la calidad de cada reescritura de la consulta candidata basada en un análisis de los resultados de la búsqueda en respuesta a la reescritura de la consulta candidata incluye obtener resultados de la búsqueda que respondan a cada reescritura de la consulta candidata y determinar la calidad de los resultados de la búsqueda.

Este enfoque de reescritura de consultas no se trata de comprender el contexto de todas las palabras en una consulta y reescribirlas de una manera que sea más probable que arroje un resultado que sea útil para un buscador. Amplía eso al hacer que el motor de búsqueda comprenda el contexto de varias consultas de la misma sesión de consulta y si pueden ayudar o no a proporcionar una respuesta que satisfaga al buscador. La patente nos dice que la ventaja detrás del proceso de esta patente es:

El uso de consultas de sesiones de usuarios anteriores para reescribir las consultas mejora la probabilidad de devolver resultados de búsqueda que respondan a la intención del usuario.

Esta patente de reescritura de consultas es:

Reescritura de consultas utilizando información de sesión
Inventores: Marcin M. Nowak-Przygodzki y Behshad Behzadi
Cesionario: Google LLC
Patente de EE. UU .: 10,387,437
Concedido: 20 de agosto de 2019
Archivado: 13 de enero de 2017

Abstracto

Métodos, sistemas y aparatos, incluidos programas informáticos codificados en soportes de almacenamiento informáticos, para el procesamiento del lenguaje natural. Uno de los métodos incluye recibir una consulta de búsqueda de un usuario durante una sesión de usuario; obtener una pluralidad de consultas de búsqueda previas por parte del usuario recibidas durante la sesión de usuario; generar una pluralidad de reescrituras de consultas candidatas, en donde las reescrituras de consultas candidatas se derivan de la consulta de búsqueda y la pluralidad de consultas de búsqueda anteriores por parte del usuario; puntuar cada reescritura de la consulta candidata, en la que puntuar cada reescritura de la consulta candidata incluye determinar la calidad de cada reescritura de la consulta candidata basándose en un análisis de los resultados de búsqueda en respuesta a la reescritura de la consulta candidata; seleccionar una reescritura de la consulta candidata que tenga una puntuación que satisfaga un valor de umbral, y proporcionar resultados de búsqueda que respondan a la reescritura de la consulta candidata seleccionada.

Pruebas de reescritura de consultas y conclusiones

Probé las consultas del ejemplo enumerado en esta patente, y no reescribió mi consulta por mí. Siempre esté probando cosas como esta, independientemente de si las escribo o si se encuentra con una patente por su cuenta, y suena interesante: vea si Google está haciendo lo que dice la patente o si han implementado algo que demuestre que se están moviendo hacia él.

Recientemente escribí la publicación Los puntajes de visita de calidad a las empresas pueden influir en las clasificaciones en la búsqueda local de Google, y es imposible saber si están usando puntajes de visita de calidad para aumentar la clasificación de los resultados locales, pero hay otras señales de que Google puede estar avanzando hacia tal cosa. El primero de ellos es que Google está mostrando información de visitas de calidad en Google Analytics 360. El segundo es que una publicación reciente en el blog de Google Webmaster nos dijo que Google otorgaría insignias en diferentes categorías comerciales para las empresas que se encontraban entre las 5 principales % visitó sitios en sus categorías. Por lo tanto, busque señales de que los procesos descritos en las patentes estén en uso.

Los ejemplos de esta patente incluyen la búsqueda mediante las siguientes consultas:

[Estadio de Mudville]
[Mudville Nine]
[Barack Obama]

La siguiente consulta sería:

[cual es la capacidad]

Y se referiría a la primera de las consultas anteriores.

Una reescritura de consulta candidata basada en la concatenación de esa consulta con la primera consulta anterior sería:

[¿Cuál es la capacidad del estadio de Mudville?]

También se refiere a una propiedad de una entidad nombrada en esa primera consulta (la capacidad del estadio), que se ajusta a las características opcionales por las que una consulta reescrita candidata recibiría una puntuación alta.

Google no está combinando esa última consulta con la primera consulta y devolviendo resultados que me muestran la capacidad del estadio de Mudville en este momento. Por otra parte, no estoy seguro de que haya un estadio de Mudville real (que es donde tuvo lugar Casey At the Bat, así que probé el mismo conjunto de consultas, reemplazando el estadio de Mudville con el Lincoln Financial Field (que es real) y Google lo hizo Tampoco me digas la capacidad del Lincoln Financial Field. Al menos no todavía. Lo intentaré de nuevo.