Responder preguntas con datos estructurados

Publicado: 2018-03-21

Solo los hechos, rápido

En 2005, el blog oficial de Google publicó una publicación llamada Just the Facts, Fast. Recientemente, Google ha estado mostrando respuestas de resultados únicos a consultas que han captado mucha atención en publicaciones como SERPs de resultado cero: Bienvenidos al futuro que deberíamos haber sabido que se avecinaba.

Mostrar solo una respuesta a una pregunta, en lugar de un fragmento destacado en la parte superior de un conjunto de preguntas, pareció captar mucha atención.

La respuesta a preguntas en Google ha sido en forma de respuestas basadas en hechos a preguntas en la parte superior de los resultados de búsqueda a las que la industria del SEO se había referido como Respuestas Directas. Hemos escuchado de Eric Schmidt que Google quiere responder a las preguntas que la gente puede hacer desde 2011, como se cubrió en una publicación llamada Eric Schmidt: Google quiere ser tan inteligente que pueda responder sus preguntas sin tener que vincularlo a otro lugar. .

Escribí sobre cómo Google estaba encontrando hechos para tales preguntas en la publicación: Cómo Google corroboraba hechos para respuestas directas, lo que puede recordar a algunas personas la consistencia NAP (nombre-dirección-teléfono) que se sabe que ayuda a los resultados de búsqueda locales.

También escribí sobre un enfoque ligeramente diferente que Google podría usar para responder preguntas en las que podrían rastrear páginas, y recopilar preguntas y respuestas y crear un almacén de datos de dicha información a partir del cual podrían proporcionar una respuesta, en la publicación, Respuestas directas - Natural Resultados de búsqueda de idioma para consultas de intención.

Basado en datos estructurados

Pero, una pregunta que ha estado en mi mente, ya que Google podría estar usando datos estructurados, como el marcado de esquema para responder preguntas. Esa es una pregunta que no ha sido respondida por Google, incluso recientemente cuando vimos a Google publicar una publicación titulada Una reintroducción a los fragmentos destacados de Google (en una de las primeras cosas que publicó Danny Sullivan después de unirse a Google).

Obtenemos una respuesta ligeramente diferente de una patente concedida recientemente en Google; que se centra en responder preguntas. Comienza diciéndonos que los buscadores a menudo quieren respuestas a las preguntas que hacen:

Los usuarios de los sistemas de búsqueda a menudo buscan una respuesta a una pregunta específica, en lugar de una lista de recursos. Por ejemplo, los usuarios pueden querer saber qué tiempo hace en una ubicación en particular, una cotización actual de una acción, la capital de un estado, etc. Cuando se reciben consultas en forma de pregunta, algunos motores de búsqueda pueden realizar operaciones de búsqueda especializadas en respuesta al formato de pregunta de la consulta. Por ejemplo, algunos motores de búsqueda pueden proporcionar información en respuesta a tales consultas en forma de una "respuesta", como la información proporcionada en forma de un "cuadro único" a una pregunta.

Donde esta patente parece desviarse de otras sobre preguntas y respuestas es con la siguiente línea en la descripción de la patente:

Algunas consultas de preguntas buscan hechos y, por lo tanto, están bien atendidas por hechos que se enumeran en datos estructurados, como una tabla de hechos.

Hemos visto Schema introducido en el último año en forma de información sobre los hechos de Howto sobre cómo realizar algún tipo de tarea siguiendo una secuencia de eventos. Sería una excelente respuesta a un fragmento destacado.

Entonces, el resumen de esta patente detalla el proceso detrás de ella. Nos dice cómo es único de esta manera:

En general, un aspecto innovador del tema descrito en esta especificación puede incorporarse en métodos que incluyen las acciones de recibir una consulta determinada como una consulta de pregunta que busca una respuesta, respuesta y datos que identifican los recursos que se determina que responden a la consulta y ordenada según una clasificación, la consulta tiene términos de consulta; identificar el conjunto de contenido estructurado en un subconjunto de los recursos mejor clasificado, siendo cada conjunto de contenido estructurado el contenido dispuesto de acuerdo con los atributos relacionados en uno de los recursos; para cada conjunto de contenido estructurado identificado, determinar si la consulta coincide con el conjunto de contenido estructurado basándose en los términos de la consulta que coinciden con los atributos relacionados del conjunto de contenido estructurado; seleccionar uno de los conjuntos de contenido estructurado para el que se determina que coincide la consulta; generar, a partir del conjunto de contenido estructurado seleccionado, un conjunto de hechos estructurados a partir de los atributos relacionados que coincidían con los términos de la consulta; y proporcionar el conjunto de hechos estructurados con resultados de búsqueda que identifican los recursos que se determina que responden a la consulta y que son separados y distintos de los resultados de la búsqueda.

Ventajas de usar datos estructurados para responder preguntas

El resumen de la patente proporciona una lista de "ventajas" detrás del uso de este proceso de preguntas y respuestas:

1. Múltiples señales de calidad aseguran que el sistema de búsqueda obtenga coincidencias de alta precisión.
2. El sistema puede proporcionar resultados únicos a partir de fuentes estructuradas sin necesidad de curación humana.
3. El sistema puede proporcionar fácilmente respuestas de hechos para varias propiedades menos conocidas de entidades prominentes, por ejemplo, [densidad de población de Mongolia], [cuál es el punto más alto de India], [tasa de crecimiento de la población francesa], [mariscal de campo de Nebraska, Heisman], etc.
4. Se pueden proporcionar conjuntos de hechos basados ​​en datos estructurados en respuesta a consultas de búsqueda de hechos.
5. Al identificar primero el contenido estructurado en los recursos y procesar subconjuntos del contenido estructurado, se reduce la potencia de procesamiento requerida en el momento de la consulta, lo que, a su vez, mejora el área de tecnología del procesamiento de consultas de búsqueda.
6. Esto también permite un acceso más rápido a la información más relevante para las búsquedas de los usuarios y, a su vez, mejora la experiencia de los usuarios.
7. Además, esto mejora la probabilidad de que se proporcionen a los usuarios conjuntos de hechos que respondan directamente a las necesidades de información y, a su vez, mejore aún más la experiencia de los usuarios.

Esta patente reciente es:

Responder hechos de contenido estructurado
Inventores: Jayant Madhavan, Hongrae Lee, Warren H. Y Shen y Sreeram Viswanath Balakrishnan;
Cesionario: Google LLC (Mountain View, CA)
Patente de EE. UU .: 9,916,348
Concedido: 13 de marzo de 2018
Archivado: 12 de agosto de 2015

Abstracto

En un aspecto, un método incluye recibir una consulta que se determina que es una consulta que busca una respuesta, una respuesta y datos que identifican los recursos que se determina que responden a la consulta; identificar el conjunto de contenido estructurado en un subconjunto de los recursos mejor clasificado, siendo cada conjunto de contenido estructurado el contenido dispuesto de acuerdo con los atributos relacionados en uno de los recursos; para cada conjunto de contenido estructurado identificado, determinar si la consulta coincide con el conjunto de contenido estructurado basándose en los términos de la consulta que coinciden con los atributos relacionados del conjunto de contenido estructurado; seleccionar uno de los conjuntos de contenido estructurado para el que se determina que coincide la consulta; generar, a partir del conjunto de contenido estructurado seleccionado, un conjunto de hechos estructurados a partir de los atributos relacionados que coincidían con los términos de la consulta; y proporcionar el conjunto de hechos estructurados con resultados de búsqueda que identifican los recursos que se determina que responden a la consulta.

Respuestas a preguntas para llevar

Es posible que recuerde cuando Google hizo que los médicos y la gente de la clínica Mayo actualizaran los paneles de conocimientos de una manera curada por humanos. Eso sería difícil de hacer para una amplia gama de dominios de hechos.

Google publicó un artículo hace un par de años que trataba de calificar las fuentes de hechos encontrados en la Web, llamado Confianza basada en el conocimiento: Estimación de la confiabilidad de las fuentes web. Esa sería una forma de tratar de asegurarse de que las respuestas a las preguntas provengan de fuentes que se sabe que son correctas la mayor parte del tiempo (aunque no es una garantía de que todas las respuestas de las fuentes sean correctas).

La patente incluye un ejemplo de una pregunta que responde a una consulta sobre tarifas de equipaje para una aerolínea en particular y el uso de una tabla de datos que contiene información de tarifas de equipaje, para generar un cuadro de respuesta que contiene una respuesta de hecho a partir de los datos estructurados en respuesta a la consulta.

La patente nos dice que los datos estructurados pueden provenir de varios tipos diferentes de recursos que se pueden identificar mediante procesos como "detección de etiquetas de lenguaje de marcado, instrucciones de formato, identificadores de archivos, etc."

También aprendemos sobre cómo se pueden crear e indexar las plantillas de consultas de datos estructurados para proporcionar respuestas a las consultas.

La descripción en esta patente parece centrarse en tablas basadas en datos como una fuente de datos estructurados que se utilizan como fuentes de hechos para responder consultas, como los costos de tarifa de equipaje para una determinada aerolínea. Proporciona algunos ejemplos detallados de cómo se podría construir una plantilla de consulta que pueda responder a tales consultas.

Es posible que en el futuro comencemos a ver Respuestas a preguntas usando datos estructurados para responder consultas, y esas pueden usar enfoques diferentes a las tablas, como en el ejemplo de la patente. Podría usar datos estructurados de fuentes como JSON-LD. Es posible que tengamos que explorarlos más cuando los veamos,