Eliminación de ambigüedades de la entrada de búsqueda según el contexto de la entrada
Publicado: 2018-05-15"Ok Google; ¡Nueva York, Nueva York!"
Google escucha una consulta para "Nueva York, Nueva York". ¿Da direcciones, reproduce una canción de Frank Sinatra o muestra resultados de búsqueda de estilo turístico? Probablemente eso depende del contexto de esa consulta.
Como se nos dice en una patente de Google:
La entrada del usuario puede identificarse como ambigua por una variedad de razones. Generalmente, la entrada del usuario se identifica como ambigua si el sistema la interpreta como que tiene más de un significado intencionado probable, en ausencia de intentos de eliminar la ambigüedad de la entrada utilizando las técnicas descritas aquí. Por ejemplo, en el presente ejemplo, la entrada del usuario se identifica como ambigua según cada uno de los comandos posiblemente correspondientes a la entrada; la entrada del usuario "Ir a Nueva York, Nueva York" puede indicar una ubicación geográfica (la ciudad de Nueva York, NY), una canción (la canción “New York, New York”) y una página web (una página web de turismo para la ciudad de Nueva York, NY). Los comandos se pueden identificar como posiblemente correspondientes a la entrada utilizando cualquiera de una variedad de técnicas, como sondear una aplicación y / o servicio correspondiente a cada comando (por ejemplo, consultar un reproductor de música asociado con el comando "Ir a [Canción]" para determinar si "New York, New York" es una canción accesible en el dispositivo informático móvil), acceder a uno o más grupos de términos permitidos para cada comando (p. ej., acceder a un grupo de términos de ubicación geográfica permitidos para el comando "Ir a [ Ubicación geográfica] ”), etc.
Eliminación de ambigüedades de la entrada de búsqueda según el contexto de esas consultas
Google ha estado proporcionando información para las consultas de búsqueda para proporcionar respuestas inequívocas a las consultas de búsqueda. Esta patente concedida recientemente por Google analiza el contexto de las consultas para tratar de eliminar la ambigüedad de las entradas del usuario para que los resultados no sean ambiguos.
Como nos dice la patente, este es su propósito:
En las técnicas descritas en este documento, se tiene en cuenta el contexto de un dispositivo informático, como un teléfono móvil (por ejemplo, un teléfono inteligente o una aplicación) para eliminar la ambigüedad de las entradas de usuario ambiguas. La entrada ambigua del usuario es la entrada que, en ausencia de información relevante para eliminar la ambigüedad, sería interpretada por el dispositivo informático o por el dispositivo informático (por ejemplo, por un sistema de servidor con el que el dispositivo informático está en comunicación electrónica) como correspondiente a más de una consulta o comando. La entrada ambigua puede ser particularmente común para la entrada hablada, en parte debido a la presencia de homófonos, y en parte, porque un procesador de voz a texto puede tener dificultades para diferenciar palabras que se pronuncian de manera diferente pero suenan similares entre sí. Por ejemplo, si un usuario dice "buscar información de vela / venta" en un dispositivo informático móvil, esta entrada de voz puede ser ambigua, ya que puede corresponder al comando "buscar información de vela" (p. Ej., Información sobre la vela de un velero ) o al comando "buscar información de venta" (información sobre una venta de bienes). Un dispositivo podría incluso determinar que la entrada era "buscar información de venta", porque "vender" y "vender" suenan igual, particularmente en ciertos dialectos.
¿Cómo podría funcionar esta desambiguación de entrada de búsqueda?
La patente nos dice que la entrada ambigua del usuario se puede eliminar en función de un contexto asociado con un dispositivo informático móvil (y / o un usuario del dispositivo informático móvil) separado de la entrada del usuario en sí, como por ejemplo:
- La ubicación física donde se encuentra el dispositivo informático móvil (p. Ej., Casa, trabajo, automóvil, etc.)
- Movimiento del dispositivo informático móvil (p. Ej., Acelerando, estacionario, etc.)
- Actividad reciente en el dispositivo informático móvil (p. Ej., Actividad en redes sociales, correos electrónicos enviados / recibidos, llamadas telefónicas realizadas / recibidas, etc.)
Los ejemplos de entrada de búsqueda que se desambigua en función del contexto pueden incluir
1. Un dispositivo que está acoplado puede determinar el tipo de base en el que se encuentra, por ejemplo, a través de contactos eléctricos físicos en la base y el dispositivo que coinciden entre sí, o mediante comunicación electrónica (por ejemplo, a través de Bluetooth o RFID) entre la base y el dispositivo. Eso podría indicarlo si está en un contexto como "en el automóvil" o "en casa" según dicha determinación. Por eso,
... el dispositivo puede eliminar la ambigüedad de la entrada hablada, como "direcciones", donde el término podría interpretarse como direcciones geográficas (p. Ej., Direcciones de conducción) en un contexto "en el automóvil", e instrucciones de cómo hacerlo (p. Ej., Para cocinar) en un modo "en casa".
2. En otro ejemplo, recibir, en un dispositivo informático móvil, una entrada de usuario ambigua que puede indicar múltiples comandos puede hacer que se determine un contexto actual asociado con el dispositivo informático móvil que puede indicar dónde se encuentra actualmente el dispositivo informático móvil. Eso puede influir en los resultados proporcionados en función de ese contexto.
Ventaja de eliminar las ambigüedades de la entrada de búsqueda según el contexto
La patente nos habla de la ventaja de seguir los procesos descritos en la patente como:
Permitir a los usuarios instruir a un dispositivo informático móvil para realizar la tarea deseada sin requerir que el usuario cumpla con todas las formalidades de proporcionar información para la tarea deseada. A medida que han aumentado las características proporcionadas por un dispositivo informático móvil, es posible que se requiera que los usuarios proporcionen su entrada con mayor especificidad para que la entrada se asocie correctamente con la característica deseada. Sin embargo, tal especificidad puede resultar engorrosa y difícil de recordar. Los métodos, sistemas, técnicas y mecanismos descritos en este documento pueden permitir que un usuario proporcione información utilizando menos especificidad de la requerida formalmente para una característica y aún así acceder a la característica deseada.
La patente es:
Entrada de ambigüedad basada en el contexto
Inventores: John Nicholas Jitkoff y Michael J. LeBeau
Cesionario: Google LLC
Patente de EE. UU.: 9,966,071
Concedido: 8 de mayo de 2018
Archivado: 1 de julio de 2016
Abstracto
En una implementación, un método implementado por computadora incluye recibir, en un dispositivo de computación móvil, una entrada de usuario ambigua que indica más de una de una pluralidad de comandos; y determinar un contexto actual asociado con el dispositivo informático móvil que indica dónde se encuentra actualmente el dispositivo informático móvil. El método puede incluir además eliminar la ambigüedad de la entrada ambigua del usuario seleccionando un comando de la pluralidad de comandos en función del contexto actual asociado con el dispositivo informático móvil, y hacer que la salida asociada con el rendimiento del comando seleccionado sea proporcionada por el dispositivo informático móvil. .
Hablé con un altavoz (dispositivo) de Google esta mañana que comenzó con un "Hola Google", pero no me obligó a decir esa frase de moda después de que Google hizo algunos cambios anunciados en la reciente conferencia de Google I / O. Pregunté por los resultados deportivos y luego hice preguntas sobre ellos. Todavía estoy aprendiendo cuál es la mejor manera de interactuar con mi versión de altavoz de Google Now, pero es interesante. (¿Sería útil decir por favor cuando pedimos algo?) Mi conversación matutina me vino a la mente cuando comencé a leer este pasaje de esta patente:
Este documento describe técnicas, métodos, sistemas y mecanismos para eliminar la ambigüedad de la entrada del usuario en un dispositivo informático móvil (p. Ej., Teléfono móvil, teléfono inteligente (p. Ej., IPhone, BLACKBERRY), asistente digital personal (PDA), reproductor multimedia portátil (p. Ej. , iPod), etc.). A medida que han aumentado las funciones proporcionadas por los dispositivos informáticos móviles, también puede aumentar el número de comandos reconocidos por un dispositivo informático móvil. Por ejemplo, cada característica en un dispositivo informático móvil puede registrar uno o más comandos correspondientes que un usuario puede escribir, hablar, hacer gestos, etc. para hacer que la característica se inicie en el dispositivo informático móvil. Sin embargo, a medida que aumenta el número de comandos reconocidos, los comandos pueden converger y hacer que sea más difícil distinguir a cuál de los múltiples comandos debe corresponder la entrada del usuario. El problema se magnifica para la entrada de voz. Por ejemplo, la entrada de voz que se proporciona con un ruido de fondo fuerte puede ser difícil de interpretar con precisión y, como resultado, puede mapearse a más de un comando reconocido por el dispositivo informático móvil. Por ejemplo, la entrada de voz "ejemplo" podría interpretarse como, entre otras cosas, "muestra de huevo", "ejemplo" o "extracción de examen". Como otro ejemplo, el comando "ir a" puede representar "ir a [ubicación geográfica]" para una aplicación de mapas y "ir a [artista / álbum / canción]" para un reproductor multimedia.
Mientras intentamos aprender la mejor manera de interactuar con nuestros dispositivos, altavoces y dispositivos móviles para obtener los mejores resultados de Google, Google también está tratando de aprender la mejor manera de interactuar con nosotros y asegurarse de que se nos comprenda cuando solicitamos algo. Esta patente sobre la eliminación de ambigüedades de la entrada de búsqueda da algunos pasos en esa dirección. Como nos dice:
Usando las técnicas descritas aquí, en respuesta a recibir una entrada de usuario ambigua, se puede determinar un contexto actual para el dispositivo móvil (y / o un usuario del dispositivo informático móvil) y usarlo para eliminar la ambigüedad de la entrada de usuario ambigua. Un contexto actual para un dispositivo informático móvil puede incluir una variedad de información asociada con el dispositivo informático móvil y / o un usuario del dispositivo informático móvil. El contexto puede ser externo al dispositivo y representar un estado en tiempo real alrededor del dispositivo, como una ubicación física actual (p. Ej., Casa, trabajo, automóvil, ubicado cerca de la red inalámbrica "testnet2010", etc.), una dirección y una tasa de velocidad a la que se desplaza el dispositivo (p. ej., en dirección norte a 20 millas por hora), una ubicación geográfica actual (p. ej., en la esquina de 10th Street y Marquette Avenue) y ruido ambiental (p. ej., zumbido de tono bajo, música, etc.). El contexto también puede ser interno al dispositivo, como citas de calendario próximas y / o recientes (por ejemplo, reunión con John a las 2:30 pm el 29 de julio de 2010), una hora y fecha en un reloj en el dispositivo (por ejemplo, , 2:00 pm el 29 de julio de 2010), actividad reciente del dispositivo (por ejemplo, correos electrónicos enviados a John sobre la reunión de las 2:30) e imágenes de la (s) cámara (s) de los dispositivos de computación móvil.
A menudo uso mi teléfono para navegar a lugares y me gustaría poder hablar con mi teléfono, para hacer cambios al lugar al que estoy navegando, como si decido pasar por mi destino original para ir primero a una tienda diferente, y me gustaría apagar la navegación para que deje de decirme que dé un giro en U para viajar de regreso a ese primer destino.
Vale la pena repasar esta patente porque presenta algunas ideas interesantes sobre lo que podría influir en el funcionamiento de los dispositivos según el contexto, como nos dice aquí:
Con la entrada de usuario ambigua identificada, en el paso B se puede determinar un contexto actual para el dispositivo móvil. El contexto actual incluye información que describe el estado actual y / o el entorno del dispositivo informático móvil y / o el usuario del dispositivo informático móvil en el momento en que se recibe la entrada. Por ejemplo, el contexto actual puede incluir una variedad de información relacionada con el dispositivo informático móvil y el usuario, como información sobre el entorno físico circundante (p. Ej., Redes disponibles, conexiones a otros dispositivos informáticos cercanos, ubicación geográfica, condiciones climáticas cercanas empresas, el volumen del ruido ambiental, el nivel de luz ambiental, la imagen capturada por la cámara del dispositivo móvil, etc.), el estado actual del dispositivo informático móvil (por ejemplo, velocidad, entrada de pantalla táctil activada, entrada de audio activada, timbre encendido / apagado, etc.), información de fecha y hora (p. ej., hora del día, fecha, citas del calendario, día de la semana, etc.), actividad del usuario (p. ej., actividad reciente del usuario, actividad habitual del usuario), etc. El contexto actual puede ser determinado por el dispositivo informático móvil utilizando datos y sensores que son locales y / o remotos al dispositivo informático móvil.
Cambio que implica la entrada de búsqueda sin ambigüedades según el contexto
Érase una vez, cuando optimizaba una página para una consulta, probablemente era una consulta realizada por alguien sentado en un escritorio usando una computadora de escritorio o una computadora portátil. Ahora bien, podría ser alguien en un automóvil, un autobús o un tren, o en los pasillos de una tienda o en una cafetería. Cuando buscan "New York, New York" puede ser porque quieren direcciones de tráfico, o escuchar una canción o leer una página web para averiguar qué está sucediendo en el centro de la ciudad.
Recuerdo haber visitado a mi hermana cuando iba a la escuela en Manhattan, y ella sugirió que averiguáramos si había algún festival callejero en la ciudad ese día. Cogió el teléfono, marcó el 411 y preguntó a un operador. Esto fue aproximadamente 5 años antes de que existiera una World Wide Web para averiguarlo, y ella obtuvo respuestas de los operadores, lo que me sorprendió enormemente. No esperaba esas respuestas de esa fuente. Esperaría ahora poder encontrar una página web que pudiera informarme sobre eso, pero no hubiera esperado poder encontrar información como esa usando una computadora o un teléfono móvil algún día en el futuro. El mundo esta cambiando.
¿Qué tan preparado está para los cambios que nos traerán los dispositivos móviles y los motores de búsqueda?

