Como as sugestões de consulta do preenchimento automático do Google Predicts são atualizadas
Publicados: 2017-08-24
Como o Google decide sobre sugestões de consulta de preenchimento automático?
Quando o Google sugere consultas a serem pesquisadas, com base no que está sendo digitado em uma caixa de pesquisa, como surge essas sugestões?
O Google recebeu uma patente atualizada ou de continuação esta semana no Escritório de Patentes dos Estados Unidos, no processo pelo qual eles autocompletam sugestões de consulta. A versão original da patente, Preenchimento automático usando dados de consulta enviados anteriormente, foi concedida em 6 de janeiro de 2015.
Como uma patente de continuação, leva a data de depósito da versão inicial da patente e apenas atualiza a seção de reclamações. Portanto, as reivindicações da versão mais antiga da patente são diferentes desta versão mais recente. É interessante comparar as duas versões porque elas são diferentes em aspectos importantes. Como essas sugestões de preenchimento automático funcionam no Google?

A descrição da patente nos diz que envolve alguma leitura da mente para dar ao leitor o que ele deseja:
Os mecanismos de pesquisa da Internet visam identificar documentos ou outros itens que sejam relevantes para as necessidades de um usuário e apresentar os documentos ou itens da maneira mais útil para o usuário. Essa atividade geralmente envolve uma boa quantidade de leitura da mente - inferindo de várias pistas o que o usuário deseja. Certas pistas podem ser específicas do usuário. Por exemplo, saber que um usuário está solicitando um dispositivo móvel e saber a localização do dispositivo pode resultar em resultados de pesquisa muito melhores para esse usuário.
O Google parece ter alterado os documentos que apresentarão nessas previsões de consulta para fazer o que pode parecer uma suposição melhor. Isso pode ser visto comparando as reivindicações mais antigas e mais recentes de uma versão anterior da patente e as mais recentes da patente de continuação.
A Primeira Reivindicação Mais Antiga
1. Método implementado por computador para processar informações de consulta, caracterizado pelo fato de que compreende: receber informações de consulta em um sistema de servidor, em que as informações de consulta incluem uma parte de uma consulta de um solicitante de pesquisa, a informação de consulta sendo recebida antes de receber dados indicando que a pesquisa o solicitante concluiu a consulta e a parte da consulta do solicitante da pesquisa é apenas uma parte de uma consulta final; obter um conjunto de consultas previstas relevantes para a parte da consulta do solicitante de pesquisa com base na parte da consulta do solicitante de pesquisa e dados indicativos do comportamento do solicitante de pesquisa em relação às consultas enviadas anteriormente, em que o conjunto de consultas previstas inclui dois ou consultas mais previstas, e cada consulta prevista é uma previsão de uma possível consulta final do solicitante de pesquisa e em que cada consulta prevista inclui a parte da consulta e é diferente uma da outra consulta; classificar as consultas previstas no conjunto de consultas previstas de acordo com um critério de classificação; fornecer o conjunto classificado de consultas previstas para exibição ao solicitante de pesquisa; determinar se uma entrada é recebida do solicitante de pesquisa selecionando uma consulta prevista, do conjunto classificado de consultas previstas exibidas para o solicitante de pesquisa, dentro de um tempo especificado; em resposta a uma determinação de que a entrada do solicitante de pesquisa selecionando uma consulta prevista exibida não é recebida dentro do tempo especificado: obtenção de um conjunto classificado subsequente de consultas previstas para a parte da consulta do solicitante de pesquisa, as consultas previstas no subseqüente conjunto classificado de consultas previstas sendo classificado de acordo com critérios diferentes dos das consultas previstas no conjunto classificado de consultas previstas; e fornecer o conjunto classificado subsequente de consultas previstas para exibição ao solicitante de pesquisa em resposta ao recebimento das informações da consulta.
A Primeira Reivindicação Mais Nova
As sugestões de consulta previstas mostradas como sugestões de preenchimento automático nas novas reivindicações baseiam-se nas pesquisas anteriores do pesquisador e em documentos que ele possa ter examinado e interagido anteriormente. Essa é uma mudança em relação à primeira versão da patente. Isso me lembrou de outra patente de continuação que examinei no Google, sobre a qual escrevi em um post que chamei de Personalizando os resultados de pesquisa do Google. Aquele nos disse que poderia personalizar os resultados da pesquisa, selecionando-os a partir da união de dois conjuntos diferentes de documentos. Um desses conjuntos é um conjunto de “sites de alta qualidade” e o outro conjunto inclui documentos que são considerados “documentos de polarização” ou páginas que podem ter aparecido no histórico de pesquisa ou consulta de uma pessoa. Eles podem ter visitado essas páginas antes ou visto-as em um conjunto de resultados de pesquisa e não clicado nelas.
Portanto, as sugestões de preenchimento automático podem acabar retornando documentos que uma pessoa pode ter visto antes (um viés positivo, talvez) ou com os quais interagiu de alguma forma, como não selecioná-los nos resultados da pesquisa (mais como um viés negativo). Eu destaquei em amarelo onde fala sobre documentos anteriores.
1. Um método realizado por aparelho de processamento de dados, o método compreendendo: receber, a partir de um dispositivo de usuário de um usuário, dados de consulta especificando uma parte de uma consulta inserida pelo usuário; selecionar, com base na parte da consulta e no primeiro critério diferente do texto da consulta inserido pelo usuário, um primeiro conjunto de consultas previstas em que cada uma prevê uma respectiva consulta final para a parte da consulta; fornecer, ao dispositivo do usuário, dados que causam a apresentação do primeiro conjunto de consultas previstas no dispositivo do usuário; receber, a partir do dispositivo do usuário, uma solicitação do usuário para consultas adicionais previstas, em que a solicitação do usuário é enviada pelo dispositivo do usuário em resposta à atividade iniciada pelo usuário; em resposta ao recebimento da solicitação do usuário para consultas adicionais previstas, selecionando, com base na parte da consulta e no segundo critério que é (i) diferente do primeiro critério e (ii) diferente do texto da consulta inserido pelo usuário, um segundo conjunto de consultas previstas em que cada uma prevê uma consulta final respectiva para a porção da consulta, em que pelo menos um dos primeiros critérios ou o segundo critério é baseado em um comportamento do usuário em relação aos documentos fornecidos ao usuário em resposta a consultas anteriores recebidas do usuário ; determinar que o segundo conjunto de consultas previstas inclui uma determinada consulta prevista que está incluída no primeiro conjunto de consultas previstas; remover a consulta prevista fornecida do segundo conjunto de consultas previstas; e fornecer, ao dispositivo do usuário, dados que causam a apresentação do segundo conjunto de consultas previstas no dispositivo do usuário.
Links de sites e dados de clique
Esta é uma declaração interessante sobre sugestões de consulta de autocompletar que aparecem na versão mais antiga e na mais recente da patente. Parece que se os resultados da pesquisa de uma consulta que está sendo digitada levam a outros resultados de sugestões de consulta, isso pode ser um sinal de que uma consulta que retorna essas páginas vinculadas pode ser algo que interessaria a um pesquisador. Isso não faz parte da mudança da versão mais antiga desta patente para a versão mais recente, mas é um aspecto interessante de ambas, que mostra o valor potencial de links para outros sites e outras páginas:
Pistas sobre as necessidades de um usuário também podem ser mais gerais. Por exemplo, os resultados da pesquisa podem ter importância elevada, ou relevância inferida, se vários outros resultados da pesquisa vincularem a eles. Se os resultados da vinculação são altamente relevantes, então os resultados vinculados podem ter uma relevância particularmente alta. Tal abordagem para determinar a relevância pode ter como premissa a suposição de que, se os autores de páginas da web sentissem que outro site da web era relevante o suficiente para ter um link, os pesquisadores da web também achariam o site particularmente relevante. Em suma, os autores da web “votam” na relevância dos sites.
Os representantes do Google nos disseram que os dados de cliques não são um sinal de classificação, mas podem ser usados para testar os algoritmos do Google. Mas às vezes o que os engenheiros de pesquisa nos dizem pode ser um pouco diferente do que pode estar escrito em uma patente, como nesta seção da descrição:
Outras várias entradas podem ser usadas em vez de, ou além de, tais técnicas para determinar e classificar os resultados da pesquisa. Por exemplo, as reações do usuário a determinados resultados de pesquisa ou listas de resultados de pesquisa podem ser avaliadas, de modo que os resultados nos quais os usuários clicam com frequência recebam uma classificação mais elevada. A suposição geral sob tal abordagem é que os usuários de pesquisa são frequentemente os melhores julgadores de relevância, de modo que se eles selecionarem um resultado de pesquisa específico, é provável que seja relevante, ou pelo menos mais relevante do que as alternativas apresentadas.
Esta patente nos diz que os dados de clique podem ser usados para determinar quais consultas previstas são mostradas aos pesquisadores:
Modalidades particulares do assunto descrito podem ser implementadas para realizar uma ou mais das seguintes vantagens. Um assistente de pesquisa recebe informações de consulta de um solicitante de pesquisa, antes que o solicitante indique a conclusão da inserção da consulta. Além disso, as informações associadas às pesquisas anteriores do usuário (ou usuários) (como dados de clique associados aos resultados da pesquisa) são coletadas. A partir das informações de consulta recebidas e das informações de pesquisa anteriores, um conjunto de consultas previstas é produzido e fornecido ao solicitante da pesquisa para apresentação.
A versão mais recente desta patente de sugestão de consulta de autocompletar pode ser encontrada em:
Preenchimento automático usando dados de consulta enviados anteriormente
Inventores: Michael Herscovici, Dan Guez e Hyung-Jin Kim
Cessionário: Google Inc. (Mountain View, CA)
Patente dos EUA: 9.740.780
Concedido: 22 de agosto de 2017
Arquivado: 1 de dezembro de 2014
Resumo
Um método implementado por computador para processar informações de consulta inclui o recebimento de informações de consulta em um sistema de servidor. As informações da consulta incluem uma parte de uma consulta de um solicitante de pesquisa. O método também inclui a obtenção de um conjunto de consultas previstas relevantes para a parte da consulta do solicitante de pesquisa com base na parte da consulta do solicitante de pesquisa e dados indicativos do comportamento do solicitante de pesquisa em relação às consultas enviadas anteriormente. O método também inclui fornecer o conjunto de consultas previstas ao solicitante de pesquisa.

