Como o Google pode usar avaliações para aprender sobre atributos de entidade
Publicados: 2018-09-06
Sobre Atributos de Entidade
Quando vemos o Google falar sobre as propriedades de diferentes entidades, elas costumam se referir a elas como atributos de entidade e costumam defini-las em pares chave / valor. Por exemplo, Abraham Lincoln tem uma altura de 6'4 ″. A Alphabet é uma holding com sede em Mountain View, Califórnia. Paul Newman tem olhos azuis. Fortnite é um jogo multijogador.
Algumas análises online são especificamente sobre entidades como produtos, criadores de produtos e / ou fornecedores de produtos. Essas análises podem conter informações sobre os atributos da entidade nos quais os pesquisadores podem estar interessados. Uma patente concedida ao Google na semana passada nos diz que ele pode coletar informações sobre os atributos da entidade de análises nas quais os pesquisadores podem estar interessados, e como eles podem fazer isso. Isso é importante, porque como a patente nos diz:
Esses tipos de avaliações de usuários podem incluir informações sobre entidades que podem não ter sido fornecidas ou geradas, por exemplo, pelas próprias entidades.
As informações sobre os atributos das entidades vão das críticas ao índice do Google
Este processo envolvendo atributos de entidade pode envolver:
(1) Identificar , com base em um corpus de consultas do usuário, uma ou mais categorias de interesse do usuário observado;
(2) Detectar , em uma ou mais análises de usuários associadas a um produto, um ou mais segmentos de texto relacionados a uma ou mais categorias de interesse do usuário observado;
(3) E com base na detecção, indexação , em um banco de dados pesquisável, do produto em uma ou mais categorias de interesse do usuário observado.
Assim. o mecanismo de pesquisa pode examinar as consultas sobre uma entidade para identificar o que os pesquisadores podem estar interessados nessas entidades e usar essas consultas para identificar o texto em resenhas em que os pesquisadores possam estar interessados e indexar esse texto para que os pesquisadores possam encontrar respostas para o consultas que eles têm sobre entidades como produtos, fabricantes de produtos e fornecedores de produtos.
O Google pode contar o número de consultas perguntando sobre determinados atributos de entidade para entender quanto interesse existe nas respostas a essas perguntas, ou qual pode ser o interesse do usuário nelas.
O aprendizado de máquina pode ser usado para identificar se as consultas estão interessadas no próprio produto ou no fabricante do produto.
A entidade atribui patente em questão, concedida na semana passada, pode ser consultada em:
Analisando resenhas de usuários para determinar os atributos da entidade
Inventores: Advay Mengle, Jindong Chen, Charmaine Cynthia Rose D'Silva e Anna Patterson
Cessionário: GOOGLE LLC
Patente dos EUA: 10.061.767
Concedido: 28 de agosto de 2018
Arquivado: 16 de junho de 2017
Resumo
Métodos e aparelhos são descritos neste documento para classificar avaliações de usuários ou partes delas como sendo relacionadas a várias entidades, e para associar segmentos descritivos extraídos de texto contido nessas avaliações de usuários ou partes delas com entidades com base nas classificações. Em várias implementações, uma ou mais categorias de interesse do usuário observado podem ser identificadas com base em um corpus de consultas do usuário. Um ou mais segmentos de texto relacionados a uma ou mais categorias de interesse do usuário observado podem ser detectados em uma ou mais análises de usuários associadas a um produto. Com base na detecção, o produto pode ser indexado em uma ou mais categorias de interesse do usuário observado em um banco de dados pesquisável. Em algumas implementações, o banco de dados pesquisável pode ser acessível a um ou mais dispositivos clientes remotos e pode ser pesquisável por uma ou mais categorias de interesse do usuário observado para fornecer resultados de pesquisa a serem renderizados por um ou mais dispositivos clientes remotos.
Avaliações de usuários, conforme descrito nesta patente, podem ser de fontes como:
- blogs
- postagens em redes sociais
- emails
- artigos escritos para sites ou para publicações impressas, como revistas ou jornais
- postagens feitas em uma seção de revisão do usuário de um fornecedor ou mercado online
- avaliações de usuários enviadas a várias câmaras de compensação de avaliações de usuários existentes
Essas análises podem então ser classificadas com base nas categorias de interesse que podem abranger e nas entidades sobre as quais podem conter informações relacionadas. É interessante porque essa patente nos fala sobre como o aprendizado de máquina pode fazer parte do processo envolvido na execução dessas etapas.

Em algumas implementações, uma ou mais "categorias de interesses" em entidades podem ser empregadas para classificar avaliações de usuários e / ou partes delas como sendo relacionadas a entidades específicas. A detecção de palavras ou frases em uma avaliação do usuário que correspondem a essas categorias (por exemplo, como suficientemente semelhantes) pode ser interpretada como sinais para classificar a avaliação do usuário ou uma parte dela como relacionada a uma entidade. As categorias de interesse podem vir em várias formas, como categorias de interesse previsto e categorias de interesse observado. Em várias implementações, um mecanismo de categoria pode manter um índice de categorias que pode ser usado pelo mecanismo classificador para classificar as avaliações do usuário e / ou partes delas.
Se você é um fã de jogos online, a patente fornece vários exemplos focados neles para descrever como o processo por trás da patente funciona:
As categorias de interesses observados, por outro lado, podem ser determinadas, por exemplo, por mecanismo de categoria, com base em padrões observados na atividade do usuário, como entre uma pluralidade (ou corpus) de consultas do usuário. Por exemplo, e continuando com o mercado online de aplicativos, por exemplo, vários usuários podem pesquisar aplicativos usando termos ou frases iguais ou semelhantes. Se um número suficiente de usuários enviar consultas contendo uma palavra ou frase específica (ou variações semelhantes), o mecanismo de categoria pode considerar essas palavras ou frases como uma categoria de interesse observado e pode atualizar o índice de acordo. Portanto, se um número suficiente de usuários pesquisar um mercado online para “jogos de RPG online para múltiplos jogadores” ou “MMORPG”, uma categoria de MMORPG pode ser estabelecida.
Os processos que envolvem a extração de texto de avaliações também são descritos e incluem coisas como comparações entre diferentes entidades (como “O produto X é melhor do que o produto Y.”)
A patente dispensa muita atenção em como as informações e palavras e frases específicas podem ser extraídas de avaliações e responde a perguntas, como se houvesse muitas perguntas sobre "câmeras que têm ótimos recursos de zoom óptico", as informações podem ser extraído que respondeu aquela consulta para uma determinada câmera. E esse tipo de informação pode ser obtido a partir de análises de câmeras feitas por usuários.
Recebemos uma dica das implicações de tais extrações:
O mecanismo de gráfico pode executar várias ações com esses atributos e / ou pontuações de entidade recém-associados. Por exemplo, em algumas implementações, o motor gráfico pode interagir com um motor de busca (não representado) e pode indexar uma ou mais entidades com base em um ou mais segmentos descritivos de texto que estão associados a essas uma ou mais entidades, por exemplo, por texto descritivo mecanismo de associação.
Uso de avaliações para aprender sobre os atributos da entidade
É interessante que o Google possa usar conteúdo gerado pelo usuário, como análises de produtos, para saber mais sobre esses produtos, os fabricantes desses produtos e os distribuidores dos produtos.
Vimos que o Google tem interesse em resenhas de produtos, empresas e lugares porque os pesquisadores têm procurado essas coisas. Também vimos o Google falar sobre como eles podem usar as avaliações para aprender sobre o sentimento em relação às entidades. Esta patente leva esse interesse um passo adiante, além de apenas disponibilizar avaliações para os pesquisadores ou apontar frases cheias de sentimento. Busca aprender sobre o que está sendo revisado para que possa combinar interesses específicos com informações que respondam a eles.
A patente nos fala sobre onde as resenhas podem ser encontradas online, como o texto dessas resenhas pode ser classificado e extraído, como o interesse nas consultas dos pesquisadores pode ser gerado por crowdsourcing para entender o que esses pesquisadores podem estar interessados em aprender e que um mecanismo de pesquisa pode mostrar aos pesquisadores informações que atendam a esses interesses sobre atributos específicos da entidade.
Talvez as resenhas sejam um bom lugar para aprender informações sobre os atributos da entidade que essas entidades não estão compartilhando. O que você acha?
