Como o mecanismo de pesquisa de empregos do Google usa aprendizado de máquina

Publicados: 2018-04-27

Algumas pessoas me perguntaram recentemente por que acho importante compartilhar patentes que descrevem coisas que um mecanismo de pesquisa pode oferecer, como um mecanismo de pesquisa de empregos adicionado recentemente. O objetivo legal por trás de uma patente é dar ao detentor da mesma a chance de excluir outros de usar o mesmo processo que eles e impedir que outros infrinjam suas invenções. A compensação por trás de tal exclusão é a exigência de que patentes acabem sendo publicadas, para dar aos outros exemplos de como as pessoas estão inovando para tentar superar problemas, o que pode ser inspirador, e dar às pessoas alguns insights sobre as suposições que esses inventores podem ter sobre a pesquisa e pesquisadores e a web.

Motor de pesquisa de empregos do Google

É sempre divertido quando o Google apresenta alguns novos recursos e, em seguida, pesquisando por novas patentes no mecanismo de pesquisa, esse novo recurso é o assunto de uma dessas patentes. Por exemplo, você deve ter notado que o Google introduziu um mecanismo de pesquisa de empregos Google, como você pode ver os resultados aqui:

Resultados da pesquisa de empregos do Google

Existem artigos sobre esse mecanismo de pesquisa de empregos:

O mecanismo de pesquisa de empregos do Google obtém faixas salariais, um filtro de localização melhor e muito mais

Existem também páginas de ajuda do Google sobre a Pesquisa de empregos do Google:

Pesquise empregos no Google

Se o Google começou um mecanismo de pesquisa hoje ...

A nova patente tem um nome muito simples, “Search Engine”. Por ter adotado essa abordagem, me perguntei como seria o Google se as pessoas que trabalham nele começassem a construí-lo hoje. Achei interessante que eles incluíram estas definições do que é um mecanismo de pesquisa, que inicia a descrição da patente:

Um mecanismo de pesquisa pode geralmente ser descrito como qualquer programa que executa uma pesquisa e recupera os dados armazenados. No entanto, com base na tarefa em mãos, um mecanismo de pesquisa pode ser configurado de várias maneiras diferentes. Por exemplo, alguns mecanismos de pesquisa podem ser configurados para realizar pesquisa e recuperação com base em palavras-chave. Esses mecanismos de pesquisa podem identificar resultados de pesquisa relevantes com base, pelo menos em parte, no número de vezes que um termo de pesquisa aparece em um recurso específico ou nos metadados do recurso específico. Como alternativa, ou também, alguns mecanismos de pesquisa podem identificar os resultados da pesquisa como sendo responsivos a uma consulta porque um provedor de recursos pagou ao provedor do mecanismo de pesquisa uma quantia em dinheiro para devolver o (s) recurso (s) do provedor em resposta a consultas de pesquisa que incluem um termo de pesquisa específico . No entanto, as formas mencionadas acima com que um mecanismo de pesquisa pode identificar resultados de pesquisa que respondem a uma consulta são meramente exemplares.

Um mecanismo de pesquisa também pode ser configurado para identificar resultados de pesquisa que respondem a uma consulta de várias outras maneiras. Uma configuração personalizada de um mecanismo de pesquisa pode ser empregada, conforme necessário, para resolver problemas específicos relacionados à pesquisa e recuperação. A personalização de um mecanismo de pesquisa pode incluir alterar a maneira como um mecanismo de pesquisa executa uma pesquisa, identifica resultados de pesquisa relevantes, classifica os resultados de pesquisa identificados ou semelhantes.

Expandindo as pesquisas por palavra-chave no mecanismo de pesquisa de empregos do Google

Esta patente enfoca a busca de emprego, ao invés de todas as buscas. Ele descreve mais detalhadamente os detalhes por trás do que o Google está oferecendo com a pesquisa de empregos e por que a implementação da pesquisa de empregos pelo Google pode ser uma melhoria em relação às pesquisas de empregos oferecidas em outros lugares:

Em algumas implementações, é fornecido um modelo de identificação de emprego que aprimora a procura de emprego, melhorando a qualidade dos resultados da procura fornecidos em resposta a uma consulta de procura de emprego. Os resultados da pesquisa são aprimorados porque o modelo de identificação de empregos é capaz de identificar ofertas de empregos relevantes que, de outra forma, passariam despercebidas por algoritmos convencionais devido às limitações inerentes da pesquisa baseada em palavras-chave. Ao empregar métodos adicionais além de, ou além da pesquisa convencional baseada em palavras-chave, o modelo de identificação de trabalho pode identificar ofertas de trabalho relevantes que incluem títulos de trabalho que não correspondem às palavras-chave de uma consulta de pesquisa de trabalho recebida. Por exemplo, em resposta a uma consulta de procura de emprego que busca oportunidades de emprego para um "Guru de patentes", o modelo de identificação de emprego pode identificar ofertas de emprego relacionadas a um "advogado de patentes", um "advogado de propriedade intelectual", um "advogado" ou o gosto.

A patente nos dá um vislumbre disso neste desenho que a acompanha:

É interessante que esta pesquisa se expanda a pesquisas baseadas em palavras-chave como essa. Os inventores nos fornecem alguns insights sobre como o aprendizado de máquina desempenha um papel, ajudando a ir além da correspondência de palavras-chave em uma consulta com as ofertas de emprego, conforme descrito aqui:

De acordo com uma implementação, o assunto desta especificação pode ser incorporado em um método para facilitar a procura de emprego. O método pode incluir ações de definição de um vocabulário vetorial, definição de uma taxonomia de ocupação que inclui várias ocupações diferentes, obtenção de vários itens de dados de treinamento rotulados, em que cada item de dados de treinamento rotulado está associado a pelo menos (i) um cargo e (ii) uma ocupação, gerando, para cada um dos respectivos itens de dados de treinamento rotulados, um vetor de ocupação que inclui um peso de característica para cada respectivo termo no vocabulário de vetor, associando cada respectivo vetor de ocupação com uma ocupação na taxonomia de ocupação com base na ocupação do item de dados de treinamento rotulado usado para gerar o vetor de ocupação, recebendo uma consulta de pesquisa que inclui uma string relacionada a uma característica de uma ou mais oportunidades de emprego em potencial, gerando um primeiro vetor com base na consulta recebida, determinando, para cada respectiva ocupação do múltiplo ocupações na taxonomia de ocupação, uma pontuação de confiança que indica se o vetor de consultaé classificado corretamente na respectiva ocupação, selecionando a ocupação específica que está associada ao maior índice de confiança, obtendo uma ou mais ofertas de emprego usando a ocupação selecionada e fornecendo as ofertas de emprego obtidas em um conjunto de resultados de pesquisa em resposta à consulta de pesquisa .

Uma taxonomia ocupacional para o mecanismo de busca de empregos

A patente nos fala sobre como essa taxonomia de ocupação na qual as pesquisas de emprego se baseiam também pode ser desenvolvida:

As operações podem incluir o recebimento de uma consulta de pesquisa que inclui uma sequência relacionada a uma característica de uma ou mais oportunidades de emprego, gerando, com base na consulta recebida, um vetor de consulta que inclui um peso de característica para cada respectivo termo em um vocabulário de vetor predeterminado, determinando , para cada respectiva ocupação das múltiplas ocupações na taxonomia da ocupação, um escore de confiança que indica se o vetor de consulta está corretamente classificado na respectiva ocupação, selecionando a ocupação particular que está associada ao maior escore de confiança, obtendo um ou mais anúncios de emprego usando a ocupação selecionada e fornecendo os anúncios de emprego obtidos em um conjunto de resultados de pesquisa em resposta à consulta de pesquisa.

Pesos de recursos em termos de ocupação no mecanismo de pesquisa de empregos

A patente expande o peso do recurso para termos em consultas para o mecanismo de busca de empregos também:

Em algumas implementações, o peso do recurso pode ser baseado, pelo menos em parte, em um primeiro valor que representa uma frequência de termo que é determinada, com base pelo menos em parte, em várias ocorrências de cada termo respectivo no cargo dos respectivos dados de treinamento item. Alternativamente, ou ao lado, o peso do recurso pode ser baseado, pelo menos em parte, em um segundo valor que representa uma frequência de ocupação inversa que é determinada com base, pelo menos em parte, em várias ocupações na taxonomia de ocupação onde cada respectivo termo no trabalho o título do respectivo item de dados de treinamento está presente. Alternativamente, ou ao lado, o peso do recurso pode ser baseado, pelo menos em parte, em um terceiro valor que representa um derivado de ocupação que é baseado, pelo menos em parte, em uma densidade de cada respectivo termo no cargo dos respectivos dados de treinamento item em cada uma das respectivas ocupações na taxonomia de ocupação.

Em algumas implementações, o peso do recurso pode ser baseado, pelo menos em parte, em ambos (i) um segundo valor que representa a frequência de ocupação inversa que é determinada com base, pelo menos em parte, em várias ocupações na taxonomia de ocupação onde cada respectivo termo no cargo do respectivo item de dados de treinamento está presente e (ii) um terceiro valor que representa um derivado de ocupação que se baseia, pelo menos em parte, em uma densidade de cada respectivo termo no cargo do respectivo item de dados de treinamento em cada uma das respectivas ocupações na taxonomia de ocupação. Alternativamente, o peso do recurso pode ser baseado em uma soma de (i) o segundo valor que representa a frequência de ocupação inversa e (ii) um terço do terceiro valor que representa a derivada de ocupação.

A patente do mecanismo de pesquisa de empregos

(US20180107983) MOTOR DE PESQUISA

Número do aplicativo: 15296230
Data de inscrição: 18.10.2016
Número da publicação: 20180107983
Data de Publicação: 19/04/2018
Inventores: Seyed Reza Mir Ghaderi, Xuejun Tao, Ye Tian, ​​Matthew Courtney, Pei-Chun Chen e Christian Posse

Resumo:

Métodos, sistemas e aparelhos, incluindo programas de computador codificados em dispositivos de armazenamento, para realizar uma pesquisa de oportunidade de emprego. Em um aspecto, um sistema inclui um aparelho de processamento de dados e um dispositivo de armazenamento legível por computador tendo instruções armazenadas no mesmo que, quando executadas pelo aparelho de processamento de dados, fazem com que o aparelho de processamento de dados execute operações. As operações incluem definir um vocabulário de vetor, definir uma taxonomia de ocupação que inclui várias ocupações diferentes, obter vários itens de dados de treinamento rotulados, em que cada item de dados de treinamento rotulado está associado a pelo menos (i) um cargo e (ii) uma ocupação, gerar, para cada um dos respectivos itens de dados de treinamento rotulados, um vetor de ocupação que inclui um peso de característica para cada respectivo termo no vocabulário de vetor e associar cada respectivo vetor de ocupação a uma ocupação na taxonomia de ocupação com base na ocupação dos dados de treinamento rotulados item usado para gerar o vetor de ocupação.