Patente dos resultados da pesquisa segura do Google e reclassificação ou remoção de resultados

Publicados: 2018-10-11

Como o Google usa um filtro de resultados de pesquisa seguros para lidar com resultados de pesquisa inadequados, confidenciais ou ofensivos?

Um dos problemas que os pesquisadores podem ter com a internet é ser surpreendido por conteúdo que não esperam ver ou que também não querem expor outras pessoas. Uma patente concedida recentemente pelo Google nos fala sobre os esforços dos motores de busca para proteger os usuários de tal conteúdo. Como eles expressam dentro dessa patente:

Os usuários da Internet podem pesquisar vários tipos de conteúdo usando mecanismos de pesquisa. O conteúdo da Internet pode incluir conteúdo sensível ou ofensivo, como, por exemplo, pornografia, imagens sangrentas e conteúdo violento. Em alguns casos, os usuários podem ser expostos involuntariamente a conteúdo impróprio ou ofensivo. Conseqüentemente, pode ser desejável limitar a exposição a conteúdo impróprio ou ofensivo disponível na Internet.

A patente refere-se aos resultados de pesquisa seguros várias vezes, e eu me lembro de ouvir sobre Matt Cutts do Google ser responsável por o Google mostrar os resultados de pesquisa seguros antes de se tornar o chefe de spam do Google. Eu me perguntei se havia uma patente no Safe Search Results, ou se ele pode ter algo a ver com isso, mas eu não tinha visto nenhuma. Este menciona os resultados de pesquisa seguros tantas vezes que provavelmente vou considerá-los como a patente dos resultados de pesquisa seguros do Google.

O objetivo por trás da patente do Google Safe Search Results é proteger os pesquisadores que usam o mecanismo de pesquisa do Google de serem expostos a conteúdo que eles podem não querer ver:

Esta divulgação geralmente descreve um método e sistema para aplicar classificadores a consultas de pesquisa e resultados de pesquisa para fornecer uma experiência de pesquisa na qual os usuários são protegidos da exposição a conteúdo impróprio ofensivo ou sensível.

Exatamente como funcionam esses classificadores de resultados de pesquisa seguros?

1) Em resposta a uma consulta, um mecanismo de pesquisa retornará um conjunto preliminar de SERPs.
2) A consulta é classificada por um classificador para determinar se inclui um ou mais termos associados a uma classe protegida de pessoas ou termos associados a conteúdo sensível ou ofensivo, como conteúdo pornográfico ou violento.
3) Os resultados preliminares também são classificados para determinar se contêm conteúdo sensível ou ofensivo
4) Os resultados da pesquisa são devolvidos a um pesquisador, de forma que o conteúdo sensível ou ofensivo impróprio não seja mostrado a um pesquisador.

O pesquisador recebe uma indicação de que a consulta de pesquisa está classificada para incluir termos de consulta que

(i) provavelmente não se relacionam com uma classe particular de pessoas,
(ii) provavelmente relacionado a uma classe particular de pessoas, ou
(iii) provavelmente se relacionam com uma classe particular de pessoas e incluem termos delicados ou ofensivos.

Além disso, eles serão informados de que o resultado da pesquisa está classificado como provável, incluindo

(i) conteúdo não sensível e não ofensivo, ou
(ii) conteúdo sensível ou ofensivo.

A partir do conjunto de resultados de pesquisa do candidato, um conjunto de apresentação de resultados de pesquisa seguros é selecionado, o qual será exibido pelo menos em
(I) a indicação de que a consulta de pesquisa é classificada como incluindo termos de consulta que

(i) provavelmente não estão relacionados a uma classe particular de pessoas,
(ii) provavelmente estão relacionados a uma classe particular de pessoas, ou
(iii) provavelmente estão relacionados a uma classe específica de pessoas e incluem termos delicados ou ofensivos, e

(II) a indicação de que o resultado da pesquisa é classificado como provável, incluindo:

(i) conteúdo não sensível e não ofensivo, ou
(ii) conteúdo sensível ou ofensivo. Os um ou mais resultados da pesquisa do conjunto de apresentação dos resultados da pesquisa são fornecidos para saída em resposta à consulta de pesquisa.

Para alguns desses resultados, existe uma classe particular de pessoas afetadas que inclui um grupo de pessoas com pelo menos uma característica demográfica em comum.

E em alguns resultados, os termos sensíveis ou ofensivos podem incluir termos associados a um ou mais itens de pornografia, violência, sangue e falsificação. O conteúdo sensível ou ofensivo inclui imagens, vídeos ou dados associados a um ou mais itens de pornografia, violência, sangue e falsificação.

Em alguns casos, a seleção do conjunto de apresentação de resultados de pesquisa seguros entre o conjunto de resultados de pesquisa candidato inclui uma ou mais das seguintes ações:

Em alguns casos, a classificação de um resultado de pesquisa no conjunto candidato de resultados de pesquisa é reduzida com base em

(i) a indicação de que a consulta de pesquisa usada para obter o resultado da pesquisa é classificada como provavelmente relacionada a uma classe particular de pessoas, e
(ii) a indicação de que o resultado da pesquisa é classificado como provável, incluindo conteúdo sensível ou ofensivo.

Em alguns casos, um resultado da pesquisa no conjunto candidato de resultados da pesquisa pode ser filtrado para remover o resultado da pesquisa do conjunto de apresentação dos resultados da pesquisa com base em

(i) a indicação de que a consulta de pesquisa usada para obter o resultado da pesquisa é classificada como provavelmente relacionada a uma classe particular de pessoas e incluindo termos sensíveis ou ofensivos, e
(ii) a indicação de que o resultado da pesquisa é classificado como provável, incluindo conteúdo sensível ou ofensivo.

Em alguns casos, um resultado da pesquisa no conjunto candidato de resultados da pesquisa segura pode ser selecionado para ser incluído no conjunto de apresentação dos resultados da pesquisa sem modificar uma classificação do resultado da pesquisa ou filtrar o resultado da pesquisa com base na indicação de que a consulta de pesquisa usou para obter o resultado da pesquisa é classificado como improvável relacionado a uma classe específica de pessoas e provavelmente incluindo termos não confidenciais e não ofensivos.

Em alguns casos, a seleção do conjunto de apresentação dos resultados da pesquisa entre o conjunto candidato de resultados da pesquisa inclui uma ou mais das seguintes ações:

(1) Em alguns casos, um resultado da pesquisa no conjunto candidato de resultados da pesquisa pode ser selecionado para ser incluído no conjunto de apresentação dos resultados da pesquisa sem modificar uma classificação do resultado da pesquisa ou filtrar o resultado da pesquisa com base na indicação de que a pesquisa A consulta usada para obter o resultado da pesquisa é classificada como provavelmente não relacionada a uma determinada classe de pessoas e provavelmente incluindo termos sensíveis ou ofensivos.

(2) Em alguns casos, um resultado da pesquisa no conjunto candidato de resultados da pesquisa pode ser filtrado para remover o resultado da pesquisa do conjunto de apresentação dos resultados da pesquisa com base na indicação de que a consulta de pesquisa usada para obter o resultado da pesquisa é classificada como provável relacionadas a uma classe específica de pessoas e, provavelmente, incluindo termos delicados ou ofensivos.

(3) Em alguns casos, as ações do método implementado por computador também podem incluir a geração de uma pontuação de relevância para um documento correspondente a cada resultado da pesquisa no conjunto candidato de resultados da pesquisa, determinando uma classificação para cada resultado da pesquisa no conjunto candidato de resultados de pesquisa e recebimento de dados de sessão do usuário que incluem um ou mais atributos de um dispositivo do usuário.

A pontuação de relevância é um indicativo da relevância do documento para a consulta de pesquisa. A seleção do conjunto de apresentação dos resultados da pesquisa entre o conjunto candidato de resultados da pesquisa inclui ainda a modificação de classificações de um ou mais resultados da pesquisa no conjunto candidato de resultados da pesquisa com base nos dados da sessão do usuário que inclui um ou mais atributos do dispositivo do usuário .

Em alguns casos, a seleção do conjunto de apresentação dos resultados da pesquisa de entre o conjunto candidato de resultados da pesquisa pode incluir, para cada documento correspondente a um resultado da pesquisa, atribuir um rótulo ao documento com base, pelo menos, na indicação de que o resultado da pesquisa é classificado como incluindo conteúdo sensível ou ofensivo e determinando filtrar o resultado da pesquisa ou modificar a classificação do resultado da pesquisa com base no rótulo atribuído. A etiqueta é um indicativo do assunto incluído no documento.

A patente onde todas essas filtragens ou inclusões podem ser feitas é descrita em:

Protegendo os usuários de resultados de pesquisa inadequados, sensíveis ou ofensivos
Inventores: Matthias Heiler, Michael Schaer, Nikola Todorovic, Robin Nittka, Thomas Fischbacher e Laura Dragoi;
Cessionário: Google LLC
Patente dos EUA: 10.083.237
Concedido: 25 de setembro de 2018
Arquivado: 31 de agosto de 2015

Resumo

Um sistema e método para fornecer uma experiência de pesquisa em que os usuários são protegidos da exposição a conteúdo impróprio ou ofensivo são descritos. Um sistema de pesquisa pode classificar uma consulta de pesquisa e os resultados da pesquisa de candidato obtidos em resposta à consulta de pesquisa. Com base na classificação da consulta de pesquisa e dos resultados da pesquisa, os resultados da pesquisa do candidato podem ser modificados para gerar um conjunto de resultados da pesquisa apresentados a um usuário de forma que os resultados da pesquisa apresentados não incluam conteúdo sensível ou ofensivo impróprio.

Algumas definições sob a Patente de Resultados de Pesquisa Segura

A patente define “conteúdo sensível ou ofensivo” para nós, referindo-se a, mas não se limitando a, pornografia, imagens sangrentas e conteúdo violento.

Também define “conteúdo sensível ou ofensivo impróprio” como uma subcategoria do conteúdo sensível ou ofensivo e pode incluir conteúdos como:

Conteúdo de recrutamento de gangue
Conteúdo de incitação à violência
Conteúdo que zomba de um determinado grupo demográfico ou incita ao ódio contra um determinado grupo demográfico
Conteúdo falso

“Em geral, também pode se referir a qualquer conteúdo ilegal, abusivo ou altamente questionável para uma classe protegida de usuários da Internet.”

A patente também nos diz que visa proteger os pesquisadores que podem ser sensíveis a alguns resultados de pesquisa:

Essa classe protegida de usuários pode incluir qualquer grupo de pessoas com pelo menos uma característica demográfica em comum e para as quais se deseje proteção contra conteúdo sensível ou ofensivo da Internet.

Como o conteúdo é tratado por adolescentes como uma classe protegida

A descrição da Patente de resultados de pesquisa segura começa com um exemplo de resultados de pesquisa que têm como alvo adolescentes em resposta a uma consulta como “Por que os adolescentes ingressam em grupos”. O mecanismo de pesquisa recebe essa consulta, obtém um conjunto de resultados da pesquisa para mostrar em resposta a essa consulta.

O mecanismo de pesquisa também recebe vários sinais de classificação e seleciona um conjunto de resultados de pesquisa do conjunto de resultados de pesquisa de candidatos para apresentar a um pesquisador filho, com base nos sinais de classificação.

Um dos resultados da pesquisa intitulado "Recrutamento de adolescentes" recebe uma pontuação de relevância de 96 e um rótulo indicando que o documento do resultado da pesquisa correspondente a "Recrutamento de adolescentes" inclui conteúdo que pode ser apresentado a todos os usuários, incluindo uma criança, e não incluir conteúdo sensível ou ofensivo.

Outro resultado é intitulado “Recrutadores de gangues adolescentes” com uma pontuação de relevância de 87 e atribuído um rótulo “v” indicando que o documento do resultado da pesquisa correspondente a “Recrutadores de gangues adolescentes” provavelmente inclui conteúdo violento ou imagens perturbadoras.

Alguns outros resultados da pesquisa são intitulados “Notícias: Grupos de adolescentes” e “Grupos de crianças”, que têm pontuações de relevância de 79 e 34, respectivamente, e com rótulos atribuídos indicando que os documentos de resultados da pesquisa correspondem a “Notícias: Grupos de adolescentes” e “Grupos de crianças ”e provavelmente incluem conteúdo que pode ser apresentado a todos os usuários, incluindo um usuário infantil, e não incluem conteúdo sensível ou ofensivo.

Com base nos sinais de classificação usados, alguns resultados podem ser aprovados, alguns podem ser removidos e outros podem ser classificados novamente antes de serem apresentados a um pesquisador filho.

Alguns dos resultados podem ser re-classificados para serem apresentados em uma posição superior nos resultados da pesquisa, como aquele sobre “Notícias: Grupos de Adolescentes”.

Alguns dos resultados podem ser re-classificados para uma classificação inferior, como aquele sobre “Recrutadores de gangues adolescentes”, que provavelmente terá conteúdo violento associado a adolescentes.

A patente dos resultados da pesquisa segura nos diz que o foco desta abordagem é:

O conjunto selecionado de resultados de pesquisa são produzidos como um conjunto de apresentação de resultados de pesquisa no dispositivo do usuário, de forma que o usuário infantil possa desfrutar de uma experiência de pesquisa segura sem exposição a conteúdo impróprio ou ofensivo.

Outros grupos protegidos e outros filtros

A patente de resultados de pesquisa segura fornece outros exemplos, para outros grupos, como resultados sobre

(i) "Falsificação de advogado de patentes" com uma pontuação de relevância de 96 e um rótulo indicando que o documento associado ao resultado da pesquisa intitulado "Falsificação de advogado de patentes" provavelmente inclui conteúdo sensível ou ofensivo impróprio, como conteúdo falso associado a uma classe protegida de pessoas (por exemplo, advogados de patentes).

(ii) “Partidas em praticantes de IP” com uma pontuação de relevância de 92 e um rótulo indicando que o documento associado ao resultado da pesquisa intitulado “Partidas em praticantes de IP” provavelmente inclui conteúdo sensível ou ofensivo impróprio, como piadas ofensivas dirigidas a uma classe protegida de pessoas;

(iii) “Momentos engraçados do advogado de patentes” com uma pontuação de relevância de 89 e um rótulo indicando que o documento associado ao resultado da pesquisa intitulado “Momentos engraçados do advogado de patentes” provavelmente não inclui qualquer conteúdo sensível ou ofensivo; e

(iv) “Dê humor a um advogado” com uma pontuação de relevância de 74 e um rótulo indicando que o documento associado ao resultado da pesquisa intitulado “Dê humor a um advogado” provavelmente não inclui qualquer conteúdo sensível ou ofensivo.

A patente nos diz qual conteúdo dessas consultas provavelmente foi removido ou reorganizado.

A patente também inclui outros exemplos que cobrem coisas como piadas políticas, memes políticos e escândalos políticos.

Ele também fornece mais detalhes sobre como o mecanismo de pesquisa identifica o conteúdo que deseja filtrar.

O maior resultado da patente de resultados de pesquisa seguros

Eu não tinha visto o Google dizendo nada sobre remover ou reorganizar os resultados da pesquisa com base no fornecimento de resultados de pesquisa seguros envolvendo grupos protegidos antes. Eu me lembro de um processo legal contra o Google, onde um Tribunal Federal decidiu em 2003 que o PageRank tinha a fala protegida pela Primeira Emenda.