Repassando o conteúdo com base na pontuação do autor (concedido!)
Publicados: 2018-12-11Uma pesquisa que fiz no Twitter sobre classificações de conteúdo
Fiz uma enquete no Twitter, perguntando se um autor original postou uma postagem de blog em seu próprio site e, em seguida, postou a mesma postagem em uma revista online, qual versão teria uma classificação mais elevada? Dei escolhas do site do autor original, da revista online e um resultado “Depende”, pedindo comentários que os explicassem. Recebi alguns comentários excelentes cobrindo muito terreno.
A votação retornou 556 votos da seguinte forma:
Um autor escreve em seu próprio blog e publica em uma revista online. O que o Google teria uma classificação mais elevada:
- Bill Slawski (@bill_slawski) 6 de dezembro de 2018
Havia muitas opiniões sobre o que poderia fazer com que a postagem do autor ou da revista online tivesse uma classificação mais elevada., Como esta de John Alexander:
Depende de qual site tem mais / melhor conteúdo. Como leitor, quero ver esse artigo, mas também quero descobrir o conteúdo relacionado, então, se o autor raramente postar ou apenas postar um conteúdo breve e não muito detalhado, prefiro ver a revista. Converse é verdadeiro se o autor tiver muito conteúdo bom.
- John Alexander (@CallMeLouzander) 7 de dezembro de 2018
Várias pessoas sugeriram que a canonização de domínio cruzado também deveria ser usada idealmente, como Jonah Stein:
Em teoria, o Google deveria classificar a primeira instância. Além disso, em teoria, o autor DEVE usar rel = canonical para apontar para a primeira instância. Na prática, se a revista online estiver no assunto e tiver mais autoridade, ela será classificada ali, a menos que links / sinais sociais apontem para o blog do autor
- Jonah Stein (@Jonahstein) 6 de dezembro de 2018
Como um autor que pode controlar seu próprio site, mas não controlar esse site de revista online, pode ser difícil fazer com que a revista online aponte um elemento de link canônico para o seu site.
Pedi a Vikki Fraser um exemplo de seu artigo superando uma revista online por conteúdo muito semelhante:
Exemplo usando moi: pic.twitter.com/D8LOiuDhPc
- Vikki Fraser (@vikkiorlando) 7 de dezembro de 2018
Cyrus Shepard também me perguntou se a inversão de link se aplicaria ou não:
Outras considerações de SEO à parte (rel canonical, meta-robôs, etc) eu acho que a explicação @dejanseo de Percolator / Inversão de Link. Parece acontecer com frequência com artigos do Medium. https://t.co/4BNur4edRJ
- Cyrus (@CyrusShepard) 6 de dezembro de 2018
Minha resposta foi que, até onde eu sei, o Google não aplica inversão de link. Eu explorei Link Inversion quando escrevi sobre o Google tentando identificar a versão primária de páginas duplicadas.
Algumas pessoas, como Martin McGarry, sentiram que dependia de quão topicamente relevante o conteúdo pode ser para cada um dos lugares publicados:
Muitas variáveis, então vou oferecer um exemplo variante. Você faz um blog sobre um tópico no qual não atua. Mas uma revista do setor o pega. Em seu blog tem pouca ou nenhuma relevância, mas em uma revista do setor pode ser considerado conteúdo autoritário, mesmo se duplicado.
- Martin McGarry (@seomcgarry) 6 de dezembro de 2018
Ou, como Joshua Levenson observou, pode depender da versão publicada primeiro:
Depende do que é rastreado primeiro.
- roghan josh levenson (@josh_levenson) 6 de dezembro de 2018
A resposta de Peter McCarthy parece corresponder à minha própria experiência e a um pedido de patente do Google publicado recentemente, sobre o qual estou incluindo informações neste artigo:
Eu fiz isso um tempo atrás e assisti. No entanto, anedótico. Mudou com a classificação da revista por um tempo no início (sua autoridade é alta), mas meu original superou a revista com o tempo. Também parece depender se a consulta é mais “o tópico” vs. “eu + o tópico”.
- Peter McCarthy (@petermccarthy) 6 de dezembro de 2018
Repassando resultados para uma entidade com base na pontuação do autor
Recentemente, foi publicado um pedido de patente que nos fala sobre um método de remarcação para resultados de pesquisa quando envolve resultados que têm conteúdo muito semelhante ou substancialmente o mesmo. Ele distingue esses resultados dizendo que um deles é de uma entidade que não é conhecida por produzir conteúdo original (ela copia ou redistribui o conteúdo original de autoria de outras entidades. A outra parte do conteúdo está associada a uma segunda entidade que é conhecida por produzir conteúdo original.
Há uma referência a uma patente provisória neste pedido de patente que tem um título muito interessante, e de acordo com esta patente foi incorporada a ele em sua totalidade. Essa patente é o Pedido de Patente Provisório dos EUA nº 61 / 648.562 depositado em 17 de maio de 2012, intitulado “Sistemas e Métodos para Determinar a Probabilidade de uma Entidade ser Autor do Conteúdo Original” (Este link é para o pedido de patente WIPO. )
Classificações mais altas para um autor original, independentemente das pontuações de relevância
Portanto, este pedido de patente de pontuação do autor nos diz que:
… Às vezes, é desejável classificar os resultados da pesquisa que correspondem a documentos associados a entidades que são autores do conteúdo original em um nível superior aos resultados da pesquisa correspondentes a documentos associados a entidades que não são autores do conteúdo original, embora os documentos sejam associados a entidades que não são autores de conteúdo original têm pontuações de relevância mais altas.
O algoritmo por trás desta patente do autor original envolve:
- (i) conteúdo enviado, onde o conteúdo enviado é identificado como sendo publicado por uma entidade
- (ii) um link para o local em um recurso que hospeda o conteúdo enviado; avaliar se o conteúdo enviado é representado em um índice de conteúdo conhecido para determinar se o conteúdo enviado é novo em relação ao conteúdo conhecido
- em resposta à avaliação, emitir uma solicitação a um mecanismo de pesquisa para rastrear e indexar o conteúdo enviado hospedado pelo recurso associado ao link quando o conteúdo enviado é novo em relação ao conteúdo conhecido, onde a solicitação ao mecanismo de pesquisa para rastrear e indexar o conteúdo enviado hospedado pelo recurso associado ao link é emitido em resposta à determinação de que o conteúdo enviado é considerado não representado no índice de conteúdo conhecido
A patente nos diz que a solicitação para rastrear o novo conteúdo iria para um rastreador de alta prioridade do mecanismo de busca, que é a primeira vez que ouço um deles sendo mencionado em uma patente do Google.

A patente também se refere ao uso de “telhas” para identificar conteúdo semelhante ou substancialmente o mesmo. Mais sobre as telhas neste artigo: Identificando e filtrando documentos quase duplicados
Parece que a patente do autor original analisará outro conteúdo de autoria da entidade que pode estar associado a uma das versões deste conteúdo:
Em algumas modalidades, antes de emitir a solicitação ao mecanismo de pesquisa para rastrear e indexar o conteúdo enviado hospedado pelo recurso associado ao link, o método inclui determinar que a entidade é uma autora do conteúdo original com base em uma avaliação de outro conteúdo enviado identificado como sendo publicado pela entidade, onde o outro conteúdo submetido identificado como sendo publicado pela entidade está incluído no conteúdo conhecido; e a solicitação ao mecanismo de pesquisa para rastrear e indexar o conteúdo enviado hospedado pelo recurso associado ao link é emitida em resposta à determinação de que o conteúdo enviado é considerado não representado no índice de conteúdo conhecido e à determinação de que a entidade é um autor do conteúdo original.
Este pedido de patente faz parecer que o Google está monitorando entidades que são autores, coletando pedaços de coisas que eles escreveram.
A patente também descreve um processo de verificação e registro que um autor pode usar para verificar se ele é o autor do conteúdo e para se registrar como autor.
Também nos informa que pode começar a registrar a data e hora do conteúdo com um identificador para a entidade associada ao conteúdo, incluindo pelo menos um autor do conteúdo ou um editor do conteúdo, ou pelo menos um site.
A patente também nos diz que pode determinar se as partes do conteúdo são semelhantes, determinando as pontuações do autor para cada uma das partes do conteúdo. Uma pontuação do autor também incluiria uma pontuação de citação para a entidade envolvida, que analisa a frequência com que o conteúdo dessa entidade é citado.
Como funciona o re-banco com base no fato de uma entidade ser um autor original
… O primeiro resultado da pesquisa tem uma classificação mais alta do que o segundo resultado da pesquisa; determinar que o primeiro documento e o segundo documento satisfazem um critério de similaridade; determinar que a segunda entidade satisfaz um diferencial de autoria predefinido em relação à primeira entidade; e responsivo à determinação de que a segunda entidade satisfaz o diferencial de autoria predefinido em relação à primeira entidade, troque o segundo resultado da pesquisa e o primeiro resultado da pesquisa nos resultados da pesquisa classificados para produzir resultados da pesquisa re-classificados.
O pedido de patente de pontuação do autor pode ser encontrado em:
(US20180341656) Sistemas e métodos para reclassificar os resultados de pesquisa classificados
Inventores: Chung Tin Kwok, Lei Zhong e Zhihuan Qiu
Número da publicação: 20180341656
Data de publicação: 29 de novembro de 2018
Candidatos: GOOGLE LLC
Resumo:
Um sistema, meio de armazenamento legível por computador que armazena pelo menos um programa e um método implementado por computador para reclassificar os resultados da pesquisa classificados são apresentados. Os resultados da pesquisa classificados que satisfazem uma consulta de pesquisa são obtidos, onde os resultados da pesquisa classificados incluem um primeiro resultado da pesquisa correspondente a um primeiro documento associado a uma primeira entidade e um segundo resultado da pesquisa correspondendo a um segundo documento associado a uma segunda entidade, e onde o primeiro o resultado da pesquisa tem uma classificação superior ao segundo resultado da pesquisa. O primeiro documento e o segundo documento são determinados para satisfazer um critério de similaridade. A segunda entidade é determinada para satisfazer um diferencial de autoria predefinido em relação à primeira entidade. Respondendo à determinação de que a segunda entidade satisfaz o diferencial de autoria predefinido em relação à primeira entidade, o segundo resultado da pesquisa e o primeiro resultado da pesquisa nos resultados da pesquisa classificados são trocados para produzir resultados da pesquisa re-classificados.
Algumas conclusões sobre a pontuação do autor
A patente fornece muitos detalhes que valem a pena ser examinados se você quiser saber mais. Por exemplo, o autor do conteúdo é descrito em detalhes meticulosos da seguinte forma:
Por exemplo, a respectiva entidade pode incluir um autor individual ou um de uma pluralidade de co-autores para (ou contribuidores de) conteúdo. Em algumas modalidades, uma entidade é uma organização empresarial que produz conteúdo original ou parcialmente original. Em algumas modalidades, uma entidade é uma organização de notícias. Em algumas implementações, a entidade inclui pelo menos um editor de conteúdo. Por exemplo, a respectiva entidade pode ser uma editora de livros, uma editora de periódicos, uma editora de conteúdo online! e / ou semelhantes. Em algumas implementações, a respectiva entidade é a autora do conteúdo de pelo menos um site. Por exemplo, a respectiva entidade pode contribuir com conteúdo original para um site de blog, um site para um editor (por exemplo, notícias, revista, etc.) e / ou semelhantes. Observe que esse site pode incluir um subconjunto do conteúdo de um domínio específico. Por exemplo, o site pode incluir conteúdo em um domínio específico (por exemplo, um domínio de nível superior example.com). Em outro exemplo, o site inclui conteúdo em um subdomínio do domínio específico (por exemplo, um subdomínio biogs.example.com). Em outro exemplo, o site inclui conteúdo em um diretório do domínio (por exemplo, www.example.com/johndoe/). Em algumas modalidades, o site inclui conteúdo em uma pluralidade de domínios (por exemplo, uma rede de sites afiliados), uma pluralidade de subdomínios de pelo menos um domínio e / ou uma pluralidade de subdiretórios de pelo menos um domínio. Em algumas modalidades, o conteúdo de autoria de uma entidade é uma postagem de blog, uma postagem de rede social ou uma postagem em um tópico de discussão online. Em algumas modalidades, o conteúdo de autoria da entidade é qualquer conteúdo que foi postado em um local acessível na Internet de forma que seja prontamente verificável que a entidade postou o conteúdo.
A patente me lembrou do programa de autoria do Google no Google+, onde você vinculava ao lugar que publicou como autor com rel = ”me” em seu link para esse site.
É interessante criar uma pontuação de autor que inclua uma pontuação de citação identificando com que frequência um autor pode ser citado em outro lugar na Web. A ideia de usar citações como uma forma de pontuar autores me lembra do uso de citações no PageRank, conforme descrito em The PageRank Citation Ranking: Trazendo ordem para a web. Como o resumo desse artigo nos diz:
Este artigo descreve o PageRank, um método para classificar páginas da Web de maneira objetiva e mecânica, medindo efetivamente o interesse humano e a atenção dedicada a elas.
Adicionado em 10 de dezembro de 2019 - Esta patente foi concedida hoje em Sistemas e métodos para reclassificar os resultados de pesquisa classificados. Atua para alternar os dois primeiros resultados em um conjunto de resultados de pesquisa com base em uma pontuação do autor original para o autor do primeiro artigo e uma pontuação do autor superior para o autor do segundo artigo.
