Cambio de clasificación del contenido según la puntuación del autor (¡concedido!)
Publicado: 2018-12-11Una encuesta que realicé en Twitter sobre las clasificaciones de contenido
Hice una encuesta en Twitter, preguntando si un autor original publicó una publicación de blog en su propio sitio y luego publiqué la misma publicación en una revista en línea, ¿qué versión terminaría clasificando más alto? Di opciones del sitio del autor original, la revista en línea y un resultado de "Depende", solicitando comentarios que los expliquen. Recibí excelentes comentarios que abarcan mucho terreno.
La encuesta arrojó 556 votos de la siguiente manera:
Un autor escribe una publicación en su propio blog y la publica en una revista en línea. ¿Cuál sería la clasificación de Google más alta?
- Bill Slawski (@bill_slawski) 6 de diciembre de 2018
Hubo muchas opiniones sobre lo que podría causar que la publicación del autor o la publicación de la revista en línea obtuvieran una clasificación más alta, como esta de John Alexander:
Depende de qué sitio tenga más / mejor contenido. Como lector, quiero ver ese artículo, pero también descubrir contenido relacionado, por lo que si el autor rara vez publica o solo publica contenido breve y no muy detallado, prefiero ver la revista. Converse es cierto si el autor tiene mucho contenido bueno.
- John Alexander (@CallMeLouzander) 7 de diciembre de 2018
Varias personas sugirieron que idealmente también se debería usar la canonicalización entre dominios, como Jonah Stein:
En teoría, Google debería clasificar la primera instancia. Además, en teoría, el autor DEBE usar rel = canonical para señalar la primera instancia. En la práctica, si la revista en línea está relacionada con el tema y tiene más autoridad, se clasificará allí a menos que los enlaces / señales sociales apunten al blog del autor.
- Jonah Stein (@Jonahstein) 6 de diciembre de 2018
Como autor que puede controlar su propio sitio, pero no controlar un sitio de revistas en línea, puede ser difícil que la revista en línea apunte un elemento de enlace canónico a su sitio.
Le pedí a Vikki Fraser que me proporcionara un ejemplo de su artículo que supera a una revista en línea por contenido muy similar:
Ejemplo usando moi: pic.twitter.com/D8LOiuDhPc
- Vikki Fraser (@vikkiorlando) 7 de diciembre de 2018
Cyrus Shepard también me preguntó si se aplicaría o no la inversión de enlace:
Dejando a un lado otras consideraciones de SEO (rel canonical, meta robots, etc.), creo que @dejanseo explicación de Percolator / Link Inversion. Parece suceder a menudo con los artículos de Medium. https://t.co/4BNur4edRJ
- Cyrus (@CyrusShepard) 6 de diciembre de 2018
Mi respuesta fue que, hasta donde yo sé, Google no aplica la inversión de enlaces. Exploré la inversión de enlaces cuando escribí sobre Google tratando de identificar la versión principal de las páginas duplicadas.
Algunas personas, como Martin McGarry, sintieron que dependía de la relevancia del contenido para cada uno de los lugares publicados:
Demasiadas variables, así que ofreceré un ejemplo de variante. Publicas en un blog sobre un tema en el que no trabajas. Pero una revista de la industria lo recoge. En su blog tiene poca o ninguna relevancia, pero en una revista de la industria podría considerarse contenido autoritario incluso si está duplicado.
- Martin McGarry (@seomcgarry) 6 de diciembre de 2018
O como señaló Joshua Levenson, puede depender de la versión que se publicó primero:
Depende de lo que se rastree primero.
- roghan josh levenson (@josh_levenson) 6 de diciembre de 2018
La respuesta de Peter McCarthy parece coincidir con mi propia experiencia y una solicitud de patente de Google publicada recientemente, sobre la que incluyo información en esta publicación:
Hice esto hace un tiempo y miré. Aunque anecdótico. Al principio cambió con la clasificación de la revista por un tiempo (su autoridad es alta), pero mi clasificación original superó a la revista con el tiempo. También parece depender de si la consulta es más "el tema" que "yo + el tema".
- Peter McCarthy (@petermccarthy) 6 de diciembre de 2018
Reordenación de los resultados de una entidad según la puntuación del autor
Recientemente apareció una solicitud de patente que nos informa sobre un método de reordenación de resultados de búsqueda cuando se trata de resultados que tienen muy similar o sustancialmente el mismo contenido. Distingue esos resultados diciendo que uno de ellos es de una entidad que no se sabe que produce contenido original (copia o redistribuye el contenido original creado por otras entidades. El otro contenido está asociado con una segunda entidad que se sabe que produce contenido original.
Hay una referencia a una patente provisional en esta solicitud de patente que tiene un título muy interesante, y según esta patente ha sido incorporada en su totalidad. Esa patente es la Solicitud de Patente Provisional de EE. UU. No. 61 / 648,562 presentada el 17 de mayo de 2012, titulada "Sistemas y métodos para determinar la probabilidad de que una entidad sea autora del contenido original" (Este enlace es para la presentación de la patente en la OMPI. )
Clasificaciones más altas para un autor original independientemente de las puntuaciones de relevancia
Entonces, esta solicitud de patente de puntuación de autor nos dice que:
... A veces es deseable clasificar los resultados de búsqueda que corresponden a documentos que están asociados con entidades que son autores de contenido original más alto que los resultados de búsqueda correspondientes a documentos que se asocian con entidades que no son autores de contenido original aunque los documentos asociados con entidades que no son autores de contenido original tienen puntuaciones de relevancia más altas.
El algoritmo detrás de esta patente de autor original implica:
- (i) contenido enviado, donde el contenido enviado se identifica como publicado por una entidad
- (ii) un enlace a la ubicación en un recurso que aloja el contenido enviado; evaluar si el contenido enviado está representado en un índice de contenido conocido para determinar si el contenido enviado es nuevo en relación con el contenido conocido
- en respuesta a la evaluación, emitir una solicitud a un motor de búsqueda para rastrear e indexar el contenido enviado alojado por el recurso asociado con el enlace cuando el contenido enviado es nuevo en relación con el contenido conocido, donde la solicitud al motor de búsqueda para rastrear y indexar el contenido enviado alojado por el recurso asociado con el enlace se emite en respuesta a la determinación de que se considera que el contenido enviado no está representado en el índice de contenido conocido
La patente nos dice que la solicitud para rastrear el nuevo contenido iría a un rastreador de alta prioridad del motor de búsqueda, que es la primera vez que escucho a uno de los que se mencionan en una patente de Google.
La patente también se refiere al uso de "tejas" para identificar contenido que es similar o sustancialmente el mismo. Más información sobre las tejas en este documento: Identificación y filtrado de documentos casi duplicados

Parece que la patente del autor original examinará otro contenido creado por la entidad que puede estar asociado con una de las versiones de este contenido:
En algunas realizaciones, antes de emitir la solicitud al motor de búsqueda para rastrear e indexar el contenido enviado alojado por el recurso asociado con el enlace, el método incluye determinar que la entidad es un autor del contenido original basado en una evaluación de otro contenido enviado identificado. como publicado por la entidad, donde el otro contenido enviado identificado como publicado por la entidad se incluye en el contenido conocido; y la solicitud al motor de búsqueda para rastrear e indexar el contenido enviado alojado por el recurso asociado con el enlace se emite en respuesta a la determinación de que el contenido enviado no se considera representado en el índice de contenido conocido y la determinación de que la entidad es una autor del contenido original.
Esta solicitud de patente hace que parezca que Google está realizando un seguimiento de las entidades que son autores mediante la recopilación de tejas de las cosas que han escrito.
La patente también describe un proceso de verificación y registro que un autor podría utilizar para verificar que él o ella es el autor del contenido y registrarse como autor.
También nos dice que puede comenzar a marcar el contenido con un identificador de la entidad asociada con el contenido, incluido al menos un autor de contenido o un editor de contenido, o al menos un sitio web.
La patente también nos dice que puede determinar si las piezas de contenido son similares al determinar la puntuación del autor para cada una de las piezas de contenido. Una puntuación de autor también incluiría una puntuación de citas para la entidad involucrada que analiza la frecuencia con la que se cita el contenido de esa entidad.
Cómo funciona la reordenación basada en que una entidad es un autor original
… El primer resultado de búsqueda se clasifica más alto que el segundo resultado de búsqueda; determinar que el primer documento y el segundo documento satisfacen un criterio de similitud; determinar que la segunda entidad satisface un diferencial de autoría predefinido con respecto a la primera entidad; y en respuesta a determinar que la segunda entidad satisface el diferencial de autoría predefinido con respecto a la primera entidad, intercambiar el segundo resultado de búsqueda y el primer resultado de búsqueda en los resultados de búsqueda clasificados para producir resultados de búsqueda reordenados.
La solicitud de patente de puntuación de autor se puede encontrar en:
(US20180341656) Sistemas y métodos para volver a clasificar los resultados de búsqueda clasificados
Inventores: Chung Tin Kwok, Lei Zhong y Zhihuan Qiu
Número de publicación: 20180341656
Fecha de publicación: 29 de noviembre de 2018
Solicitantes: GOOGLE LLC
Abstracto:
Se presentan un sistema, un medio de almacenamiento legible por ordenador que almacena al menos un programa y un método implementado por ordenador para reclasificar los resultados de búsqueda clasificados. Se obtienen resultados de búsqueda clasificados que satisfacen una consulta de búsqueda, donde los resultados de búsqueda clasificados incluyen un primer resultado de búsqueda correspondiente a un primer documento asociado con una primera entidad y un segundo resultado de búsqueda correspondiente a un segundo documento asociado con una segunda entidad, y donde el primero El resultado de la búsqueda se clasifica por encima del segundo resultado de la búsqueda. Se determina que el primer documento y el segundo documento satisfacen un criterio de similitud. La segunda entidad está determinada para satisfacer un diferencial de autoría predefinido con respecto a la primera entidad. En respuesta a la determinación de que la segunda entidad satisface el diferencial de autoría predefinido con respecto a la primera entidad, el segundo resultado de búsqueda y el primer resultado de búsqueda en los resultados de búsqueda clasificados se intercambian para producir resultados de búsqueda reordenados.
Algunas conclusiones sobre la puntuación de un autor
La patente proporciona muchos detalles que vale la pena dedicar tiempo a revisar si desea saber más. Por ejemplo, un autor del contenido se detalla minuciosamente de la siguiente manera:
Por ejemplo, la entidad respectiva puede incluir un autor individual o uno de una pluralidad de coautores de (o contribuyentes) del contenido. En algunas realizaciones, una entidad es una organización empresarial que produce contenido original o parcialmente original. En algunas formas de realización, una entidad es una organización de noticias. En algunas implementaciones, la entidad incluye al menos un editor de contenido. Por ejemplo, la entidad respectiva puede ser un editor de libros, un editor de publicaciones periódicas, un editor de contenido en línea. y / o similares. En algunas implementaciones, la entidad respectiva es el autor del contenido de al menos un sitio web. Por ejemplo, la entidad respectiva puede contribuir con contenido original a un sitio web de blogs, un sitio web para un editor (por ejemplo, noticias, revistas, etc.) y / o similares. Tenga en cuenta que dicho sitio web puede incluir un subconjunto del contenido dentro de un dominio particular. Por ejemplo, el sitio web puede incluir contenido en un dominio particular (por ejemplo, un dominio de nivel superior example.com). En otro ejemplo, el sitio web incluye contenido en un subdominio del dominio particular (por ejemplo, un subdominio biogs.example.com). En otro ejemplo, el sitio web incluye contenido en un directorio del dominio (por ejemplo, www.example.com/johndoe/). En algunas realizaciones, el sitio web incluye contenido en una pluralidad de dominios (por ejemplo, una red de sitios web afiliados), una pluralidad de subdominios de al menos un dominio y / o una pluralidad de subdirectorios de al menos un dominio. En algunas realizaciones, el contenido creado por una entidad es una publicación de blog, una publicación de una red social o una publicación en un hilo de discusión en línea. En algunas realizaciones, el contenido creado por la entidad es cualquier contenido que se haya publicado en una ubicación accesible en Internet de manera que se pueda determinar fácilmente que la entidad publicó el contenido.
La patente me recordó al programa de autoría de Google en Google+, donde se vinculaba al lugar que publicó como autor con un rel = "yo" en su vínculo a ese sitio.
Es interesante crear una puntuación de autor que incluya una puntuación de citas que identifique la frecuencia con la que se puede citar a un autor en otro lugar de la Web. La idea de usar citas como una forma de calificar a los autores me recuerda el uso de citas en PageRank como se describe en The PageRank Citation Ranking: Bringing Order to the Web. Como nos dice el resumen de ese artículo:
Este documento describe PageRank, un método para calificar páginas web de manera objetiva y mecánica, midiendo de manera efectiva el interés y la atención humanos que se les dedica.
Agregado el 10 de diciembre de 2019 : esta patente se otorgó hoy en Sistemas y métodos para volver a clasificar los resultados de búsqueda clasificados. Actúa para intercambiar los dos primeros resultados en un conjunto de resultados de búsqueda basados en una puntuación de autor original para el autor del primer artículo y una puntuación de autor más alta para el autor del segundo artículo.
