Cómo funciona Google: historia de un ingeniero de clasificación de Google: cobertura y análisis de SMX West 2016

Publicado: 2021-10-08

Hola amigos. De vez en cuando aquí en Linkarati cubrimos noticias, tendencias o presentaciones que creemos que vale la pena compartir y ampliar.

Hoy me encontré con un tweet convincente de Rae Hoffman:

Si vio esto https://t.co/JN9T1IOBjc y no pasó tiempo viéndolo y haciendo esto, buena suerte en su carrera de SEO pic.twitter.com/YliYKcSFdq
- Rae Hoffman (@sugarrae) 31 de marzo de 2016

El enlace conduce al video de SMX de Paul Haahr, ingeniero de software de Google durante 14 años, quien está dando una presentación en SMX West 2016 sobre cómo funciona Google, desde su perspectiva como ingeniero de clasificación de Google.

Como dice Danny Sullivan, quien presenta a Paul, el título de Paul no refleja que él sea parte del liderazgo senior del equipo de clasificación de Google .

Como SEO, esto debería hacer que tu corazón se salte un latido.

Danny reitera la suerte que tenemos (la comunidad de SEO) de tener a Paul presente. Y como puede ver en su tweet, Rae cree firmemente que esto es algo que todo SEO debe observar en profundidad, así como tomar notas. ¿Quién soy yo para discutir?

A menudo me he dado cuenta de que escribir la cobertura de una presentación me enseña incluso más que tomar notas, ya que tengo que ir un paso más allá y escribir notas que otros puedan comprender y apreciar. Agrega otra capa más de pensamiento crítico.

Decidí hacer precisamente eso, tanto para entender mejor el material como para ayudarte a digerir la presentación más rápido. Ganar-ganar, ¿verdad? Nota: Rae tiene sus propias notas y cobertura aquí.

Te recomiendo que sigas el video, que se incluirá en todo momento. A continuación, también incluí la presentación de Paul de Slideshare, de la que recortaré y publicaré imágenes fijas para acompañar mi cobertura.

Cómo funciona Google: la perspectiva de un ingeniero de clasificación por Paul Haahr de Search Marketing Expo - SMX

Siéntese, disfrute y déjeme saber lo que piensa.

Entremos en ello.

Nota: Emanuele Vaccari tradujo esta publicación al italiano, junto con algunos de sus propios pensamientos. Puedes ver su publicación traducida aquí.

Qué hace un ingeniero de clasificación de Google

De hecho, voy a romper una de mis propias reglas para la cobertura de inmediato e ignorar el orden cronológico (pero solo por ahora; revisaré la presentación cronológicamente, después de esta sección).

Paul tenía un tema incrustado a lo largo de su presentación que sirvió como la columna vertebral de su presentación, en mi opinión. Ese tema es "¿qué hacen los ingenieros de clasificación?" .

Había cuatro versiones de esta respuesta, según Paul, cada una de las cuales refinaba ligeramente el papel de ingeniero de clasificación:

Escriba el código para esos servidores [de búsqueda de Google]. Fuente: Diapositiva 16
Busque nuevas señales. Combine señales antiguas de nuevas formas. Fuente: Diapositiva 19
Optimice nuestras métricas [relevancia / intención y calidad del buscador]. Fuente: Diapositiva 24
Mueva los resultados con buenas calificaciones [de experimentos en vivo y evaluadores humanos] hacia arriba. Mueva los resultados con malas calificaciones hacia abajo. Fuente: Diapositiva 55

Tenga en cuenta que los corchetes [] indican mis propias interjecciones para aclarar (imperfectamente) las diapositivas de Paul.

Entonces, ¿qué hace un ingeniero de clasificación de Google? La conclusión principal que recibí: asegúrese de que la búsqueda realmente esté mejorando para los usuarios (los humanos). ¿Y cómo lo hacen? Haciendo que Google coincida mejor con las Pautas de calificación de calidad de búsqueda .

Un tweet posterior de Paul a Rae enfatizó nuevamente la importancia de las Pautas de calificación de calidad de búsqueda, y que los SEO realmente deberían leer el documento completo:

. @ sugarrae Me alegro de que te haya gustado. En aras de la transparencia, creo que las pautas de los evaluadores fueron en realidad un gran problema. ¿Ya los has leído? Https: //t.co/llmUQJbkQ8

- Paul Haahr (@haahr) 31 de marzo de 2016

Mi cita favorita de la presentación de Paul llegó cuando hablaba de las Pautas de calificación de calidad de búsqueda de Google en la marca de las 16:08. La cita en sí es de la marca de los 16:48 minutos, durante la diapositiva 32 de la presentación. Pablo dijo:

"Si se está preguntando por qué Google está haciendo algo, a menudo la respuesta es hacer que [la búsqueda] se parezca más a lo que dicen las pautas del evaluador".
Paul Haahr, ingeniero de clasificación de Google, SMX West 2016

Esa es una declaración poderosa. Paul resume todos los cambios en Google como un intento de igualar mejor las Pautas de calificación de calidad de búsqueda, que han publicado. Para resumir: ¿quieres entender Google? Ve a leer sus pautas de calidad.

Muy bien, pasemos a la cobertura cronológica de la presentación de Paul.

Búsqueda de Google hoy

Hay dos temas en la búsqueda de Google hoy, según Paul:

Móvil primero
Características

Los dispositivos móviles lideran las consultas de búsqueda y Google piensa cada vez más en los dispositivos móviles. Esta no es información nueva para los SEO, pero es algo que Paul enfatizó.

El segundo punto que enfatizó Paul fue la importancia de las funciones, particularmente en dispositivos móviles.

Diapositiva cuatro

Curiosamente, Paul dijo en resumen de la búsqueda de hoy:

"Nos adentramos cada vez más en un mundo en el que se piensa en la búsqueda como un asistente para todos los aspectos de su vida".

Paul Haahr, ingeniero de clasificación de Google, SMX West 2016

Cómo funciona la búsqueda de Google

Todo Google solía ser 10 enlaces azules. Paul analizó el problema de la clasificación en la era de los 10 enlaces azules como "¿Qué documentos mostramos? ¿En qué orden los mostramos?"

Diapositiva siete

Interesante aparte: Paul se tomó un momento para aclarar que nunca tocaría el tema de los anuncios. Específicamente, Paul dijo:

"Los anuncios son geniales, nos generan mucho dinero, funcionan muy bien para los anunciantes. Pero en mi trabajo, nos dicen explícitamente" no pienses en el efecto en los anuncios, no pienses en el efecto en los ingresos - solo piense en ayudar al usuario ".

Paul Haahr, ingeniero de clasificación de Google, SMX West 2016

Es interesante escuchar acerca de la clara separación entre la iglesia y el estado, perdón, paga y orgánica.

Vida de una consulta

La explicación de Paul sobre la clasificación comienza con la vida de una consulta, para explicar cómo funciona la búsqueda. Hay dos partes de un motor de búsqueda:

Antes de tiempo (antes de la consulta)
Procesamiento de consultas.

Antes de la consulta:

Rastrear la web
Analizar las páginas de rastreo
- Extraer enlaces (la versión clásica de búsqueda)
- Renderizar contenidos (Javascript, CSS - Paul enfatizó la importancia de esto).
- Anotar semántica
Construye un índice
- Vincular el índice de un libro
- Para cada palabra, una lista de páginas en las que aparece
- Dividido en millones de páginas
  - Estas páginas se denominan "fragmentos".
  - Miles de fragmentos para el índice web
- Más metadatos por documento.

Fuente: diapositiva 10 y 11.

Procesamiento de consultas (cuando alguien usa la búsqueda):

Comprensión y expansión de consultas
- ¿La consulta nombra entidades conocidas?
- ¿Existen sinónimos útiles?
- El contexto importa
recuperación y puntuación
- Envíe la consulta a todos los fragmentos
- Cada fragmento:
  - Encuentra páginas coincidentes
  - Calcula una puntuación para la consulta + página
  - Devuelve las primeras N páginas por puntuación
- Combinar todas las páginas principales
- Ordenar por puntuación
Ajuste posterior a la recuperación
- Agrupación de hosts (cuántas páginas pertenecen al mismo dominio), vínculos a sitios
- ¿Hay demasiada duplicación?
- Degradación de spam, aplicación de acciones manuales

Fuente: Diapositiva 12, 13, 14 y 15.

Señales de puntuación de Google

Paul se refiere a un solo número que representa la coincidencia entre una consulta y una página.

Esto se basa en señales de puntuación, que se basan en dos categorías:

Señales de puntuación basadas en una página
Señales de puntuación basadas en la consulta.

Diapositiva dieciocho

Aquí Paul citó la versión dos de los trabajos de ingeniero de clasificación: buscar nuevas señales o combinar señales antiguas de nuevas formas . Paul describió esto como "difícil e interesante".

Métricas clave en la clasificación: relevancia, calidad, tiempo para obtener resultados

Paul enfatizó la relevancia como una métrica clave en los resultados de búsqueda. La relevancia se explicó básicamente como "coincidencia de la intención del usuario".

Paul se refiere a la relevancia como "nuestra métrica de primera línea" y "la gran métrica interna".

También hay otros dos: calidad y tiempo para obtener resultados (más rápido es mejor). Dentro de esta presentación, la relevancia y la calidad fueron el foco.

Ponderación de rango recíproco

El CTR (tasas de clics) a menudo se discute en SEO, particularmente para las clasificaciones de búsqueda. ¿Cuál es el valor de ser el resultado superior en orgánico frente a ser el número dos? ¿Versus siendo el número cuatro? Esto a menudo se discute y se debate. Paul explicó el punto de vista de Google, en términos de valor.

Definió la idea como "ponderación ordenada recíprocamente":

Diapositiva veintitrés

Para ser claros, Paul no estaba hablando de CTR. Más bien, una métrica interna que valora páginas de búsqueda completas.

La idea representa una degradación del 50% en el valor de cada puesto, siendo el número uno diez veces más valioso que el número diez del ranking.

Bastante fascinante.

Y esto llevó a Paul a la versión número tres de lo que hacen los ingenieros de clasificación de Google: optimizar nuestras métricas [relevancia y calidad].

Diapositiva veinticuatro

¿Cómo califica Google los resultados de búsqueda?

Paul explica que hay dos formas en que Google analiza la eficacia de resultados específicos:

Experimentos en vivo
Evaluadores humanos.

Video a continuación:

Experimentos en vivo

Google ejecuta pruebas A / B en vivo con tráfico real y luego busca cambios en los patrones de clic.

"Realizamos muchos experimentos. Es muy raro si haces una búsqueda en Google y no estás en al menos un experimento".
Paul Haahr, ingeniero de clasificación de Google, SMX West 2016

Paul se toma un momento para explicar que interpretar experimentos en vivo es una tarea difícil.

Su ejemplo principal (a continuación) es un resultado con un cuadro de respuesta. Tradicionalmente, si el buscador hacía clic en el sitio, se vería como un buen resultado. Pero, ¿qué pasa si el buscador ve la respuesta, está satisfecho y se cierra? Tradicionalmente, eso se consideraría un mal resultado, pero en este caso podría ser un buen resultado.

Diapositiva treinta

El objetivo del ejemplo de Paul es mostrar cuán desafiante es analizar la satisfacción del buscador.

Experimentos de evaluadores humanos en Google

La conclusión más importante de esta parte es que aquí se enfatiza nuevamente el uso de dispositivos móviles , ya que la mayoría de los experimentos de evaluadores humanos se llevan a cabo en teléfonos inteligentes .

Los experimentos de evaluadores humanos funcionan de la siguiente manera:

Mostrar resultados de búsqueda experimentales de personas reales
Pregunte qué tan buenos son los resultados (tasa variable de relevancia y calidad)
Calificaciones agregadas entre evaluadores

Nuevamente, es extremadamente importante tener en cuenta que Google ha publicado sus Pautas para evaluadores de calidad de búsqueda.

En serio, mira ese clip.

Ejemplos de calificación del evaluador de calidad de búsqueda

Paul comienza a revisar ejemplos y capturas de pantalla de experimentos de calificación de calidad de búsqueda en la marca de 16:56

Recomiendo ver el video de esta parte, ya que mucho de lo que Paul depende en gran medida de las diapositivas. Para continuar, esta parte de la presentación comienza en la diapositiva 33.

Dos escalas para juzgar los resultados: relevancia y calidad

Hay dos escalas que Google proporciona a los evaluadores para juzgar la calidad de los resultados:

Necesidades satisfechas (relevancia)
Calidad de la página

Diapositiva treinta y cinco

Experimentos basados en dispositivos móviles

Paul también enfatiza los dispositivos móviles primero.

Lo logran de cinco maneras:

Todas las instrucciones de relevancia se refieren a las necesidades de los usuarios de dispositivos móviles.
Los quires móviles se utilizan el doble en experimentos.
La ubicación del usuario se incluye en los experimentos.
La herramienta muestra una experiencia de usuario móvil.
Los evaluadores visitan sitios web utilizando sus teléfonos inteligentes.

No puedo enfatizar lo importante que es esto. Google claramente está poniendo un énfasis real en los dispositivos móviles; no hay término medio aquí.

Calificación de necesidades satisfechas - Calificación de relevancia

Hay cinco categorías diferentes de relevancia, que se definen como "necesidades satisfechas":

Cumple completamente
Altamente cumple
Cumple moderadamente
Ligeramente cumple
No se cumple.

Es importante tener en cuenta que los evaluadores no juzgan con solo cinco opciones: se les presenta una escala móvil que puede ubicarse en cualquier lugar entre cualquiera de estas calificaciones.

A partir de la diapositiva 41, Paul repasa ejemplos de cada calificación:

Cómo funciona Google: la perspectiva de un ingeniero de clasificación por Paul Haahr de Search Marketing Expo - SMX

Aquí está el video adjunto:

Conclusiones importantes:

"Cumple completamente" solo puede existir cuando la consulta es inequívoca y hay un resultado que puede satisfacer por completo lo que el usuario pretende con la consulta.
"Altamente cumple" a veces requiere dos resultados específicos separados para satisfacer la intención del usuario.
"Se reúne moderadamente" es generalmente buena información.
"Ligeramente cumple" es una información aceptable, pero no excelente, y es de esperar que se muestren mejores resultados.
"No se cumple" es ridículo, con Paul citando errores de búsqueda que arrojan malos resultados.

Calificación de calidad de la página

Google analiza tres conceptos importantes para describir la calidad de una página:

Pericia
Autoridad
Integridad.

La escala de calidad es de mayor a menor.

Páginas de alta calidad:

Cantidad satisfactoria de contenido principal de alta calidad.
La experiencia, la autoridad y la confianza son claras.
El sitio web tiene buena reputación.

Diapositiva cincuenta

Páginas de baja calidad:

La calidad del contenido es baja.
No hay mucho contenido principal.
No se muestra ninguna experiencia o autoridad
El sitio web tiene una reputación negativa
El contenido secundario (anuncios) distrae.

Diapositiva cincuenta y uno

Optimización de las métricas de calidad de búsqueda

Unos cientos de científicos informáticos trabajan en ingeniería de rango. Se centran en métricas y señales, realizan experimentos constantes, realizan muchos cambios, todo para mejorar los resultados de búsqueda de Google (y reflejar con mayor precisión las Directrices del evaluador de calidad de búsqueda).

El proceso de desarrollo es bastante estándar para el proceso de desarrollo de software.

Diapositiva cincuenta y cuatro

Aspectos destacados importantes:

El proceso puede tardar desde semanas hasta meses en probar el código.
Los analistas cuantitativos (básicamente estadísticos) revisan los datos. Mantienen a los ingenieros de clasificación honestos, proporcionando un análisis mayoritariamente imparcial del cambio.
Un panel de revisión del lanzamiento revisa un resumen del proyecto, revisa la documentación y los informes, y debate los méritos del cambio de clasificación.
En realidad, impulsar la actualización en vivo puede ser rápido o lento, dependiendo de qué tan listo esté el código para el algoritmo.

Los ingenieros de clasificación crean estas actualizaciones principalmente para subir los resultados con buenas valoraciones y bajar los resultados con malas valoraciones.

Qué sale mal en el proceso de desarrollo

Pablo habla de dos tipos de problemas:

Calificaciones sistemáticamente malas.
Métricas que no capturan conceptos que les interesan.

Calificaciones sistemáticamente malas

Paul usa el ejemplo de [fertilizante agrícola de Texas]. Resulta que esta es una marca de fertilizante, pero Google estaba devolviendo el fabricante. Es poco probable que las personas realmente quieran un mapa del fabricante, sino que prefieran ver el producto real. Sin embargo, los evaluadores humanos califican constantemente esto como un resultado que "satisface en gran medida las necesidades" .

En realidad, esto llevó a un patrón de agregar más mapas, lo que en realidad creó resultados altamente calificados pero en realidad experiencias de búsqueda en vivo deficientes.

Métricas faltantes

Paul cita el problema que Google estaba teniendo con la calidad en 2008-2011. Específicamente, el problema con las granjas de contenido .

Las granjas de contenido pueden producir contenido de baja calidad y muy relevante. Esto condujo a resultados altamente calificados que en realidad eran de baja calidad. Las granjas de contenido son lo que llevó a Google a implementar el segundo control deslizante en sus experimentos de calificación humana, juzgando la calidad de los resultados.

Es absolutamente fascinante escuchar a Paul discutir el problema con las granjas de contenido y el efecto en la calidad de la búsqueda, y cómo la implementación de otra métrica para juzgar la eficacia de los resultados de búsqueda superó el problema.

También es fascinante que no se mencione a Panda aquí, que es cómo Google manejó algorítmicamente las granjas de contenido.

La solución a las métricas faltantes, según Paul, es arreglar las pautas de los evaluadores o desarrollar nuevas métricas (cuando sea necesario).

Diapositiva sesenta y siete

¡Y esa es la totalidad de la presentación de Paul!

Reflexiones finales y conclusiones

Solo algunas reflexiones finales para concluir este largo artículo.

Voy a leer las Directrices del evaluador de calidad de búsqueda más temprano que tarde. Tu también deberías. Paul enfatizó que todos los cambios realizados en las clasificaciones de búsqueda deben reflejar ese documento. ¿Quieres entender el ranking de Google? (como SEO, la respuesta debería ser un rotundo "¡SÍ!"). Entonces lea ese documento.
Google realmente prioriza los dispositivos móviles. Todos los experimentos de evaluadores humanos enfatizan en gran medida las experiencias móviles primero, en un grado sorprendente.
Casi todas las búsquedas incluyen un experimento en vivo.
La relevancia es la métrica número uno en Google. Definen "relevancia" como satisfacer las necesidades del usuario (humano) dentro de la búsqueda. Si desea obtener una clasificación más alta, piense en satisfacer las expectativas y necesidades de los usuarios.
Google valora significativamente más el primer resultado. Cada resultado posterior se degrada en un 50% del valor del resultado anterior. El resultado n. ° 1 se considera diez veces más valioso que el resultado n. ° 10.

Estoy seguro de que hay otras conclusiones importantes, pero mi cerebro está oficialmente frito. Los comentarios son bienvenidos, espero que hayan disfrutado de la cobertura.