Google 작동 방식: Google 순위 엔지니어의 이야기 – SMX West 2016의 적용 범위 및 분석

게시 됨: 2021-10-08

안녕하세요 친구. 때때로 Linkarati에서 우리는 공유하고 확대할 가치가 있다고 생각하는 뉴스, 동향 또는 프레젠테이션을 다룹니다.

오늘 나는 Rae Hoffman의 인상적인 트윗을 우연히 발견했습니다.

이 링크는 SMX West 2016에서 SMX West 2016에서 Google 순위 엔지니어의 관점에서 Google의 작동 방식에 대해 프레젠테이션을 하고 있는 Google 소프트웨어 엔지니어인 Paul Haahr의 SMX 동영상으로 연결됩니다.

Paul을 소개하는 Danny Sullivan이 말했듯이 Paul의 직함은 그가 Google 순위 팀의 고위 경영진 의 일원임을 반영하지 않습니다.

SEO로서 이것은 당신의 심장을 뛰게 만들 것입니다.

Danny는 우리(SEO 커뮤니티)가 Paul을 참석하게 된 것이 얼마나 행운인지 반복합니다. 그리고 그녀의 트윗에서 볼 수 있듯이 Rae는 이것이 모든 SEO가 주의 깊게 관찰하고 메모해야 하는 사항이라고 굳게 믿습니다. 내가 누구를 변론해야 합니까?

프레젠테이션의 커버리지를 작성하는 것은 메모를 하는 것보다 훨씬 더 많은 것을 가르쳐준다는 것을 종종 발견했습니다. 한 단계 더 나아가 다른 사람들이 이해하고 감상할 수 있는 메모를 작성해야 하기 때문입니다. 그것은 비판적 사고의 또 다른 레이어를 추가합니다.

자료를 스스로 더 잘 이해하고 프레젠테이션을 더 빨리 소화하는 데 도움이 되도록 그렇게 하기로 결정했습니다. 윈윈, 맞죠? 참고: Rae는 여기에 자신의 메모와 범위를 제공합니다.

전체에 삽입될 비디오를 따라 보시기 바랍니다. 아래에는 Slideshare에서 Paul의 프레젠테이션도 포함되어 있습니다. 이 프레젠테이션은 내 보도와 함께하기 위해 스틸 이미지를 잘라내어 게시할 것입니다.

Google 작동 방식: Search Marketing Expo의 Paul Haahr - SMX 의 순위 엔지니어 관점

편안히 앉아 즐기며 생각을 알려주세요.

들어가 봅시다.

참고: Emanuele Vaccari는 이 게시물을 자신의 생각과 함께 이탈리아어로 번역했습니다. 여기에서 그의 번역된 게시물을 볼 수 있습니다.

Google 순위 엔지니어가 하는 일

저는 실제로 적용 범위에 대한 제 자신의 규칙 중 하나를 즉시 깨고 시간 순서를 무시할 것입니다(그러나 지금은 이 섹션 이후에 시간 순서대로 프레젠테이션을 살펴보겠습니다).

내 생각에 Paul은 프레젠테이션의 중추 역할을 하는 프레젠테이션 전체에 테마가 포함되어 있었습니다. 그 주제는 "랭킹 엔지니어는 무엇을합니까?"입니다. .

Paul에 따르면 이 답변에는 네 가지 버전이 있으며 각각 순위 엔지니어의 역할을 약간 수정합니다.

  1. 해당 [Google의 검색] 서버에 대한 코드를 작성하십시오. 출처: 슬라이드 16
  2. 새로운 신호를 찾으십시오. 오래된 신호를 새로운 방식으로 결합합니다. 출처: 슬라이드 19
  3. 측정항목[관련성/검색자 의도 및 품질]에 맞게 최적화합니다. 출처: 슬라이드 24
  4. [실시간 실험 및 인간 평가자의] 좋은 평가를 받은 결과를 위로 이동합니다. 평가가 좋지 않은 결과를 아래로 이동합니다. 출처: 슬라이드 55

괄호 [ ]는 Paul의 슬라이드를 (불완전하게) 명확히 하기 위해 내 자신의 삽입을 나타냅니다.

그렇다면 Google Ranking Engineer는 무엇을 합니까? 내가 받은 주요 교훈: 검색이 실제로 사용자 (인간)를 위해 개선되고 있는지 확인하십시오 . 그리고 어떻게 합니까? Google이 검색 품질 평가 가이드라인과 더 잘 일치하도록 합니다.

나중에 Paul이 Rae에게 보낸 트윗은 검색 품질 평가 가이드라인의 중요성과 SEO가 문서 전체를 읽어야 한다고 다시 강조했습니다.

Paul의 프레젠테이션에서 내가 가장 좋아하는 인용문은 16:08 지점에서 Google의 검색 품질 평가 가이드라인에 대해 이야기할 때였습니다. 인용문 자체는 프레젠테이션의 슬라이드 32에 있는 16:48분 표시에서 가져온 것입니다. 바울은 이렇게 말했습니다.

"구글이 뭔가를 하는 이유가 궁금하다면 종종 [검색]을 평가자 가이드라인에서 말하는 것처럼 보이게 만드는 것이 답입니다."

Paul Haahr, Google 순위 엔지니어, SMX West 2016

강력한 말씀입니다. Paul은 Google의 모든 변경 사항을 그들이 게시한 검색 품질 평가 가이드라인과 더 잘 일치시키려는 시도로 요약합니다! 간단히 말해서 Google을 이해하고 싶으십니까? 품질 지침을 읽으십시오.

자, 이제 Paul의 프레젠테이션을 연대순으로 살펴보겠습니다.

오늘의 Google 검색

Paul에 따르면 오늘날 Google 검색에는 두 가지 주제가 있습니다.

  1. 모바일 퍼스트
  2. 특징

모바일은 검색어를 주도하고 있으며 Google은 점점 더 모바일을 먼저 생각하고 있습니다. 이것은 SEO에 대한 새로운 정보는 아니지만 Paul이 강조한 점입니다.

Paul이 강조한 두 번째 요점은 특히 모바일에서 기능의 중요성이었습니다.

Google_features_slide.png

슬라이드 4

흥미롭게도 바울은 오늘의 검색 요약에서 다음과 같이 말했습니다.

"우리는 검색이 삶의 모든 부분에 도우미로 여겨지는 세상으로 점점 더 나아가고 있습니다."

Paul Haahr, Google 순위 엔지니어, SMX West 2016

Google 검색 작동 방식

예전에는 구글 전체가 10개의 파란색 링크였습니다. Paul은 10개 블루링크 시대의 순위 문제를 "어떤 문서를 보여주나요? 어떤 순서로 보여주나요?"로 분류했습니다.

Google_10_blue_links_ranking.png

슬라이드 세븐

흥미로운 점은 제쳐두고 Paul이 잠시 시간을 내어 광고 주제에 대해서는 언급하지 않을 것임을 분명히 했습니다. 구체적으로 바울은 이렇게 말했습니다.

"광고는 훌륭하고, 우리에게 많은 돈을 벌고, 광고주에게 매우 효과적입니다. 하지만 제 직업은 "광고에 대한 영향에 대해 생각하지 말고 수익에 대한 영향에 대해 생각하지 마십시오. 사용자를 도울 생각만 하세요."

Paul Haahr, Google 순위 엔지니어, SMX West 2016

교회와 국가의 명확한 분리에 대해 듣는 것이 흥미로웠습니다.

쿼리의 수명

순위에 대한 Paul의 설명은 검색 작동 방식을 설명하는 쿼리의 수명으로 시작됩니다. 검색 엔진에는 두 부분이 있습니다.

  1. 미리(쿼리 전)
  2. 쿼리 처리.

쿼리 전:

  • 웹 크롤링
  • 크롤링 페이지 분석
    • 링크 추출 (클래식 버전의 검색)
    • 콘텐츠 렌더링 (Javascript, CSS - Paul은 이것의 중요성을 강조했습니다.)
    • 시맨틱에 주석 달기
  • 인덱스 구축
    • 책의 색인 연결
    • 각 단어에 대해 해당 단어가 나타나는 페이지 목록
    • 수백만 페이지로 분할
      • 이러한 페이지를 "샤드"라고 합니다.
      • 웹 인덱스용 샤드 1000개
    • 또한 문서별 메타데이터.

출처: 슬라이드 10 및 11.

쿼리 처리 (누군가가 검색을 사용하는 경우):

  • 쿼리 이해 및 확장
    • 쿼리 이름이 알려진 엔터티입니까?
    • 유용한 동의어가 있습니까?
    • 맥락의 문제
  • 검색 및 득점
    • 모든 샤드에 쿼리 보내기
    • 각 샤드:
      • 일치하는 페이지 찾기
      • 쿼리+페이지에 대한 점수를 계산합니다.
      • 점수별로 상위 N 페이지를 다시 보냅니다.
    • 모든 상위 페이지 결합
    • 점수순 정렬
  • 검색 후 조정
    • 호스트 클러스터링(같은 도메인의 페이지 수), 사이트링크
    • 중복이 너무 많나요?
    • 스팸 강등, 직접 조치 적용

출처: 슬라이드 12, 13, 14, 15

Google 점수 신호

Paul은 쿼리와 페이지 간의 일치를 나타내는 단일 숫자를 나타냅니다.

이는 두 가지 범주를 기반으로 하는 점수 신호를 기반으로 합니다.

  1. 페이지를 기반으로 한 득점 신호
  2. 쿼리를 기반으로 신호를 채점합니다.

Google_Scoring_signals.png

슬라이드 18

여기에서 Paul은 순위 엔지니어의 직업 중 두 번째 버전을 인용 했습니다. 새로운 신호를 찾거나 오래된 신호를 새로운 방식으로 결합하는 것 입니다. 바울은 이것을 "어렵고 흥미롭다"고 묘사했습니다.

순위의 주요 지표: 관련성, 품질, 결과까지의 시간

Paul은 검색 결과의 핵심 측정항목으로 관련성을 강조했습니다. 관련성은 기본적으로 "사용자 의도 일치"로 설명되었습니다.

Paul은 관련성을 "최상위 지표" 및 "큰 내부 지표"라고 합니다.

품질과 결과에 도달하는 시간(빠를수록 좋음)의 두 가지가 더 있습니다. 이 프레젠테이션에서는 관련성과 품질에 중점을 두었습니다.

상호 순위 가중치

CTR(클릭률)은 특히 검색 순위에 대해 SEO에서 자주 논의됩니다. 2위가 되는 것과 비교하여 자연에서 최고의 결과가 되는 것의 가치는 무엇입니까? 4위와 비교? 이것은 종종 논의되고 토론됩니다. Paul은 가치 측면에서 Google의 관점을 설명했습니다.

그는 아이디어를 "상호 순위 가중치"로 정의했습니다.

reciprocal_rank_weighting.png

슬라이드 23

분명히 Paul은 CTR에 대해 논의하지 않았습니다. 오히려 전체 검색 페이지를 평가하는 내부 측정항목입니다.

이 아이디어는 각 직위의 가치에서 50% 하락을 나타내며 1위는 10위보다 10배 더 가치가 있습니다.

꽤 매력적입니다.

이를 통해 Paul은 Google Ranking Engineers의 세 번째 버전인 Google 측정항목[관련성 및 품질]에 맞게 최적화했습니다.

ranking_engineers_optimize_metrics.png

슬라이드 24

Google은 검색 결과를 어떻게 평가합니까?

Paul은 Google이 특정 결과의 효능을 분석하는 두 가지 방법이 있다고 설명합니다.

  1. 라이브 실험
  2. 인간 평가자.

아래 동영상:

라이브 실험

Google은 실제 트래픽에 대한 실시간 A/B 테스트를 실행한 다음 클릭 패턴의 변화를 찾습니다.

"우리는 많은 실험을 합니다. Google에서 검색을 하고 적어도 하나의 실험에 참여하지 않는 경우는 매우 드뭅니다."

Paul Haahr, Google 순위 엔지니어, SMX West 2016

Paul은 실시간 실험을 해석하는 것이 어려운 작업이라고 설명합니다.

그의 주요 예(아래)는 응답 상자가 있는 결과입니다. 일반적으로 검색자가 클릭하여 사이트를 방문하면 좋은 결과로 간주됩니다. 그러나 검색자가 답변을 보고 만족하고 닫히면 어떻게 될까요? 전통적으로 그것은 나쁜 결과로 평가되지만 이 경우에는 실제로 좋은 결과일 수 있습니다.

Interpreting_live_search_experiments.png

30번 슬라이드

Paul의 예의 요점은 검색자 만족도를 분석하는 것이 얼마나 어려운 일인지를 보여주는 것입니다.

Google의 인간 평가자 실험

이 부분에서 가장 중요한 점은 여기에서 모바일 우선이 다시 강조 된다는 것입니다. 대부분의 평가자 실험은 스마트폰에서 이루어집니다 .

인간 평가자 실험은 다음과 같이 작동합니다.

  1. 실제 사람 실험 검색 결과 표시
  2. 결과가 얼마나 좋은지 묻습니다(관련성과 품질 모두에 대한 슬라이딩 비율)
  3. 평가자 전체의 평가 집계

다시 말하지만, Google이 검색 품질 평가자 가이드라인을 게시했다는 점에 유의하는 것이 매우 중요합니다.

진지하게, 그 클립을 봐.

검색 품질 평가자 평가의 예

Paul은 16:56 표시에서 검색 품질 평가 실험의 예와 스크린샷을 살펴보기 시작합니다.

Paul이 슬라이드에 크게 의존하는 부분이므로 이 부분에 대한 비디오를 시청하는 것이 좋습니다. 따라가기 위해 프레젠테이션의 이 부분은 슬라이드 33에서 시작됩니다.

결과를 판단하는 두 가지 척도: 관련성 및 품질

Google이 결과의 품질을 판단하기 위해 평가자에게 제공하는 두 가지 척도가 있습니다.

  1. 요구 사항 충족(관련성)
  2. 페이지 품질

Judging_search_results.png

35번 슬라이드

모바일 우선 실험

Paul은 또한 모바일 우선을 강조합니다.

다음과 같은 다섯 가지 방법으로 이를 수행합니다.

  1. 모든 관련성 지침은 모바일 사용자 요구 사항에 관한 것입니다.
  2. 모바일 quire는 실험에서 두 배 더 많이 사용됩니다.
  3. 사용자의 위치는 실험에 포함됩니다.
  4. 이 도구는 모바일 사용자 경험을 표시합니다.
  5. 평가자는 스마트폰을 사용하여 웹사이트를 방문합니다.

이것이 얼마나 중요한지 강조할 수 없습니다. Google은 분명히 모바일에 중점을 두고 있습니다. 여기에는 중간이 없습니다.

요구 사항 충족 등급 - 관련성 등급

"충족된 요구 사항"으로 정의되는 5가지 관련성 범주가 있습니다.

  1. 완전히 충족
  2. 높은 만남
  3. 적당히 충족
  4. 약간 만나다
  5. 만나지 못했습니다.

평가자 5가지 옵션만으로 판단 하지 않는다는 점에 유의하는 것이 중요합니다. 평가자 이러한 평가 사이의 어느 위치에든 착륙할 수 있는 슬라이딩 척도를 제공합니다.

슬라이드 41부터 Paul은 각 등급의 예를 살펴봅니다.

Google 작동 방식: Search Marketing Expo의 Paul Haahr - SMX 의 순위 엔지니어 관점

함께 제공되는 동영상은 다음과 같습니다.

중요 사항:

  1. "완전히 충족됨"은 쿼리가 명확하고 쿼리에 대해 사용자가 의도한 것이 무엇이든 완전히 충족할 수 있는 결과가 있는 경우에만 존재할 수 있습니다.
  2. "매우 충족"은 때때로 사용자 의도를 충족시키기 위해 두 가지 특정 별도의 결과를 요구합니다.
  3. "적당히 충족됨"은 일반적으로 좋은 정보입니다.
  4. "약간 충족"은 허용되지만 좋은 정보는 아니므로 더 나은 결과를 표시할 수 있기를 바랍니다.
  5. Paul이 나쁜 결과를 반환하는 검색 버그를 인용하면서 "Fails to meet"은 웃기다.

페이지 품질 평가

Google은 페이지 품질을 설명하기 위해 세 가지 중요한 개념을 살펴봅니다.

  1. 전문적 지식
  2. 권위
  3. 신뢰성.

품질의 척도는 높음에서 낮음입니다.

고품질 페이지:

  • 고품질 메인 콘텐츠의 양을 만족시킵니다.
  • 전문성, 권위, 신뢰가 분명합니다.
  • 이 웹사이트는 평판이 좋습니다.

high_quality_pages_according_to_Google.png

슬라이드 50

저품질 페이지:

  • 콘텐츠의 질이 낮다
  • 메인 컨텐츠가 별로 없다
  • 전문 지식이나 권한이 표시되지 않음
  • 웹사이트에 부정적인 평판이 있습니다.
  • 보조 콘텐츠(광고)가 주의를 산만하게 합니다.

Low_quality_pages_according_to_Google.png

슬라이드 51

검색 품질 측정항목 최적화

수백 명의 컴퓨터 과학자가 순위 공학 분야에서 일합니다. 그들은 측정항목과 신호에 초점을 맞추고, 지속적인 실험을 실행하고, 많은 변경을 수행하여 Google의 검색 결과를 개선하고 검색 품질 평가자 가이드라인을 보다 정확하게 반영합니다.

개발 프로세스는 소프트웨어 개발 프로세스에 상당히 표준적입니다.

Google_ranking_development_process.png

슬라이드 54

중요 하이라이트:

  1. 이 프로세스는 코드를 테스트하는 데 몇 주에서 몇 달이 걸릴 수 있습니다.
  2. 정량 분석가(기본적으로 통계학자)는 데이터를 검토합니다. 그들은 순위 엔지니어를 정직하게 유지하여 변경 사항에 대한 대부분의 편견 없는 분석을 제공합니다.
  3. 출시 검토 패널은 프로젝트 요약을 검토하고 문서 및 보고서를 검토하며 순위 변경의 장점에 대해 토론합니다.
  4. 실제로 업데이트를 실시간으로 푸시하는 것은 코드가 알고리즘에 얼마나 준비되어 있는지에 따라 빠르거나 느릴 수 있습니다.

순위 엔지니어는 주로 평가가 좋은 결과를 높이고 평가가 나쁜 결과를 내리기 위해 이러한 업데이트를 만듭니다.

개발 과정에서 잘못된 것

바울은 두 가지 문제에 대해 이야기합니다.

  1. 체계적으로 나쁜 평가.
  2. 그들이 관심을 갖는 개념을 포착하지 못하는 측정항목.

체계적으로 나쁜 평가

Paul은 [텍사스 농장 비료]의 예를 사용합니다. 이것은 비료 브랜드로 밝혀졌지만 Google은 제조업체를 반환했습니다. 사람들이 실제로 제조업체에 대한 지도를 원할 가능성은 거의 없지만 실제 제품을 보고 싶어합니다. 그러나 인간 평가자는 이것을 "필요에 매우 부합하는" 결과로 일관되게 평가합니다.

이것은 실제로 더 많은 지도를 추가하는 패턴으로 이어졌고, 실제로는 높은 평가를 받은 결과를 생성했지만 실제로는 열악한 라이브 검색 경험을 제공했습니다.

측정항목 누락

Paul은 2008-2011년에 Google이 품질에 대해 겪었던 문제를 인용합니다. 특히 콘텐츠 팜 문제 .

콘텐츠 팜은 낮은 품질의 관련성이 높은 콘텐츠를 생성할 수 있습니다. 이것은 실제로 낮은 품질의 높은 평가 결과로 이어졌습니다. 콘텐츠 팜은 Google이 결과의 품질을 판단하는 인간 평가 실험에서 두 번째 슬라이더를 구현하게 한 원인입니다.

Paul이 콘텐츠 팜에 대한 문제와 검색 품질에 대한 영향, 검색 결과의 효율성을 판단하기 위해 다른 메트릭을 구현하여 문제를 극복한 방법에 대해 논의하는 것을 듣는 것은 절대적으로 매력적입니다.

여기에 Google이 콘텐츠 팜을 알고리즘적으로 처리한 방식인 Panda에 대한 언급이 없다는 것도 흥미롭습니다.

Paul에 따르면 누락된 지표에 대한 해결책은 평가자 지침을 수정하거나 필요한 경우 새로운 지표를 개발하는 것입니다.

fix_rater_guidlines_and_develop_new_metrics.png

슬라이드 식스티세븐

이것이 Paul의 프레젠테이션의 전부입니다!

최종 생각 및 요점

이 긴 게시물을 마무리하기 위한 몇 가지 마지막 생각입니다.

  1. 조만간 검색 품질 평가자 가이드라인을 읽을 것입니다. 당신도해야합니다. Paul은 검색 순위의 모든 변경 사항이 해당 문서를 반영해야 한다고 강조했습니다. Google 순위를 이해하고 싶으십니까? (SEO로서 대답은 "예!"여야 합니다.) 그런 다음 해당 문서를 읽으십시오.
  2. Google은 진정으로 모바일 우선입니다. 모든 인간 평가자 실험은 놀라운 정도로 모바일 우선 경험을 크게 강조합니다.
  3. 거의 모든 검색에는 실시간 실험이 포함됩니다.
  4. 관련성은 Google에서 가장 중요한 측정항목입니다. 그들은 검색 내에서 사용자(인간) 요구를 충족시키는 것으로 "관련성"을 정의합니다. 순위를 더 높이려면 검색자의 기대와 요구 사항을 충족하는 것이 좋습니다.
  5. Google은 첫 번째 결과에 훨씬 더 많은 가치를 부여합니다. 각 후속 결과는 이전 결과 값의 50%만큼 저하됩니다. 결과 #1은 결과 #10보다 10배 더 가치 있다고 생각합니다.

다른 중요한 테이크 아웃이 있다고 확신하지만 내 두뇌는 공식적으로 튀겨졌습니다. 피드백을 환영합니다. 보도 내용을 즐겼기를 바랍니다.