Google이 컨텍스트 기록을 사용하여 쿼리 의도를 예측하는 방법

게시 됨: 2018-11-29

검색 이면의 쿼리 의도 이해

Andrea Broder의 웹 검색 분류(pdf)는 정보 쿼리, 트랜잭션 쿼리 및 탐색 쿼리 간의 차이점에 대한 것입니다. 쿼리 용어에 대해 페이지를 최적화할 때 알아두면 좋은 정보입니다.

사람들에게 개념이나 주제에 대해 가르칠 것으로 기대하십니까? 그렇다면 정보 제공용인 것처럼 쿼리를 처리하는 것입니다.

상품이나 서비스 판매를 목적으로 하는 페이지를 만들고 있습니까? 그런 다음 쿼리를 트랜잭션인 것처럼 처리하고 사용자가 무언가를 구매하거나 예약할 수 있도록 합니다.

누군가가 이전에 본 적이 있기 때문에 알고 있는 페이지를 찾도록 돕는 데 사용되는 쿼리 또는 특정 페이지가 반환되기를 기대하기 때문에 사용하는 쿼리를 탐색 쿼리라고 합니다. 누군가 특정 제품이나 브랜드의 이름을 검색하면 해당 제품이나 브랜드의 홈페이지에 만족할 것입니다.

사내 SEO로 SEO를 시작한 사이트는 사람들이 비즈니스를 통합하는 데 도움이 되었습니다. 이 페이지는 "델라웨어에 통합"과 같은 용어에 대해 좋은 평가를 받았습니다. 방문자에게 델라웨어에서 비즈니스를 통합할 기회를 제공하지 않는 정보 제공 전용 사이트인 Delaware Division of Corporations 웹사이트에 이어 해당 기간 동안 2위 사이트였을 때 더 많은 전환을 얻었습니다.

사람들은 검색 결과에서 Division of Corporation 사이트를 보고 방문하여 프로세스에 대해 배운 다음 검색 결과로 돌아가서 통합할 수 있는 저와 같은 트랜잭션 사이트를 방문합니다. 사이트 상위권이 장점이 아닌 사례였다. 이러한 쿼리의 의도를 이해하면 왜 그런 일이 발생했는지 설명하는 데 도움이 됩니다.

쿼리 의도에 대한 추가 정보

검색 및 쿼리 이면의 의도에 대한 또 다른 문서는 분류를 위한 단순 모델입니다.
D. Irazu Hernandez, Parth Gupta, Paolo Rosso 및 Martha Rocha의 사용자 의도별 웹 쿼리(pdf). 다음을 포함하여 반복할 가치가 있는 쿼리 의도에 대한 몇 가지 흥미로운 설명을 만듭니다.

사용자 의도를 기반으로 한 쿼리 분류는 쿼리 이면의 필요성에 대한 쿼리를 분류하는 것을 목표로 합니다. Jansen과 Booth[4]는 사용자 의도를 웹 검색 엔진과의 상호 작용에서 정서적, 인지적 또는 상황적 목표의 표현으로 정의합니다. 사용자 의도에 기반한 쿼리 분류는 주로 두 가지 문제로 인해 기존 텍스트 분류와 다릅니다[2]. 첫째, 웹 쿼리는 일반적으로 매우 짧습니다. 둘째, 많은 쿼리가 모호하고 쿼리가 여러 범주에 속하는 것보다 일반적입니다. 예를 들어, "오페라 극장 티켓"이라는 검색어에 대해 사용자가 웹 사이트를 알고 싶어하는지 또는 이벤트에 참석하기 위해 티켓을 구입하려는지 식별하기 어렵습니다. 대부분의 노력에는 일반적으로 수동으로 분류된 소량의 쿼리가 포함됩니다.

이 문서는 쿼리 의도를 더 잘 이해하기 위한 몇 가지 아이디어와 접근 방식을 제공하지만, 해결하려는 문제의 틀을 구성하는 방식이 마음에 들었습니다. 지난 주에 발표된 Google의 특허 출원은 검색 엔진이 검색어 이면에 있는 검색자의 의도를 더 잘 이해하기 위해 검색 컨텍스트를 이해하려고 시도하는 방법을 설명합니다.

컨텍스트 기반 쿼리 의도 예측에 대한 Google의 특허

의도를 쿼리와 연관시킬 수 있고, 검색 상자에 소수의 단어를 입력할 때 사용자가 검색하는 내용을 이해하기 위해 Google이 그렇게 하려는 것은 새로운 개념이 아닙니다. 이 특허에 대해 새로운 것으로 보이는 것은 Google이 쿼리 의도를 이해하기 위해 얼마나 많은 노력을 기울일 수 있는지입니다. 누군가 점심 시간에 Google에 '피자'라는 단어를 입력하면 식사에 관심이 있고 피자를 사거나 배달할 장소를 찾고 있다고 추측할 수 있습니다.

시간이 지남에 따라 피자의 역사를 찾을 가능성은 적습니다(하지만 그럴 수도 있습니다.) 대부분의 검색에서 이러한 가정을 좋은 것으로 만들기 위해 얼마나 많은 컨텍스트가 필요할 수 있습니까?

대부분의 특허와 마찬가지로 Google의 이 새로운 특허는 해결하려는 문제에 대해 알려줍니다.

검색 쿼리가 협소하게 맞춤화되지 않았거나 사용자가 쿼리 이외의 추가 정보를 많이 제공하지 않으면 컴퓨팅 장치가 너무 많은 정보를 반환할 수 있습니다. 가장 흥미롭거나 관련된 정보 중 일부는 사용자가 찾기 어렵습니다. 사용자는 스트레스를 경험하거나 매우 상세한 쿼리를 컴퓨팅 장치에 입력하여 귀중한 시간과 자원을 낭비하여 컴퓨팅 장치가 특정 작업을 수행하는 데 필요한 정보를 얻기 위해 여러 검색을 실행하거나 많은 양의 검색 결과를 선별할 수 있습니다. .

만약 그 검색자가 배가 고파서 빨리 피자를 먹고 싶을 때, 맛있는 피자를 배달할 수 있는 가까운 위치를 찾을 수 있다면 검색 엔진에 대한 그들의 만족도는 급격히 높아질 수 있습니다.

컨텍스트를 사용하여 쿼리 의도 예측

쿼리 의도 컨텍스트 히스토리 특허 흐름도

쿼리 의도를 사용하여 검색 엔진이 검색에서 반환된 검색 결과를 조정할 수 있으므로 의도를 충족하기 위한 정보가 검색에서 반환된 다른 정보보다 강조됩니다.

이 특허는 방금 티켓을 구입한 영화를 검색하는 사람의 예를 제공합니다. 시스템은 로그 데이터를 보고 검색자가 해당 영화의 향후 상영을 위해 이미 티켓을 구매했는지 결정할 수 있으며 "영화 상영 시간이 다른 정보(예: 리뷰, 기념품 등)보다 낮은 순위가 되도록 결과를 조정할 수 있습니다. , 퀴즈 등) 특정 영화에 대한 정보입니다."

우리는 우리가 볼 수 있는 결과개인화하기 위해 수행한 이전 검색에 대한 정보를 수집하는 검색 엔진에 익숙하지만 스트레스를 줄이거나 시간 낭비를 피하기 위해 컨텍스트를 사용하는 것은 다릅니다.

특허 출원은 해당 정보를 분석하기 위해 검색 엔진을 사용하는 사람의 허가를 받은 후에만 그러한 컨텍스트 정보를 볼 수 있다고 말합니다. 이 특허는 검색자에게 표시될 수 있는 검색 결과의 순서를 변경할 수 있는 컨텍스트 정보를 사용하는 방법에 대한 추가 예를 제공합니다.

이것은 여전히 ​​특허 출원 중이며 아직 구현되지 않았을 가능성이 높지만 미래의 어느 단계에 있을 수 있으며 Google은 쿼리 이면의 의도를 예측하기 위해 컨텍스트에 주의를 기울일 가능성이 있습니다. 시간, 요일, 위치 등을 이미 사용할 수 있습니다.

이 특허는 검색자에 대한 개인 식별 정보를 공개할 수 있는 정보와 같은 일부 정보의 사용을 제한할 것이라고 말합니다.

새로 공개된 이 특허 출원은 다음에서 찾을 수 있습니다.

특정 컨텍스트에 대한 검색 의도 예측
발행번호: 20180336200
발행일: 2018년 11월 22일
지원자: 구글 주식회사
발명가: 임유진, Joseph Linn, Yuling Liang, Carsten Steinebach, Wei Lwun Lu, Dong Hyun Kim, James Kun, Lauren Koepnick 및 Min Yang

추상적 인:

컴퓨팅 장치 그룹에 의해 수행된 사용자 개시 동작, 및 컴퓨팅 장치로부터 수신된 특정 검색 쿼리를 사용하여 검색 의도를 결정하는 컴퓨팅 시스템이 설명됩니다. 컴퓨팅 시스템은 의도에 기초하여 의도를 만족시키는 정보를 강조함으로써 검색 쿼리를 사용한 검색으로부터 획득된 검색 결과의 적어도 특정 부분을 조정한다. 컴퓨팅 시스템은 조정된 검색 결과의 표시를 컴퓨팅 장치에 전송합니다.

상황별 기록의 예

특허 출원은 다음과 같이 보고 찾을 수 있는 관심 주제로 참조되는 항목 목록을 포함하여 쿼리 의도를 예측하는 데 사용할 수 있는 몇 가지 다른 유형의 컨텍스트 정보에 대해 알려줍니다.

  • 사용자 관심 그래프 또는 기타 유형의 데이터 구조
  • 사용자와 관련된 연락처 정보(예: 사용자의 개인 연락처 정보는 물론 사용자의 친구, 동료, 소셜 미디어 연결, 가족 등에 대한 정보)
  • 검색 기록
  • 위치 기록
  • 장기 및 단기 작업
  • 캘린더 정보
  • 애플리케이션 사용 이력
  • 구매 내역
  • 즐겨찾기
  • 책갈피
  • 기타 정보

이러한 개인적인 관심 유형 외에도 다른 컨텍스트 정보가 포함됩니다.

컴퓨팅 장치의 작동 상태에 대해(여기에서 자세히 설명합니다.):

  • 스위치의 위치
  • 배터리 잔량
  • 장치가 벽면 콘센트에 연결되어 있는지 또는 다른 장치 및/또는 기계에 작동 가능하게 연결되어 있는지 여부
  • 사용자 인증 정보(예: 현재 인증된 사용자 또는 장치의 현재 사용자)
  • 장치가 "비행기" 모드, 대기 모드, 최대 전력 모드에서 작동하는지 여부

문맥 정보의 다른 예:

  • 음향 지문
  • 비디오 지문
  • 장소
  • 이동 궤적
  • 방향
  • 속도
  • 시설명
  • 주소
  • 장소의 유형
  • 빌딩
  • 기상 조건
  • 교통 상황
  • 일정 이벤트
  • 위치 및/또는 시간과 관련된 회의 또는 기타 이벤트
  • 특정 시간에 본 웹페이지 주소
  • 검색 또는 검색 기록을 포함하여 특정 시간에 웹 페이지의 데이터 필드에 작성된 하나 이상의 텍스트 항목
  • 특정 시간에 이루어진 제품 구매
  • 제품 위시리스트
  • 제품 레지스트리
  • 다양한 위치와 시간에 컴퓨팅 장치에 의해 액세스되거나 방송되는 오디오 및/또는 비디오
  • 다양한 위치와 시간에서 컴퓨팅 장치에 의해 액세스되거나 해당 장치가 있는 상태에서 방송되는 텔레비전 또는 케이블/위성 방송
  • 다양한 위치와 시간에 컴퓨팅 장치가 액세스하는 기타 서비스에 대한 정보입니다.

이 특허에는 이전에 자세히 설명한 모바일 위치 기록과 같은 다른 유형의 정보가 표시됩니다.

특허 출원은 그러한 쿼리의 검색 결과를 보완하거나 수정하게 할 수 있는 쿼리와 관련될 수 있는 정보를 검색할 수 있도록 이러한 컨텍스트를 색인화할 수 있는 방법에 대해 알려줍니다.

또한 검색 엔진이 검색 및 검색이 실행되는 장치에 대해 유지할 수 있는 문맥 기록과 별도로 검색 기록을 유지할 수 있음을 알려줍니다. Google은 검색자의 의도에 대해 질문하지 않을 수도 있지만 검색 결과에 표시할 내용을 예측할 수 있는 기능을 제공하기 위해 검색 뒤에 있는 사람과 기계에 대해 많은 것을 배울 수 있는 것처럼 들립니다.

쿼리 의도를 결정하기 위한 머신 러닝

Google 특허에는 많은 정보를 수집하는 과정이 포함되어 있습니다. 불필요한 정보를 걸러낸 후 예측을 하여 “검색어의 진정한 의도를 유추할 수 있도록 좁은 맥락을 정의”할 수 있습니다.

이 특허는 이 작업을 돕기 위해 딥 러닝을 사용하는 방법에 대해서도 알려줍니다.

예측 모듈은 입력으로서 검색 쿼리(또는 검색 쿼리의 일부) 및 컨텍스트 모듈로부터 수신된 현재 컨텍스트를 수신하는 머신 러닝 모델(예: 딥 러닝 모델)을 실행할 수 있습니다. 기계 학습 모델은 현재 컨텍스트에 대한 검색 쿼리를 사용하여 검색 의도의 표시(예: 레이블 또는 기타 식별자)를 출력으로 생성할 수 있습니다.

결론

이 특허는 사전 정의된 의도(예: 여행), 의도 점수, 사용자 데이터가 관련된 쿼리 의도에 대해 머신 러닝을 훈련하는 방법에 대한 세부 정보를 제공합니다.

이것은 특허 출원이며 Google은 이러한 문맥 기록을 생성하고 이를 기반으로 검색 결과를 조정하는 구현을 하지 않았을 수 있습니다. 또한 특허에 따르면 이러한 컨텍스트 데이터를 분석하기 전에 허가를 요청할 가능성이 높다는 점을 명심하십시오.

위에서 공유한 컨텍스트 예제를 기반으로 쿼리 의도를 반복하려면 다음을 수행합니다.

  1. 영화표를 구매하시면
  2. 당신은 그 영화에 대한 검색을 수행
  3. 검색 엔진이 구매 내역을 확인합니다.
  4. 같은 영화의 다른 상영 시간을 표시하는 대신 검색 결과가 조정되어 영화에 대한 퀴즈, 기념품 및 뉴스를 표시할 수 있습니다.

Google은 검색 기록 및 위치 기록을 심층적으로 추적하고 있지만 이러한 쿼리 의도 및 컨텍스트 기록 사용에 대한 이해는 검색 개인화보다 순위를 훨씬 더 많이 변경할 수 있습니다.