웹사이트 및 카테고리 방문 기간에 대한 판다 특허
게시 됨: 2017-07-28
몇 달 전인 6월에 나는 팬더 클릭: 반복 클릭 및 방문 시간을 기반으로 한 고품질 검색 결과라는 게시물을 작성했습니다.
그 게시물에서 나는 Google의 Panda 업데이트의 이름을 딴 Google 검색 엔지니어 Navneet Panda가 고품질 검색 결과에 중점을 둔 몇 가지 특허를 작업했다고 지적했습니다. 그리고 Panda 업데이트 이후 Panda가 작성했을 수 있는 새로운 특허를 검토하지 않을 수 없었습니다. 내가 6월에 쓴 특허는 검색 결과에 대한 반복 클릭에 대한 정보를 추가하고 해당 페이지에 대한 방문 시간을 측정한 연속 특허였습니다. 반복적인 클릭과 사이트 방문 시간 측정은 내가 조사할 가치가 있는 무언가를 찾을 수 있을까 하는 생각이 들 정도로 흥미로웠습니다.
그는 다른 웹사이트에서 유사한 신호를 보았습니까?
웹사이트 지속 시간 성능 점수
Navneet Panda와 James A. Kunz의 2016년 12월 6일 특허(카테고리 기간에 따른 웹사이트 지속 시간 성능)는 웹사이트 지속 시간과 사이트 섹션에 대한 클릭을 살펴봅니다. 특허 설명은 이 특허가 작동하는 방식에 대한 요약을 제공합니다. 첫 번째 부분은 상당히 간단해 보입니다.
인덱스, 쿼리 로그, 탐색 로그를 처리하여 사이트 데이터를 생성합니다. 사이트 데이터는 웹사이트를 설명하고 웹사이트의 특정 리소스에 대한 방문을 사용자 및 각 방문 기간별로 특성화하는 데이터를 포함합니다. 예를 들어, 방문 데이터는 검색 결과 웹 페이지 또는 URL의 직접 입력에 포함된 검색 결과에 대한 사용자의 클릭을 식별할 수 있으며, 각 선택 및 입력에 대해 사용자가 리소스를 요청했으며 사용자 장치가 다른 리소스를 요청한 시간입니다.
이 특허는 페이지를 방문하는 데 걸릴 수 있는 시간에 대해 "지속 시간"이라는 단어를 사용합니다.
획득한 데이터는 리소스에 대한 사용자 방문과 해당 방문 기간을 특성화합니다. 이 데이터에서 방문 기간은 다양한 방법으로 측정할 수 있습니다. 예를 들어, 방문 기간은 예를 들어 리소스에 대한 링크를 클릭하거나 리소스에 대한 리소스 로케이터를 제공된 입력 필드에 입력함으로써 사용자가 리소스에 대한 요청을 시작한 시간 사이의 시간으로 측정될 수 있습니다. 사용자 장치에서 실행되는 응용 프로그램 또는 응용 프로그램에 대한 추가 기능에 의해, 그리고 사용자가 다른 리소스에 대한 다른 요청을 시작한 시간. 대안적으로, 지속기간은 예를 들어 자원이 애플리케이션 프로그램에 의해 완전히 렌더링되는 시간과 사용자가 다른 자원에 대한 다른 요청을 개시하는 시간 사이의 시간으로서 측정될 수 있다.
이 특허는 또한 리소스와 관련될 수 있는 범주 또는 주제의 가중치를 살펴봅니다.
검색 엔진 외부의 프로세스가 리소스와 웹사이트를 분류할 수 있습니다. 일부 구현에서 리소스는 개별적으로 분류되고 웹사이트는 리소스 카테고리를 기반으로 분류됩니다. 각각의 리소스 및 웹사이트는 또한 하나 이상의 카테고리에 속할 수 있으며, 각 카테고리는 리소스 및/또는 웹사이트에 대한 카테고리의 연관 강도의 척도인 카테고리 가중치에 의해 반영될 수 있습니다. 예를 들어, 전문 운동선수가 레스토랑 체인을 시작했다는 뉴스 기사가 포함된 리소스에는 뉴스, 스포츠 및 식사 카테고리에 대한 적절한 관련성을 각각 반영하는 카테고리 가중치가 있을 수 있습니다. 반대로, 국제 분쟁에 관한 뉴스 기사를 포함하는 리소스는 국제 뉴스 범주에 대한 매우 높은 관련성을 반영하는 범주 가중치를 가질 수 있습니다.
이 특허는 사이트의 다양한 카테고리를 기반으로 세션의 길이를 측정하고 지속 시간을 측정하는 방법에 대해 설명합니다. 지속 시간 점수의 흥미로운 용도는 다음과 같습니다.
기간 성능 점수는 검색 작업을 위한 리소스 및 웹사이트 점수를 매기는 데 사용할 수 있습니다. 검색 작업에는 검색 결과에 대한 리소스 채점, 웹사이트 색인에 우선순위 지정, 리소스 또는 웹사이트 제안, 특정 리소스 또는 웹사이트를 강등으로부터 보호, 특정 리소스 또는 웹사이트를 판촉에서 제외, 또는 기타 적절한 검색 작업이 포함될 수 있습니다.
사이트의 다른 부분에 대한 방문에 대해 수집된 기간 정보는 해당 사이트에 대해 더 많은 정보를 검색 엔진에 알리는 데 사용될 수 있습니다. 카테고리 지속 시간 점수를 기반으로 한 웹사이트 지속 시간 성능 점수에 대해 알려드립니다.

프로세스는 웹사이트가 속하는 복수의 카테고리 각각에 대해 지속 기간 측정에 기초하여 카테고리 지속 기간 점수를 결정하며, 각 카테고리 지속 기간 점수는 지속 기간 측정으로부터의 시간 지속 기간에 비례합니다(206). 일부 구현에서, 카테고리 지속시간 점수를 결정하기 위해 웹사이트에 대한 단일 웹사이트 지속시간 점수가 결정되고, 그 다음 지속시간 점수가 웹사이트에 대한 카테고리 지속시간 점수를 생성하는 데 사용됩니다. 이 카테고리 지속 시간 점수에서 웹 사이트의 지속 시간 성능 점수가 결정됩니다.
프로세스는 카테고리 지속 시간 점수 중 하나 이상으로부터 웹사이트에 대한 지속 시간 성능 점수를 결정합니다(208). 지속시간 성과 점수는 일부 구현들에서 지속시간 성과 점수가 결정되는 하나 이상의 카테고리 지속시간 점수에 비례한다(208). 예를 들어, 지속 시간 성능 점수는 웹사이트에 대한 모든 카테고리 지속 시간 점수에 기초할 수 있습니다. 대안적으로, 지속시간 성과 점수는 웹사이트에 대한 카테고리 지속시간 점수의 적절한 서브세트에 기초할 수 있다.
소음 줄이기
Google의 누군가가 순위에서 사용자 행동 데이터를 사용하는 것과 관련하여 자주 언급하는 문제 중 하나는 종종 잡음이 있는 신호라는 것입니다. 이 특허는 이러한 신호에서 노이즈를 줄이는 방법에 대해 설명합니다. 그런 토론을 보는 것은 흥미 롭습니다. (Google에서 노이즈 신호 감소에 대한 이와 같은 목록을 본 적이 있는지 확실하지 않습니다.) 노이즈를 줄일 수 있는 몇 가지 방법은 다음과 같습니다.
짧은 클릭 필터링 및 기타 소음 요인 감소 – 일부 구현에서는 세션의 지속 시간을 결정할 때 마지막 방문 지속 시간이 할인됩니다. 마지막 방문 지속 시간은 사용자 장치가 웹사이트에서 리소스를 요청하고 다른 다른 웹사이트에서 리소스를 요청하는 것에 응답하여 생성된 지속 시간 측정에 해당합니다. 할인은 예를 들어 "짧은 클릭"을 필터링하기 위해 수행됩니다. 검색 결과를 선택한 다음 사용자가 검색 결과 페이지로 다시 이동할 때 또는 페이지 로딩 지연으로 인해 웹사이트에 대한 단일 방문이 길어지는 경우입니다. 마지막 방문 지속 시간을 할인하는 또 다른 이유는 마지막 방문 지속 시간이 2) 다른 노이즈 요인(예: 사용자가 리소스가 표시된 상태로 컴퓨터를 떠났다가 한 시간 후에 다시 돌아와서 즉시 다른 리소스로 이동하는 경우)에 영향을 받을 수 있기 때문입니다. 다른 웹사이트의. 예를 들어, 위의 표 1에서 마지막 방문 지속 시간을 할인할 때 지속 시간은 525초로 계산됩니다.
이전 방문 지속 시간 제거 – 일부 구현에서는 세션 지속 시간을 결정할 때 이전 방문 지속 시간이 추가됩니다. 이전 방문 지속 시간은 두 번째 웹사이트에서 첫 번째 리소스를 선택하기 직전에 첫 번째 웹사이트에서 마지막으로 방문한 리소스에 대해 생성된 지속 시간 측정에 해당합니다. 예를 들어, 위의 표 1에서 웹사이트 S0에서 리소스 R0에 대한 기간 측정은 160초입니다. 이것은 리소스 R1-R7에 대한 기간에 대한 이전 방문 기간입니다. 따라서 위의 표 1에서 마지막 방문 지속 시간을 할인하고 이전 방문 지속 시간을 고려하면 685초의 지속 시간이 계산됩니다.
이전 방문에서 부스팅 처리 – 일부 구현에서 리소스 주소의 직접적인 사용자 입력에 응답하여 리소스를 요청하는 사용자 장치에 응답하여 생성된 각 지속 시간 측정이 부스트됩니다. 이러한 직접 입력은 품질에 대한 사용자의 긍정적인 평가를 나타내며 따라서 해당 리소스의 지속 시간이 늘어납니다. 부스트 값은 고정된 값일 수도 있고, 사용자가 직접 주소를 입력하는 빈도나 양에 비례할 수도 있다. 예를 들어, 부스트 팩터가 1.5이고 마지막 방문 지속 시간의 할인도 사용된다고 가정합니다. 위의 표 1에서 직접 사용자 입력에 대한 응답으로 첫 번째 리소스를 요청하면 웹 사이트 지속 시간은 585초로 계산됩니다.
테이크 어웨이
누군가가 사이트에서 클릭할 수 있는 항목 및 해당 사이트에서 보낼 수 있는 시간과 같은 사용자 행동 데이터를 살펴보는 Google의 특허를 보는 것은 흥미롭습니다. 사용자 행동 신호의 노이즈를 줄이는 방법에 대한 Google의 토론도 흥미롭습니다. 그러한 토론의 저자가 Panda라면 다시 방문할 가치가 있습니다.
