엔티티의 Google 검색 견적
게시 됨: 2017-08-15
변화는 생명의 법칙입니다. 그리고 과거나 현재만 바라보는 사람은 미래를 놓치게 마련입니다. – 존 F. 케네디
Google에서 견적 검색
사람들이 웹에서 검색하는 정보는 매우 다양하며, 저는 특정 주제에 대해 유명인, 유명인 및 기타 사람들의 인용문을 찾아 표시하는 데 중점을 둔 Google 특허를 최근에 부여받은 것을 발견했습니다. 이 특허에 대한 흥미로운 점 중 하나는 인용 결과가 표시되는 방식을 결정하는 인용 점수를 결정하는 방법이었습니다. 대부분의 특허와 마찬가지로 이 문서는 현재 시간(특허 전) 결과가 표시되는 방식과 그에 따른 문제에 대한 잠재적인 문제를 지적합니다. 이 특허는 다음 예를 제공합니다.
그러나 이러한 텍스트 검색은 사용자가 가장 원하는 결과를 얻지 못하는 경우가 많습니다. 예를 들어 "나쁜 습관을 깨다"라는 문구를 검색하면 "대부분의 사람들은 나쁜 습관을 깨려는 의지가 없습니다. 변명거리가 많고 피해자처럼 이야기한다”고 말했다. 이 인용문은 사실이지만 인기 있는 TV 쇼 "Breaking Bad"와 관련이 없습니다. 따라서 텔레비전 쇼 "Breaking Bad"와 관련된 인용문을 검색하는 사용자는 사용자의 쿼리와 관련 없는 인용문을 수신할 수 있습니다.
이 특허는 쿼리의 엔터티에 주의를 기울이는 접근 방식을 사용합니다. Paul Haahr가 작년에 SMX에서 발표한 How Google Works에서 말했듯이 검색 엔진은 검색 결과를 반환하는 첫 번째 단계로 쿼리에서 엔터티를 찾는 경우가 많습니다. 이것은 검색의 현재입니다. 견적 검색을 통해 Google은 인용되고 있는 엔터티와 견적의 주제인 엔터티를 찾으려고 할 수 있습니다. 특허는 작동 방식에 대한 설명의 시작 부분에서 즉시 이것을 지적합니다.
본 개시는 사용자의 질의에 기초하여 엔티티의 인용문을 검색하기 위한 컴퓨터 구현 시스템 및 방법을 제시한다. 검색의 일부로 쿼리와 관련된 하나 이상의 주제 엔터티가 식별될 수 있습니다. 본 개시는 또한 쿼리 또는 하나 이상의 식별된 주제 엔티티에 대응하는 인용문 세트를 식별하기 위해 데이터베이스를 사용하는 시스템 및 방법에 관한 것이다. 또한, 식별된 견적의 순위 순서를 생성하기 위한 시스템 및 방법이 제공되며, 여기서 순위 순서는 견적 점수에 기초합니다. 또한, 선택된 인용문을 디스플레이 장치에 표시하기 위한 정보를 전송하기 위한 시스템 및 방법이 제공된다.
내 관심을 끈 것 중 하나는 순위에 대한 견적의 점수를 매기는 방법이었습니다. 공유할 가치가 있다고 생각했습니다. 또한 Google에서 인용문을 사용하는 예를 볼 수 있는지 알아보기 위해 주변을 둘러보았고 Sigmund Freud의 이와 같은 일부 지식 패널에 인용문이 여러 개 있고 링크를 클릭하여 더 많은 것을 볼 수 있는 옵션이 있다는 것을 알았습니다. 따옴표도. 따라서 Google은 엔터티에 대한 정보뿐만 아니라 과거에 언급했을 수도 있는 항목에 대한 정보를 보여주는 데 관심이 있는 것 같습니다.

지난주 USPTO에서 부여된 특허는 다음과 같습니다.
데이터베이스를 사용하여 엔티티의 견적을 검색하는 시스템 및 방법
발명가: Eyal Segalis, Gal Chechik, Yossi Matias, Yaniv Leviathan, Yoav Tzur
담당자: GOOGLE
미국 특허: 9,727,617
부여: 2017년 8월 8일
출원일: 2014년 3월 10일
추상적 인
사용자의 질의에 대한 응답으로 인용문을 검색하고 식별하기 위한 시스템 및 방법이 제공됩니다. 특정 실시예에 따르면, 쿼리와 연관된 하나 이상의 주제 엔티티를 식별하고 쿼리에 응답하여 얻은 검색 결과 또는 데이터베이스로부터 하나 이상의 주제 엔티티에 대응하는 인용문 세트를 식별하기 위한 시스템 및 방법이 제공됩니다. . 또한, 하나 이상의 주제 엔티티에 대한 각 인용의 관계, 각 인용의 최신성, 및 각 인용의 인기도 중 적어도 하나에 기초하여 식별된 인용에 대한 인용 점수를 결정하기 위한 시스템 및 방법이 제공됩니다. 추가로, 견적 점수에 기초한 순위 순서로 식별된 견적을 구성하고 순위 순서 또는 견적 점수에 기초하여 견적을 선택하기 위한 시스템 및 방법이 제공됩니다. 또한, 선택된 인용문을 디스플레이 장치에 표시하기 위한 정보를 전송하기 위한 시스템 및 방법이 제공된다.
인용 데이터베이스는 "인용, 인용의 작성자, 인용과 관련된 주제 엔터티 및/또는 콘텐츠 항목 모음 등"과 같은 콘텐츠로 구성될 수 있습니다. 문서, 프리젠테이션, 뉴스 항목, 기사, 블로그 게시물, 책, 서평, 잡지, 잡지 기사, 오디오 또는 비디오 녹음, 문자 메시지, 전자 메일 메시지, 소셜 미디어 콘텐츠 또는 기타 유형에서 가져올 수 있습니다. 당업계에 알려진 정보 항목의."
게다가, 이 특허는 결과에 "사용자가 콘텐츠 항목 및/또는 인용문을 검색하는 데 사용하는 검색 문자열을 포함하는 검색 로그"도 포함될 수 있다고 알려줍니다. 누군가 이전에 찾은 것을 다시 찾으려고 할 때 도움이 될 것 같습니다.
검색을 위한 견적 식별
특허에 설명된 첫 번째 프로세스 중 하나는 인용문과 인용문과 관련된 정보를 식별하고 저장하는 데 중점을 두는 것입니다. 우리는 따옴표와 검색 엔진 인덱싱 프로그램에서 어떻게 찾을 수 있는지 알려줍니다.
먼저 인용문에 대해 다음과 같이 알려줍니다.
인용문에는 한 단어, 구, 진술 및/또는 저자 또는 단체에 의해 어떤 형태로든 말하거나 쓰거나 표현한 변형된 형태가 포함될 수 있습니다. 예를 들어, "유레카", "믿습니다", "감히" 또는 "행동"과 같은 단일 단어는 인용문을 나타낼 수 있습니다. 또한, 예를 들어 "조심스러운 실수는 거의 없다" 또는 "희망은 깨어 있는 꿈이다"와 같은 문장이나 구는 인용문을 나타낼 수 있다. 인용문에는 단락이나 문장 또는 구 모음이 포함될 수도 있습니다. 작성자에는 개인, 그룹 또는 조직이 포함될 수 있습니다. 예를 들어, 오바마 대통령과 같은 사람이 인용문의 저자일 수 있습니다. 더 나아가 예를 들면, 기구인 UN이 인용문의 저자일 수 있습니다.
인용문은 "웹 페이지, 문서, 이미지 또는 기타 리소스"를 지정할 수 있는 특정 URL 또는 다른 식별자와 연관될 수 있습니다.
인용문을 식별하려면 "오바마 대통령이 말했다"와 같이 인용문 앞에 올 수 있는 "말했다"라는 단어를 찾는 것과 같이 콘텐츠 항목의 텍스트 콘텐츠를 면밀히 조사하는 것이 포함될 수 있습니다. 점수.
이 특허는 또한 "인용 부호의 존재는 콘텐츠 항목에서 하나 이상의 인용문을 식별하는 데 사용될 수 있습니다"라고 알려줍니다.
따옴표 외에도 다른 기호를 사용하여 따옴표를 식별할 수 있습니다. 예를 들어 "인용 항목은 인용의 저자로 콘텐츠 항목에 나타날 수 있습니다. 또는 인용문으로 식별될 수 있는 문장."
책의 저자는 책에서 가져온 인용문과 연결될 수 있습니다. 오디오 진술은 해당 진술을 하는 것으로 식별된 화자와 연관될 수 있습니다.
주제 개체 및 인용문
견적의 출처를 식별하는 것 외에도 견적과 관련된 주제 엔터티를 결정하여 견적의 내용을 식별하는 데 도움이 될 수 있습니다. 이것은 인용문에서 일부 단어를 추출하고 인용문에 대한 것인지 확인하여 수행할 수 있습니다. 인용문: "교육은 세상을 바꾸는 데 사용할 수 있는 가장 강력한 무기입니다.", "교육 " 및 "변경"은 견적과 관련될 수 있는 주제 엔터티를 나타낼 수 있습니다.
견적과 관련된 정보
검색 엔진 인덱서는 견적과 관련된 날짜를 식별하려고 시도할 수 있습니다. 그것은 아마도 그것이 처음으로 말하거나 쓰거나 표현되었을 때일 것입니다. 그것은 처음 출판되거나 뉴스로 발표되었을 때일 수 있습니다.
견적 확인
나는 전에 웹에서 엉뚱한 사람의 인용문을 본 적이 있는데, 이것이 특허에서 언급된 것을 보니 반가웠다.
이 특허는 인용문을 식별하는 이 프로세스에 인용문을 확인하는 단계가 포함될 수 있으며 인용문이 두 가지 이상의 방법으로 확인될 수 있다고 알려줍니다.
- 콘텐츠 항목 모음에서 두 개 이상의 콘텐츠 항목에 정확한 인용문이 나타나는지 확인하여 인용문을 검증할 수 있습니다.
- "다른 저자, 게시자, 웹 및/또는 언론 매체의 하나 이상의 콘텐츠 항목에 나타나는" 경우에도 유효한 것으로 간주됩니다.
- 인용문을 검증하는 또 다른 방법은 "인용문을 포함한 대본이 포함된 콘텐츠 항목에 정확한 인용문이 나타나는지" 확인하는 것입니다.
- 그것은 또한 "인용문의 저자와 함께 인용문의 정확성을 확인함으로써" 검증될 수 있습니다.
견적과 관련된 관련 정보
대부분의 정보에 관해서는 맥락이 매우 중요한 것 같습니다.
특허는 "견적에 대한 관련 정보에는 인용과 관련된 저자, 인용과 관련된 하나 이상의 주제 엔터티 및/또는 인용과 관련된 날짜가 포함될 수 있습니다."라고 알려줍니다.
맞춤형 견적 정보
이것도 흥미롭게 볼 수 있었습니다. 인용 정보에 대한 누군가의 검색은 사용자 또는 사용자의 소셜 미디어 연락처가 작성한 인용문과 같은 개인화된 결과를 표시할 수 있습니다. Google+ 정보나 트윗을 과시하는 또 다른 방법인 것 같습니다.
견적 검색 쿼리 작동 방식
이 특허는 인용구를 검색하는 세 가지 다른 예를 제공합니다.
1. 쿼리는 "X는 Y에 대해 무엇을 말했는가?"와 같이 인용문과 관련된 저자 및 주제 엔터티를 모두 식별할 수 있습니다. X는 인용문 작성자로, Y는 인용문과 관련된 주체 엔터티로 사용합니다. 따라서 이것은 "오바마 대통령은 넬슨 만델라에 대해 무엇이라고 말했는가"라는 질문과 유사할 것입니다. 인용문 작성자인 오바마 대통령은 주제 엔티티인 넬슨 만델라에 대해 이야기합니다.
2. 쿼리는 요청된 견적의 대상 엔터티로 Tesla Motors와 함께 "Tesla Motors"와 같이 요청된 견적에서 대상 엔터티만 식별할 수 있습니다.
3. 쿼리에는 "따옴표"라는 단어가 포함될 수 있습니다. 따라서 "Breaking Bad 따옴표"는 "Breaking Bad"와 관련된 따옴표에 대한 요청이 됩니다.
나는 이것을 시도했지만 여러 인용문을 보여주는 결과를 얻지 못했습니다. Google에서 이러한 종류의 견적 검색이 아직 설정되지 않았음을 나타내는 것 같습니다. 나타날지 주목해볼만 하다고 생각합니다.
쿼리와 연결된 주제 엔터티
특허는 쿼리와 관련된 주제 엔터티를 식별하는 단계에 대해 알려줍니다. 주제 엔터티는 예를 들어 저자, 사람, 장소, 주제, 항목 또는 사물, 및/또는 쿼리와 관련된 이벤트 등을 포함할 수 있습니다. 예를 들어, "만델라가 인용한다"라는 쿼리는 사람인 주체 엔티티 "만델라"를 포함할 수 있다.
이 특허는 주체 엔터티를 찾는 방법을 자세히 설명합니다.
주제 엔터티는 여러 가지 방법으로 쿼리에서 식별할 수 있습니다. 예로서, 질의 자체의 구조는 질의와 연관된 주제를 결정하는데 사용될 수 있다. 예를 들어, "X가 Y에 대해 무엇을 말했는가" 유형의 쿼리는 "에 대해 말하기"라는 단어로 구분된 주제 X와 Y를 식별하기 위해 구문 분석될 수 있습니다. 다른 실시예에서, 단어 또는 구는 질의로부터 추출될 수 있다. 추출된 단어 또는 구는 쿼리와 관련된 주제를 식별하기 위해 주제 엔티티 데이터베이스의 주제 엔티티와 비교될 수 있습니다. 예를 들어, "Breaking Bad Quotes"와 같은 쿼리는 "Breaking", "bad"라는 단어와 "Breaking Bad"라는 문구를 제공할 수 있습니다. 이러한 추출된 단어 및/또는 구는 주제 개체 데이터베이스에 저장된 단어 또는 구와 비교할 수 있습니다.
주제 엔터티 데이터베이스에서 둘 이상의 주제
엔티티에 대한 일부 단어 또는 참조가 둘 이상의 의미를 가질 수 있다는 것은 놀라운 일이 아닙니다. 이 특허는 이러한 가능성을 다루며 "주제 엔티티 데이터베이스의 둘 이상의 주제 엔티티가 추출된 단어 및/또는 구문과 일치하는 경우 주제 엔티티와 관련된 관련성 점수를 사용하여 하나 이상의 주제 엔티티를 선택할 수 있습니다. " 각 주제 개체에 해당하는 관련성 점수는 주제 데이터베이스에서 검색할 수 있습니다.
이 특허는 관련성 점수를 계산하여 올바른 주제 엔터티를 결정하는 방법을 알려줍니다. 주제 엔터티에 대한 쿼리에 사용되는 관련성 점수는 특허에서 지적한 바와 같이 여러 방식으로 결정될 수 있습니다.
1. 주제 개체에 대한 관련성 점수는 콘텐츠 항목 모음에서 주제 개체의 인기도에 기초할 수 있습니다.
2. 주제 개체에 대한 관련성 점수는 사용자가 인터넷 또는 웹에서 정보를 검색할 때 사용하는 검색어에서 주제 개체의 인기도를 기반으로 할 수 있습니다.
3. 관련성 점수는 특정 기간 동안 주제 개체의 인기도를 기반으로 할 수 있습니다.
4. 주제 개체의 인기도는 (1) 콘텐츠 코퍼스, (2) 사용자가 사용하는 검색어, (3) 웹 페이지 등에서 개체 개체의 발생 빈도에 따라 결정될 수 있습니다.

이 특허는 주제에 대한 관련성을 채점하는 이러한 다양한 방법이 어떻게 적용될 수 있는지 보여줍니다.
주제 개체 "브레이킹 배드"에 대한 관련성 점수는 텔레비전 쇼 "브레이킹 배드"의 첫 번째 에피소드의 출시 시점부터 마지막 에피소드의 출시 후 1년 사이에 게시된 콘텐츠 항목을 기반으로 할 수 있습니다. 가장 높은 관련성 점수에 해당하는 하나 이상의 주제 개체는 쿼리에 해당하는 주제 개체로 식별될 수 있습니다. 예를 들어, "Breaking Bad"라는 주제 개체의 관련성 점수는 "Breaking Bad"라는 단어의 해당 관련성 점수보다 높을 수 있습니다. 브레이킹 배드'는 컨텐츠의 코퍼스나 사용자의 검색어에 매우 자주 나타날 수 있습니다.
쿼리 중 인용 필터링
검색 결과가 필터링되어 표시되는 방법이 있을 수 있습니다. 특허는 우리에게 몇 가지를 지적합니다.
1. "텔레비전 쇼"와 같은 주제를 기반으로 합니다.
2. 소셜 미디어 연락처가 주제에 대해 말한 것과 같은 개인화를 기반으로 합니다.
주제 엔터티와 관련된 지식 정보 항목 식별
이 특허에서 지식 그래프에 대한 참조를 보고 놀라지 않았습니다.
Google에서 쿼리가 엔티티를 언급하거나 포함하는지 확인하기 위해 쿼리를 볼 때 작업에 더 많은 정보를 제공할 수 있습니다. 특허에 따르면 다음과 같습니다.
주제 엔티티에 대한 지식 그래프 항목은 주제 엔티티와 연관된 정보 및 콘텐츠 항목의 코퍼스를 포함할 수 있습니다. 정보 모음에는 이름, 장소, 사물, 이벤트 및/또는 콘텐츠 항목이 포함될 수 있습니다. 일부 실시예에서, 지식 그래프 항목은 정보 코퍼스에 대한 링크(예를 들어, URL)를 포함할 수 있다. 다른 실시예에서, 지식 그래프 항목은 정보 코퍼스를 포함하는 다른 지식 그래프 항목 및/또는 데이터베이스에 대한 참조 또는 링크를 포함할 수 있습니다.
이 특허는 인기 있는 TV 쇼였던 주제 개체를 사용하여 구체적인 예를 제공합니다.
예를 들어, 주제 엔티티 "브레이킹 배드"에 대한 지식 그래프 항목은 텔레비전 쇼 "브레이킹 배드"에 출연한 배우, 프로듀서, 감독, 촬영 감독 등의 이름을 포함하는 정보 코퍼스를 포함할 수 있습니다. 텔레비전 쇼, 첫 공개 날짜, 에피소드 수, 시즌 수 및/또는 텔레비전 쇼 기간에 대한 정보, 텔레비전 쇼나 텔레비전 쇼의 배우가 받은 상, 에피소드 요약, 블로그 게시물, 비평가 리뷰, 사용자 리뷰, 뉴스 기사, 잡지 기사, 연설, 책, 또는 텔레비전 쇼 "Breaking Bad"와 관련된 기타 콘텐츠 항목. 다른 예로서, 지식 그래프 항목은 빈도와 같은 추가 정보를 포함할 수 있습니다. 사용자(112, 114)는 텔레비전 시리즈 "Breaking Bad"에 관한 정보를 검색하거나 댓글을 게시했거나 콘텐츠 항목 모음에서 쇼 이름 "Breaking Bad"의 인기도를 나타냅니다.

지식 그래프를 기반으로 특정 주제 엔터티에 대해 알려진 정보를 확장하면 해당 엔터티에 대해 훨씬 더 많은 정보를 얻을 수 있습니다. 특허는 다음과 같이 알려줍니다.
예를 들어, 관련 지식 그래프 항목에서 획득한 TV 시리즈 "브레이킹 배드"의 배우, 제작자, 감독 등의 각 이름은 추가 대상 개체를 구성할 수 있습니다. 다른 예로서, 텔레비전 쇼가 언급된 시상식 쇼와 같은 이벤트의 이름 및/또는 시상식 쇼에 참석한 유명인의 이름 등이 또한 추가 주제 개체를 구성할 수 있습니다. 특정 실시예에서, 추가 대상 엔티티의 식별은 재귀적 프로세스를 포함할 수 있습니다. 예를 들어, 텔레비전 쇼가 언급된 이벤트의 이름을 얻은 후 이벤트와 관련된 지식 그래프 항목을 검색하여 해당 이벤트와 관련된 발표자, 발표자 또는 다른 사람들을 주제 엔터티로 식별할 수 있습니다. 하나 이상의 추가 주제 엔티티는 예를 들어 프로세스(400)의 단계(404)와 관련하여 논의된 것과 유사한 프로세스에 기초한 관련성 점수를 사용하여 식별된 추가 주제 엔티티 중에서 선택될 수 있습니다.
지식 그래프와 관련된 정보를 사용하는 주제 엔터티의 범위가 더 넓다는 것은 훨씬 더 넓은 범위의 인용문이 인용 검색에 포함될 수 있다는 것을 의미합니다(흥미로운 일처럼 들릴 수 있음).
이 특허의 흥미로운 측면 중 하나는 Google에서 견적 결과의 순위를 지정하고 표시할 수 있는 방법을 결정할 수 있는 점수에 중점을 둔 섹션이었습니다.
견적과 관련된 점수
소스 페이지 점수
이것은 놀라운 일이 아닙니다. 콘텐츠 항목에 대한 소스 페이지 점수를 기반으로 따옴표가 매겨질 수 있습니다. 콘텐츠 항목의 관련성, 콘텐츠 항목과 관련된 작성자, 게시자 또는 콘텐츠 항목 제공자의 평판 또는 신뢰성, 및/또는 인기도에 기초할 수 있습니다. 콘텐츠 항목 등 우리는 다음과 같이 말합니다.
평판 또는 신뢰성에 기반한 소스 페이지 점수는 데이터베이스에서 소스 페이지 점수에 액세스하여 결정될 수 있으며, 데이터베이스는 작성자, 게시자 또는 콘텐츠 항목 제공자와 관련하여 평판 또는 신뢰성에 기반한 소스 페이지 점수를 저장합니다. 소스 페이지 점수의 데이터베이스는 인용 데이터베이스, 콘텐츠 데이터베이스 및/또는 시스템과 관련된 다른 데이터베이스에 포함될 수 있습니다.
콘텐츠 인기도
평판과 신뢰도 외에도 콘텐츠의 인기도나 콘텐츠 작성자 등도 간과할 수 없습니다. 이는 "컨텐츠 아이템의 인기도, 작성자, 또는 컨텐츠 아이템 코퍼스에서 컨텐츠 아이템과 작성자의 조합"을 기반으로 결정될 수 있습니다. 당연히 검색 엔진은 이러한 것들을 추적할 수 있기 때문에 이 콘텐츠 항목의 인기도는 (1) 사용자가 콘텐츠 항목에 액세스한 횟수 또는 (2) 사용자가 해당 항목을 검색한 횟수에 따라 결정될 수 있습니다. 웹의 콘텐츠 항목입니다.
높은 인기의 영향?
콘텐츠 아이템 및/또는 콘텐츠 아이템의 작성자가 상대적으로 높은 인기도를 가질 때 더 높은 소스 페이지 점수가 할당될 수 있다. 특정 실시예에서, 콘텐츠 아이템의 인기도는, 예를 들어 프로세스(400)의 단계(404)와 관련하여 위에서 논의된 바와 같이 주제 엔티티의 인기도를 결정함으로써 결정될 수 있다. TV 시리즈 "Breaking Bad"는 50~100명의 사용자만 액세스했을 수 있는 기사에 비해 많은 수의 사용자, 예를 들어 수천 명의 사용자가 액세스한 경우 소스 페이지 점수가 높을 수 있습니다.
견적 관련성 점수
이 요소가 특허에 언급되지 않은 경우 이 특허가 Google의 특허라고 말할 수 있는지 확신할 수 없습니다.
견적의 관련성 점수는 견적이 쿼리에 응답하는지 여부를 기반으로 할 수 있습니다. 일부 실시예에서, 응답성은 인용문의 인기도, 인용문을 포함하는 콘텐츠 아이템의 인기도, 인용문의 저자의 인기도, 질의와 관련된 주제 개체의 인기도 등에 기초하여 결정될 수 있다. 인용문의 인기도, 콘텐츠 항목, 또는 인용문 또는 콘텐츠 항목의 작성자는 예를 들어 콘텐츠 항목 모음 또는 사용자 검색에서 인용문, 콘텐츠 항목 및/또는 작성자의 인기도에 따라 위에서 설명한 대로 결정될 수 있습니다. 웹에서. 인용문, 콘텐츠 항목, 또는 인용문 또는 콘텐츠 항목의 저자의 인기도는 예를 들어 인용문, 콘텐츠 항목 및/또는 저자가 하나 이상의 인용문과 함께 나타나는 빈도에 따라 결정될 수도 있습니다. 웹에서 사용자 검색에서 콘텐츠 항목의 코퍼스에서 서로의. 특정 실시예에서, 인용문, 인용문을 포함하는 콘텐츠 항목, 및/또는 인용문 또는 인용문을 포함하는 콘텐츠 항목의 작성자가 높을 때 인용문이 더 높은 관련성 점수를 받을 수 있습니다. 다른 실시예에서, 콘텐츠 항목의 코퍼스 또는 웹 상의 사용자 검색에서 쿼리와 연관된 주제 엔티티와 함께 인용문의 인기가 높을 때 인용문이 높은 관련성 점수를 받을 수 있습니다. 또 다른 실시예에서, 관련성 점수는 예를 들어, 프로세스(400)의 단계(404) 및/또는 프로세스(500)의 단계(506)에서 식별된 대상 아이덴티티의 상대 점수에 기초할 수 있다.
이 섹션에서는 이러한 득점 측면을 컨텍스트에 더 잘 배치할 수 있는 예를 제공합니다.
예를 들어, 무언가를 깨는 것이 나쁜 것으로 간주될 수 있는 방법을 설명하는 인용문은 텔레비전 쇼 "Breaking Bad"의 높은 인기 때문에 TV 쇼 "Breaking Bad"와 관련된 인용문에 비해 낮은 관련성 점수를 받을 수 있습니다. 또 다른 예로서, 오바마 대통령과 함께 주제 개체로 나타나는 넬슨 만델라에 관한 인용문은 더 높은 빈도 점수를 받을 수 있습니다. 그 이유는 그 인용문이 다음과 같이 나타나는 넬슨 만델라에 관한 인용문과 비교하여 콘텐츠 항목 또는 사용자 검색의 모음에서 더 자주 발생할 수 있기 때문입니다. "세계 지도자"와 같은 주제 엔터티. 또한, 다른 실시예에서, 관련성 점수는 인용문이 특정 사용자와 관련될 수 있는지 여부에 기초하여 결정될 수 있다. 예를 들어, 관련성 점수는 특정 사용자의 프로필 또는 검색 이력에서 인용문의 인기도를 결정함으로써 결정될 수 있습니다.
견적의 최근성 점수
뉴스 결과에서 자주 볼 수 있는 것은 최근성 점수입니다. 그리고 그것은 견적 검색에 대해 언급된 것입니다. 이것은 아마도 놀라운 일이 아닐 것입니다. 특허는 다음과 같이 알려줍니다.
최근성 점수는 견적이 작성된 때와 견적이 쿼리와 연결된 것으로 식별된 시간 사이의 경과 시간을 기반으로 할 수 있습니다. 일부 실시예에서, 경과된 시간은 현재 날짜, 예를 들어 쿼리 날짜 및 예를 들어 인용 데이터베이스로부터 획득된 인용과 연관된 정보에 기초하여 인용과 연관된 데이터에 기초하여 결정될 수 있다. 예를 들어, 2014년의 인용문은 2014년의 쿼리에 대한 응답으로 2012년의 인용문에 비해 더 높은 최신성 점수를 받을 수 있습니다.
인용 빈도 점수
이것은 검색 엔진이 추적할 수 있는 것이기 때문에 여기에서 보는 것이 좋습니다. 나는 그것이 잡음이 있는 신호일 수 있다고 생각하지만 쿠키 또는 장치 ID로 식별되는 사람들에게 이 정보에 액세스하는 사용자를 제한하는 것과 같이 잡음의 정도를 제한하는 방법이 있을 수 있습니다. 특허는 다음과 같이 알려줍니다.
빈도 점수를 결정하는 것은 예를 들어 사용자가 인용문에 액세스했을 수 있는 횟수, 콘텐츠 항목 코퍼스에 인용문이 나타난 횟수 또는 인용문이 다음에서 식별되었을 수 있는 횟수를 결정하는 것을 포함할 수 있습니다. 쿼리에 대한 응답. 예를 들어, 견적은 더 적은 사용자가 액세스했을 수 있는 견적에 비해 더 많은 사용자가 견적에 액세스한 경우 더 높은 빈도 점수를 받을 수 있습니다.
견적에 대한 전체 견적 점수
특허에 언급된 다양한 점수는 전체 견적 점수로 결합될 수 있습니다. 여기에는 소스 페이지 점수, 관련성 점수, 최근성 점수, 빈도 점수 및/또는 인용문과 관련된 다른 점수가 포함될 수 있습니다. 이 특허는 이러한 점수가 여러 가지 다른 방식으로 결합될 수 있음을 알려줍니다.
견적을 세트로 그룹화
역 이미지 검색과 같은 장소에서 볼 수 있는 것은 결과를 다른 범주로 그룹화하는 것입니다. 이 특허는 "인용문은 인용문 간의 관계, 식별된 주체 간의 관계 및/또는 인용문 작성자 간의 관계에 따라 집합으로 그룹화될 수 있음"을 알려줍니다.
다시 한 번 특허는 우리에게 다음과 같은 예를 제공합니다.
...버락 오바마 대통령이나 힐러리 클린턴과 같은 정치인이 “브레이킹 배드”에 관해 인용한 인용문은 한 세트의 인용문으로 묶을 수 있는 반면, 클린트 이스트우드나 로버트 드 네로와 같은 영화 인물이 “브레이킹 배드”에 관해 인용한 인용문은 "는 다른 집합으로 그룹화될 수 있습니다. 세트 점수는 각 세트에 포함된 견적 점수를 기반으로 각 세트의 견적에 할당될 수 있습니다. 특정 실시예에서, 세트 스코어는 인용문과 관련된 저자의 인기도에 기초하여 결정될 수 있다.
견적 점수로 견적 순위 지정
견적 결과의 순위를 지정하는 데 견적 점수가 사용되었는지 확인하기 위해 견적 검색이 실행되는 것을 볼 때까지 기다려야 할 수도 있습니다. 이것은 특정 사람들이 특정 주제에 대해 말한 것을 기반으로 검색자에게 정보를 제공하는 흥미로운 방법인 것 같습니다. Google에서 우리에게 이것을 전달하는 것을 보고 싶습니다. 재미있고 유익한 정보가 될 것 같아요.
2020년 1월 6일 추가, 이 특허는 계속 특허를 통해 업데이트되었으며 특허 이면의 프로세스가 업데이트되었습니다. 나는 게시물에서 업데이트에 대해 썼습니다. Google은 동영상에 초점을 맞추기 위해 인용 검색을 업데이트했습니다.
