Google은 지식 정보에서 장소 이름을 이해하는 방식을 변경합니다.

게시 됨: 2018-02-16

Google 지식 정보의 장소 이름

Google은 지식 정보를 보유하기 전에 Fact Repository를 구축했습니다. Google은 2006년에 Browseable Fact Repository에 대한 특허를 출원했으며 저는 Google의 Browseable Fact Repository - an Early Knowledge Graph라는 제목의 게시물에서 해당 특허에 대해 썼습니다. Fact Repository의 공동 발명가 중 한 명은 Google에서 Annotation Framework라고 하는 프로젝트를 담당했으며 지식 기반을 구축한 Google의 Meta Web 인수에도 관여한 Andrew W. Hogue였습니다. Freebase로 알려져 있으며 Google의 지식 정보 생성으로 이어집니다. Google에서 Fact Repository를 참조하면 지식 기반을 생각하십시오.

웹과 같은 문서 모음에 나타나는 중요한 유형의 사실 중 하나는 지명입니다.

Google은 사실 리포지토리에서 장소 이름에 대한 지리적 위치 결정이라는 이름으로 2007년에 원래 출원된 특허를 받았습니다.

최근 지식 기반 검색의 관련 엔터티 점수 게시물에서 썼듯이 Google은 엔터티 속성에 대한 정보를 사용하여 검색 결과를 제공할 수 있습니다. 따라서 Google이 장소 이름과 같은 지식 기반 데이터를 추출할 때 올바른 정보를 얻는 데 도움이 될 수 있다는 것은 중요한 사실입니다. 지식 기반은 그러한 종류의 정보가 정확하도록 하는 데 더 풍부하고 유용합니다.

Google의 업데이트된 지명 특허

Google은 이번 주에 지명 및 사실 저장소에 대한 특허의 연속 버전을 부여받았습니다. 계속 특허는 계속되는 특허의 원래 출원 날짜를 사용하는 업데이트된 특허이며 일반적으로 매우 유사한 설명 텍스트와 이미지를 포함하지만 업데이트된 주장이 있습니다. 2007년에 출원된 원 특허와 2012년에 출원된 계속 특허를 보면 청구범위가 이전 특허에서 최근에 부여된 신규 특허로 변경되었음을 알 수 있습니다.

특허의 첫 번째 버전에서 중요한 역할을 한 것으로 보이는 우려 중 하나는 정확한 지명에 대한 사실을 얻는 것이었습니다. 이 특허는 이러한 우려에 대해 다음과 같이 알려줍니다.

다른 출처에서 추출한 지명은 형식이 다양하며 오타, 누락 또는 불분명한 언어가 포함될 수 있습니다. 단어가 장소 이름을 나타내는지 여부와 다른 장소 이름이 동일한 위치를 나타내는지 여부에 대해서도 모호할 수 있습니다. 지명의 정확한 위치를 식별할 수 있는 방법이 있으면 유용합니다.

특허의 첫 번째 버전에 대한 주장은 내가 쓴 게시물인 How Google이 Direct Answers에 대한 사실을 확증하는 방법을 생각나게 했습니다.

특허의 두 번째 버전에서 주장에서 제거된 다음과 같은 줄이 있습니다.

제1항에 있어서, 제1 잠재적 지명을 식별하는 단계는 하나 이상의 대문자 단어의 시퀀스를 검사하는 단계를 포함하는 방법.

제1항에 있어서, 제1 잠재적 지명을 식별하는 단계는 값에서 제2 잠재적 지명을 식별하고 제2 잠재적 지명을 둘러싸는 단어를 조사하는 단계를 포함하는 방법.

제1항에 있어서, 제1 잠재적 지명을 식별하는 단계는 동일한 지명의 다양한 표현을 식별하는 단계를 포함하는 방법.

제1항에 있어서, 상기 속성은 동일한 속성을 포함하는 사실들을 비교하여 지명에 상응하는 것으로 판단됨을 특징으로 하는 방법.

Google의 지역 검색에서 장소에 대한 언급에서 논의된 NAP(이름, 주소, 전화번호) 일관성이 생각납니다.

새로운 버전의 특허는 위도 및 경도와 같은 지리적 좌표와 함께 언급된 장소 이름에 태그를 지정하는 데 훨씬 더 중점을 둡니다(특허 그림에서 볼 수 있음). 새로운 특허에 대한 초기 주장 중 일부를 살펴보면 다음과 같은 새로운 초점을 볼 수 있습니다.

제1항에 있어서, 상기 제1 지리적 위치 좌표를 저장하는 단계는 상기 제1 지리적 위치 좌표로 상기 제1 잠재적인 장소명을 태깅하는 단계를 포함하는 방법.

제2항에 있어서, 태깅하는 단계는 제1 잠재적 장소 이름을 지도 보기에 대한 하이퍼링크로 변환하는 단계를 포함하는 방법.

제1항에 있어서, 충돌 가능한 지리적 위치 좌표 사이를 명확화하는 단계는 컨텍스트에 대해 소스 문서로부터 소스 문서를 검사하는 단계를 포함하는 방법.

제1항에 있어서, 상기 제1 잠재적 지명에 대한 지리적 위치 좌표를 결정하는 단계는 복수의 지명을 조사하는 단계를 포함하는 방법. 복수의 장소 이름 각각은 각각의 지리적 위치 좌표로 이전에 태그가 지정되었습니다.

새로운 버전의 특허는 다음과 같습니다.

팩트 리포지토리에서 장소 이름에 대한 지리적 위치 결정
발명가: David J. Vespe 및 Andrew Hogue
양수인: Google LLC
미국 특허: 9,892,132
부여: 2018년 2월 13일
출원일: 2012년 12월 31일

추상적 인

컴퓨터 시스템의 메모리에 있는 개체 모음과 관련된 장소 이름인 지리적 위치 좌표로 장소 이름에 태그를 지정하는 시스템 및 방법입니다. 시스템 및 방법은 첫 번째 잠재적인 장소 이름을 식별하기 위해 메모리에 저장된 객체 내의 텍스트 문자열을 처리합니다. 시스템 및 방법은 지리적 위치 좌표가 첫 번째 잠재적 장소 이름에 대해 알려져 있는지 여부를 결정합니다. 시스템 및 방법은 메모리의 객체와 관련된 첫 번째 잠재적인 장소 이름을 장소 이름으로 식별합니다. 시스템 및 방법은 첫 번째 식별된 장소 이름에 대한 지리적 위치 좌표가 알려져 있을 때 메모리의 객체와 관련된 첫 번째 식별된 장소 이름에 해당 지리적 위치 좌표를 태그합니다. 시스템과 방법은 여러 장소 이름이 발견될 때 장소 이름을 명확하게 합니다.

지명에 대한 후기

나는 누군가에게 Twitter에서 특허가 때때로 쓸모없게 되어 검색 엔진에서 더 이상 사용되지 않는지, 또는 아직 시간이 남아 있기 때문에 검색 엔진이 특허를 받은 발명품을 강제로 사용하게 되는지 묻게 했습니다. 특허는 만료됩니다. Amazon이 취득한 원 클릭 특허가 만료되었으며 Stanford University가 소유하고 Google에 라이선스가 부여된 원래 PageRank 특허가 만료되었습니다. 프로세스가 개발되어 특허가 나면 그 뒤에 있는 프로세스가 변경될 수 있고, 제가 이 포스트에서 쓴 것과 같은 계속 특허를 출원할 수도 있습니다.

계속 주시한다면, 계속 특허는 회사가 취할 수 있는 접근 방식의 변화에 ​​대한 힌트를 제공할 수 있습니다. 예를 들어, 이 지명 특허에서 초점은 철자의 일관성과 특정 개체에 대해 언급된 사실을 기반으로 하는 확증 사실에서 지리적 좌표와 같이 변경되지 않을 수 있는 일부 사실로 이동하는 것으로 보입니다. 예, 특허도 변하고 그 뒤에 있는 프로세스도 변합니다. 계속 특허를 찾고 무엇이 변경되었을 수 있는지 이해하려고 시도하는 것은 흥미 롭습니다.