입력 컨텍스트를 기반으로 검색 입력 명확화

게시 됨: 2018-05-15

"헤이 구글; 뉴욕, 뉴욕!"

Google은 "뉴욕, 뉴욕"에 대한 쿼리를 듣습니다. 길을 알려주거나 Frank Sinatra Song을 연주하거나 관광 스타일의 검색 결과를 표시합니까? 해당 쿼리의 컨텍스트에 따라 다를 수 있습니다.

Google 특허에서 말했듯이:

사용자 입력은 다양한 이유로 모호한 것으로 식별될 수 있습니다. 일반적으로 사용자 입력은 여기에 설명된 기술을 사용하여 입력을 명확하게 하려는 시도가 없는 상태에서 시스템이 의도한 의미를 둘 이상으로 해석하는 경우 모호한 것으로 식별됩니다. 예를 들어, 본 예에서 사용자 입력은 입력에 해당할 수 있는 각 명령에 따라 모호한 것으로 식별됩니다. 사용자 입력 "Go To New York, New York"은 지리적 위치(뉴욕 시 York, NY), 노래(노래 "New York, New York") 및 웹 페이지(뉴욕, 뉴욕 시 관광 웹 페이지). 명령은 각 명령에 해당하는 애플리케이션 및/또는 서비스를 폴링하는 것과 같은 다양한 기술 중 임의의 것을 사용하여 입력에 대응하는 것으로 식별될 수 있습니다(예: "[노래]로 이동" 명령과 연관된 음악 플레이어 쿼리). "New York, New York"이 모바일 컴퓨팅 장치에서 액세스 가능한 노래인지 여부를 결정하기 위해), 각 명령에 대해 하나 이상의 허용되는 용어 그룹에 액세스(예: "Go To [ 지리적 위치]”) 등

해당 쿼리의 컨텍스트를 기반으로 검색 입력 명확화

Google은 검색어에 대한 명확한 답변을 제공하기 위해 검색어에 대한 입력을 제공해 왔습니다. 최근에 부여된 이 Google 특허는 결과가 모호하지 않도록 사용자 입력을 명확하게 하기 위해 쿼리 컨텍스트를 살펴봅니다.

특허에서 알 수 있듯이 이것이 그 목적입니다.

이 문서에 설명된 기술에서 모바일 전화(예: 스마트폰 또는 앱 전화)와 같은 컴퓨팅 장치의 컨텍스트는 모호한 사용자 입력을 명확하게 하기 위해 고려됩니다. 모호한 사용자 입력은 관련 명확화 정보가 없는 경우 컴퓨팅 장치에 의해 또는 컴퓨팅 장치에 대해(예: 컴퓨팅 장치가 전자 통신하는 서버 시스템에 의해) 다음 이상에 해당하는 것으로 해석되는 입력입니다. 하나의 쿼리 또는 명령. 모호한 입력은 부분적으로 동음이의어가 있기 때문에 그리고 부분적으로는 다르게 발음되지만 소리가 비슷한 단어를 구별하는 데 어려움을 겪을 수 있기 때문에 부분적으로는 음성 입력에 대해 모호한 입력이 일반적일 수 있습니다. 예를 들어, 사용자가 모바일 컴퓨팅 장치에 "항해/세일 정보 검색"이라고 말하면 이 음성 입력은 "항해 정보 검색" 명령(예: 범선의 돛에 관한 정보)에 대응할 수 있으므로 모호할 수 있습니다. ) 또는 "판매 정보 검색"(상품 판매에 관한 정보) 명령. 장치는 특히 특정 방언에서 "판매"와 "판매"가 비슷하게 들리기 때문에 입력이 "판매 정보 검색"이라고 결정할 수도 있습니다.

이 검색 입력 명확화는 어떻게 작동합니까?

이 특허는 다음과 같이 사용자 입력 자체와 별개로 모바일 컴퓨팅 장치(및/또는 모바일 컴퓨팅 장치의 사용자)와 관련된 컨텍스트를 기반으로 모호한 사용자 입력이 명확해질 수 있다고 알려줍니다.

  1. 모바일 컴퓨팅 장치가 있는 물리적 위치(예: 집, 직장, 자동차 등)
  2. 모바일 컴퓨팅 장치의 움직임(예: 가속, 정지 등)
  3. 모바일 컴퓨팅 장치에서의 최근 활동(예: 소셜 네트워크 활동, 주고받은 이메일, 주고받은 전화 통화 등)

컨텍스트를 기반으로 명확해진 검색 입력의 예는 다음과 같습니다.

1. 도킹된 장치는 도크의 물리적 전기 접점과 서로 일치하는 장치를 통해 또는 도크와 장치 사이의 전자 통신(예: Bluetooth 또는 RFID를 통해)을 통해 도크의 유형을 결정할 수 있습니다. 장치. 그런 판단에 따라 '차내'인지 '집에서'와 같은 맥락인지 알 수 있다. 그것 덕분에,

... "길찾기"와 같은 음성 입력을 명확하게 하는 장치입니다. 여기서 용어는 "차량 내" 컨텍스트에서 지리적 방향(예: 운전 방향)으로 해석될 수 있고 방법 안내(예: 요리용) "집에서" 모드.

2. 다른 예에서, 모바일 컴퓨팅 장치에서, 다수의 명령을 나타낼 수 있는 모호한 사용자 입력을 수신하는 것은 모바일 컴퓨팅 장치가 현재 어디에 위치하는지를 나타낼 수 있는 모바일 컴퓨팅 장치와 연관된 현재 컨텍스트를 결정하게 할 수 있다. 이는 해당 컨텍스트를 기반으로 제공되는 결과에 영향을 줄 수 있습니다.

컨텍스트를 기반으로 검색 입력을 명확하게 하는 이점

특허는 다음과 같이 특허에 설명된 프로세스를 따를 때의 이점을 알려줍니다.

사용자가 원하는 작업에 대한 입력을 제공하는 모든 형식을 준수할 것을 요구하지 않고 모바일 컴퓨팅 장치가 원하는 작업을 수행하도록 지시하도록 허용합니다. 모바일 컴퓨팅 장치에 의해 제공되는 기능이 증가함에 따라, 사용자는 입력이 의도한 기능과 적절하게 연관되도록 보다 구체적으로 입력을 제공해야 할 수 있습니다. 그러나 그러한 특이성은 번거롭고 기억하기 어려울 수 있습니다. 이 문서에 설명된 방법, 시스템, 기술 및 메커니즘을 통해 사용자는 기능에 대해 공식적으로 요구되는 것보다 덜 구체적으로 입력을 제공하면서도 여전히 의도된 기능에 액세스할 수 있습니다.

특허는 다음과 같습니다.

컨텍스트를 기반으로 입력 명확화
발명가: John Nicholas Jitkoff 및 Michael J. LeBeau
양수인: Google LLC
미국 특허: 9,966,071
부여: 2018년 5월 8일
출원일: 2016년 7월 1일

추상적 인

일 구현에서, 컴퓨터 구현 방법은 모바일 컴퓨팅 장치에서 복수의 명령 중 하나 이상을 나타내는 모호한 사용자 입력을 수신하는 단계; 및 모바일 컴퓨팅 장치가 현재 어디에 위치하는지를 나타내는 모바일 컴퓨팅 장치와 연관된 현재 컨텍스트를 결정하는 단계를 포함합니다. 방법은 모바일 컴퓨팅 디바이스와 연관된 현재 컨텍스트에 기초하여 복수의 명령들로부터 명령을 선택함으로써 모호한 사용자 입력을 명확화하고, 선택된 명령의 수행과 연관된 출력이 모바일 컴퓨팅 디바이스에 의해 제공되게 하는 단계를 더 포함할 수 있다. .

오늘 아침에 "Hey Google"로 시작하는 Google 스피커(기기)와 논의했지만 Google이 최근 Google I/O 컨퍼런스에서 발표한 몇 가지 변경 사항을 발표한 후 그 핫 워드 문구를 말할 것을 요구하지 않았습니다. 나는 스포츠 점수를 물어본 다음 그것에 대해 질문했습니다. 내 스피커 버전의 Google Now와 가장 잘 상호 작용하는 방법을 여전히 배우고 있지만 흥미롭습니다. (도움이 되는 것을 요청할 때 제발이라고 말할까요?) 이 특허에서 이 구절을 읽기 시작하면서 아침 대화가 떠올랐습니다.

이 문서는 모바일 컴퓨팅 장치(예: 모바일 피처 전화, 스마트 전화(예: iPhone, BLACKBERRY), 개인 휴대 정보 단말기(PDA), 휴대용 미디어 플레이어(예: , iPod) 등). 모바일 컴퓨팅 장치에서 제공하는 기능이 증가함에 따라 모바일 컴퓨팅 장치에서 인식하는 명령의 수도 증가할 수 있습니다. 예를 들어, 모바일 컴퓨팅 장치 상의 각각의 특징은 모바일 컴퓨팅 장치에서 특징이 시작되도록 하기 위해 사용자가 타이핑, 말하기, 제스처 등을 할 수 있는 하나 이상의 대응하는 명령을 등록할 수 있다. 그러나, 인식되는 명령의 수가 증가함에 따라 명령이 수렴되어 사용자 입력이 해당하는 여러 명령 중 어떤 명령에 해당하는지 구별하기가 더 어려워질 수 있습니다. 음성 입력의 경우 문제가 확대됩니다. 예를 들어, 큰 배경 소음과 함께 제공되는 음성 입력은 정확하게 해석하기 어려울 수 있으며 결과적으로 모바일 컴퓨팅 장치에서 인식하는 둘 이상의 명령에 매핑될 수 있습니다. 예를 들어, 음성 입력 "예시"는 무엇보다도 "계란 샘플", "예시" 또는 "시험 풀"로 해석될 수 있습니다. 다른 예로서, "go-to" 명령은 매핑 애플리케이션에 대해 "go to [geographic location]"을 나타내고 미디어 플레이어에 대해 "go to [artist/album/song]"을 나타낼 수 있다.

Google에서 최상의 결과를 얻기 위해 기기, 스피커 및 휴대기기와 상호작용하는 가장 좋은 방법을 배우려고 노력하는 동안 Google은 또한 우리와 가장 잘 상호작용하는 방법을 배우고 우리가 요청할 때 이해를 확실히 하기 위해 노력하고 있습니다. 무엇. 검색 입력을 명확하게 하는 이 특허는 그 방향으로 몇 가지 단계를 거칩니다. 그것이 우리에게 말하듯이:

여기에 설명된 기술을 사용하여, 모호한 사용자 입력을 수신하는 것에 응답하여, 모바일 디바이스(및/또는 모바일 컴퓨팅 디바이스의 사용자)에 대한 현재 컨텍스트가 결정되고 모호한 사용자 입력을 명확하게 하기 위해 사용될 수 있습니다. 모바일 컴퓨팅 장치에 대한 현재 컨텍스트는 모바일 컴퓨팅 장치 및/또는 모바일 컴퓨팅 장치의 사용자와 관련된 다양한 정보를 포함할 수 있습니다. 컨텍스트는 장치 외부에 있을 수 있으며 현재 물리적 위치(예: 집, 직장, 자동차, 무선 네트워크 "testnet2010" 근처에 위치 등), 방향 및 속도와 같은 장치 주변의 실시간 상태를 나타낼 수 있습니다. 장치가 이동하는 속도(예: 시속 20마일로 북쪽으로 이동), 현재 지리적 위치(예: 10th Street 및 Marquette Avenue 모퉁이) 및 주변 소음(예: 낮은 음의 윙윙거리는 소리, 음악, 등.). 컨텍스트는 또한 예정된 및/또는 최근 일정 약속(예: 2010년 7월 29일 오후 2시 30분에 John과 회의), 장치 시계의 시간 및 날짜(예: , 2010년 7월 29일 오후 2시), 최근 장치 활동(예: 2시 30분 회의와 관련하여 John에게 보낸 이메일), 모바일 컴퓨팅 장치 카메라(들)의 이미지.

나는 종종 휴대전화를 사용하여 장소를 탐색하고 내 휴대전화와 통화할 수 있기를 원합니다. 첫 번째 목적지로 돌아가기 위해 U턴을 하라는 메시지를 중지하도록 내비게이션을 끄고 싶습니다.

이 특허는 다음과 같이 상황에 따라 장치가 작동하는 방식에 영향을 미칠 수 있는 몇 가지 흥미로운 아이디어를 제시하기 때문에 시간을 할애할 가치가 있습니다.

모호한 사용자 입력이 식별되면 B 단계에서 모바일 장치에 대한 현재 컨텍스트가 결정될 수 있습니다. 현재 컨텍스트는 입력이 수신될 때 모바일 컴퓨팅 장치 및/또는 모바일 컴퓨팅 장치의 사용자의 현재 상태 및/또는 주변을 설명하는 정보를 포함합니다. 예를 들어, 현재 컨텍스트는 주변 물리적 환경에 관한 정보(예: 사용 가능한 네트워크, 다른 인근 컴퓨팅 장치에 대한 연결, 지리적 위치, 기상 조건, 주변 비즈니스, 주변 소음의 양, 주변 조명의 수준, 모바일 장치의 카메라로 캡처한 이미지 등), 모바일 컴퓨팅 장치의 현재 상태(예: 속도, 터치스크린 입력 활성화, 오디오 입력 활성화, 벨소리) 켜짐/꺼짐 등), 시간 및 날짜 정보(예: 시간, 날짜, 달력 약속, 요일 등), 사용자 활동(예: 최근 사용자 활동, 습관적 사용자 활동) 등 현재 컨텍스트는 모바일 컴퓨팅 장치에 로컬 및/또는 원격인 데이터 및 센서를 사용하여 모바일 컴퓨팅 장치에 의해 결정될 수 있습니다.

컨텍스트에 따른 명확한 검색 입력과 관련된 변경

옛날 옛적에 쿼리에 대한 페이지를 최적화할 때 책상에 앉아 데스크톱 컴퓨터나 랩톱 컴퓨터를 사용하는 누군가가 쿼리를 수행했을 가능성이 큽니다. 이제 그것은 차 안에 있는 사람, 버스나 기차에 있는 사람, 상점 통로에 있는 사람 또는 커피숍에 있는 사람일 수 있습니다. 그들이 "뉴욕, 뉴욕"을 검색하는 이유는 교통 안내를 원하거나 노래를 듣거나 시내에서 무슨 일이 일어나고 있는지 알아보기 위해 웹 페이지를 읽기 때문일 수 있습니다.

저는 제 여동생이 맨해튼에서 학교에 다닐 때 방문했던 것을 기억합니다. 그녀는 그날 도시에서 열리는 거리 축제가 있는지 알아보자고 제안했습니다. 그녀는 전화를 들고 411에 전화를 걸어 교환원에게 물었다. 이것은 World Wide Web을 찾기 위해 사용할 수 있는 약 5년 전의 일이었고 그녀는 운영자로부터 답변을 받았고 저를 엄청나게 놀라게 했습니다. 나는 그 출처에서 그 대답을 기대하지 않았습니다. 지금은 그것에 대해 알려줄 수 있는 웹 페이지를 찾을 수 있기를 기대하지만 미래의 언젠가는 컴퓨터나 휴대 전화를 사용하여 그런 정보를 찾을 수 있을 거라고는 예상하지 못했습니다. 세상이 변하고 있습니다.

모바일 장치와 검색 엔진이 가져올 변화에 얼마나 준비되어 있습니까?