검색자 작업 데이터의 기계 학습 명확화

게시 됨: 2021-10-23

검색 엔진이 검색자 작업 데이터에서 무엇을 배울 수 있습니까?

이 특허는 컴퓨터의 작동을 개선하는 것에 관한 것입니다.

검색자 작업 데이터는 금융 거래를 나타낼 수 있습니다. 신용 카드 명세서에는 특정 신용 카드에 대한 금융 거래 데이터가 포함될 수 있습니다.

이 검색자 작업 데이터에는 다음이 포함될 수 있습니다.

  • 날짜
  • 설명
  • 특정 금융 거래에 해당하는 금액

금융 거래 데이터, ["4/12/2013", "ITALIAN DELI NEW YORK NY", "12.08"]은(는) "Italian Deli"에 위치한 2013년 4월 12일 거래에 대해 $12.08의 신용 카드 청구를 나타낼 수 있습니다. 뉴욕, NY

이 특허에는 많은 엔터티 유형에 대한 검색자 작업 데이터가 포함됩니다. 이 프로세스에서는 머신 러닝 기반 애노테이터를 사용하여 다음을 수행해야 합니다.

  • 엔티티 인식
  • 검색자 작업 데이터에 주석을 추가합니다.
  • 검색자로부터 쿼리 받기
  • 검색자 작업 데이터 쿼리
  • 검색자 작업 데이터에서 쿼리에 대한 답변 생성
  • 쿼리에 응답

시스템은 복수의 엔티티 유형의 엔티티에 대해 특정 검색자가 취한 데이터를 수신할 수 있습니다. 엔터티를 확인할 수 없기 때문에 대부분의 엔터티에 대한 데이터가 모호한 것으로 결정됩니다. 시스템은 복수의 엔티티 유형의 엔티티에 대해 특정 검색자가 취한 조치를 나타내는 정보를 명확하게 합니다.

검색자 작업 데이터에서 명확해지는 것은 무엇입니까?

명확화는 모호하다고 결정된 대다수의 엔터티에 대해 지정된 엔터티를 식별하는 것을 포함할 수 있습니다. 데이터의 엔터티 및 엔터티 속성을 인식하도록 훈련된 기계 학습 기반 주석자를 사용합니다. 또한 많은 엔티티 유형의 엔티티에 대한 검색자 작업 데이터를 나타내는 데이터에 각각의 엔티티 식별자를 주석으로 표시합니다.

시스템은 특정 검색자에 특정한 쿼리를 수신합니다. 질문에는 엔터티의 첫 번째 엔터티 유형과 엔터티에 대해 검색자가 취한 작업을 나타내는 용어가 포함됩니다. 시스템은 첫 번째 엔티티 유형의 엔티티를 결정하고 첫 번째 엔티티 유형의 엔티티에 대해 검색자가 취한 작업을 나타내는 데이터를 쿼리합니다. 시스템은 첫 번째 엔티티 유형의 엔티티에 대해 특정 검색자가 취한 조치를 나타내는 정보로부터 쿼리에 대한 답변을 생성하고 특정 검색자에게 특정한 질문에 대한 답변을 제공합니다.

데이터는 금융 거래 데이터와 같은 검색자 작업 데이터로 표시됩니다. 시스템은 금융 거래를 나타내는 검색자 동작 데이터를 수신할 수 있습니다. 검색자 작업 데이터에는 다음이 포함될 수 있습니다.

  • 신용카드 거래 데이터
  • 체크카드 거래 데이터
  • 재무제표 거래 데이터

시스템은 금융 거래에 대한 정보를 제공하기 위해 금융 거래 데이터를 분석할 수 있습니다. 예를 들어, 시스템은 검색자가 특정 카테고리에서 지출한 금액 또는 백분율을 보기 위해 금융 거래를 분류할 수 있습니다. 카테고리는 "레스토랑"을 포함할 수 있고, 시스템은 해당 검색자 액션 데이터가 "Deli"라는 단어로 구성되기 때문에 레스토랑 아래 레스토랑 "Italian Deli"에서의 금융 거래를 인덱싱할 수 있습니다. 그러나 금융 거래 데이터는 더 모호해질 수 있습니다. 예를 들어, 금융 거래 데이터["4/11/2013," "BEST R NEW YORK NY," "45.78"]가 불분명해질 수 있습니다.

금융 거래 데이터의 명확화

금융 거래 데이터를 명확하게 하기 위해 시스템은 금융 거래 데이터와 관련된 엔티티를 식별하는 기계 학습 기반 주석을 사용할 수 있습니다. 엔터티는 다음과 같은 비즈니스 엔터티일 수 있습니다.

  • 특정 매장
  • 레스토랑
  • 사무실
  • 회사

예를 들어, 머신 러닝 기반 애노테이터는 뉴욕주 뉴욕에 위치한 "최고의 레스토랑" 엔티티를 식별할 수 있으며 금융 거래 데이터와 연관됩니다.

레이블이 지정된 훈련 데이터를 기반으로 한 연관

머신 러닝 기반 애노테이터는 레이블이 지정된 훈련 데이터를 기반으로 검색자 작업 데이터와 관련된 엔터티를 식별하도록 훈련될 수 있습니다. 예를 들어, 머신 러닝 기반 애노테이터는 위치를 포함한 금융 거래 데이터(예: "NEW YORK NY", "DC" 또는 "90210")가 지역.

그리고, 머신 러닝 기반 애노테이터는 단일 문자, 예를 들어 "R"이 엔티티 이름의 문자로 시작하는 단어의 약어일 수 있음을 결정하도록 훈련될 수 있습니다. 머신 러닝 기반 애노테이터는 "NEW YORK NY", "BEST" 및 "R"의 존재를 기반으로 금융 거래 데이터가 New York, NY에 위치한 "Best Restaurant"이라는 엔티티와 연관되는지 결정할 수 있습니다.

또한, 머신 러닝 기반 애노테이터는 금융 거래 데이터의 설명을 분석하거나 금융 거래 데이터의 더 많은 정보(예: 금액 및 날짜)를 분석하도록 훈련될 수 있습니다. 예를 들어, 머신 러닝 기반 애노테이터는 금액 및 날짜를 ​​고려하여 "최고의 레스토랑"과 관련된 금융 거래를 추가로 결정할 수 있습니다. 주석가는 $45.78의 금액이 레스토랑 "Best Restaurant"에서 지출한 금액과 일치하고 금융 거래의 당사자였던 검색자가 2013년 4월 11일에 뉴욕에 있었던 것으로 선택할 수 있습니다. 검색자의 프로필.

비금융거래 데이터인 Searcher Action 데이터

이 특허는 또한 머신 러닝 기반 주석자를 훈련하는 데 사용되는 레이블이 지정된 훈련 데이터에 텍스트와 연관되는 것으로 식별된 엔터티 및 텍스트가 포함될 수 있다고 알려줍니다. 예를 들어, 머신 러닝 기반 애노테이터는 "최고의 레스토랑" 엔티티와 연관되는 것으로 식별되는 "최고의 레스토랑"에 대한 웹사이트의 발췌문을 사용하여 준비할 수 있습니다. 레이블이 지정된 교육 데이터에는 다음과 같은 기타 비금융 거래 데이터가 포함될 수 있습니다.

  • 식별된 엔티티와 연결된 리뷰 웹사이트의 텍스트
  • 검색자의 소셜 네트워크 상호작용
  • 검색자가 사용하는 검색어
  • 검색자는 식별된 엔터티가 정확하거나 정확하지 않다는 명시적 확인을 포함하여 교육 데이터를 제공했습니다.

추가적으로, 라벨링된 트레이닝 데이터는 식별된 엔티티와 연관된 금융 거래 데이터를 포함할 수 있다. 예를 들어, 레이블이 지정된 훈련 데이터는 "최고의 레스토랑"을 포함하여 레스토랑에서의 금융 거래를 나타내는 금융 거래로 구성될 수 있습니다.

시스템은 금융 거래를 기계 학습 기반 주석에 의해 식별된 엔티티와 연관시킬 수 있습니다. 방법은 금융 거래 데이터에 인식된 개체를 나타내는 식별자를 포함하는 데이터로 주석을 달 수 있습니다. 예를 들어, 시스템은 금융 거래 데이터["4/11/2013," "BEST R NEW YORK NY," "45.78"]에 엔티티 식별자 "00542687"을 주석으로 추가하여 주석이 달린 금융 거래 데이터["4/ 11/2013," "BEST R NEW YORK NY," "45.78," "00542687"] 여기서 "00542687"은 "Best Restaurant" 엔티티의 고유 식별자입니다.

시스템은 엔티티에 대한 엔티티 데이터를 저장할 수 있음

시스템은 엔티티에 대한 엔티티 데이터를 저장할 수 있습니다. 예를 들어 식당인 엔터티에 대한 엔터티 데이터에는 다음이 포함될 수 있습니다.

  • 레스토랑 이름
  • 주소
  • 전화 번호
  • 시간
  • 식사 스타일
  • 요리 종류
  • 수석 셰프 이름
  • 가격 범위

의류 매장의 엔터티에는 다음이 포함될 수 있습니다.

  • 가게 이름
  • 의류의 종류
  • 타겟 고객
  • 시간
  • 가격 범위

다른 유형의 엔터티는 다른 속성에 대해 다른 값을 포함할 수 있습니다.

검색자 작업 데이터는 금융 거래에 대한 정보를 제공할 수 있습니다.

주석이 달린 금융 거래 데이터를 사용하여 시스템은 금융 거래에 대한 정보를 제공할 수 있습니다. 예를 들어, 검색자가 2013년 4월 11일에 검색자가 어떤 식당에서 식사를 했는지 시스템에 식별하도록 요청하면 시스템은 주석이 달린 금융 거래 데이터를 기반으로 4월의 금융 거래를 식별할 수 있습니다. 2013년 11월 11일, 레스토랑인 엔터티와 연결되고 레스토랑의 결과 "Best Restaurant"을 반환합니다.

이 특허에 기술된 주제는 특정 금융 거래에 대한 상세한 금융 거래 데이터를 포함할 수 있습니다. 특정 금융 거래 데이터를 금융 거래 데이터와 관련된 엔터티를 식별하는 기계 학습 기반 주석에 제공할 수 있습니다. 더 많은 작업에는 특정 금융 거래를 자세한 재무 데이터에 대해 기계 학습 기반 주석으로 식별된 엔터티와 연결하는 것이 포함될 수 있습니다.

그리고, 본 명세서에 기술된 주제는 특정 금융 거래의 당사자였던 검색자로부터 질의를 수신하고 그 질문과 관련된 엔티티 유형을 결정하는 동작을 포함할 수 있는 방법으로 구현될 수 있다. 더 많은 측정값에는 특정 금융 거래와 관련된 엔터티가 쿼리와 관련된 엔터티 유형과 일치하는지 결정하는 것이 포함될 수 있습니다. 추가 작업에는 쿼리에 대한 응답으로 엔터티를 식별하는 응답을 제공하는 것이 포함될 수 있습니다.

다른 버전에는 컴퓨터 저장 장치에 인코딩된 방법의 동작을 수행하도록 구성된 해당 시스템, 장치 및 컴퓨터 프로그램이 포함됩니다.

기타 유형의 금융 거래

이러한 버전과 다른 버전에는 각각 다음 기능이 포함될 수 있습니다. 금융 거래 데이터에는 다음이 포함될 수 있습니다.

  • 신용카드 거래 데이터
  • 체크카드 거래 데이터
  • 재무제표 거래 데이터

특정 양상들에서, 머신 러닝 기반 주석자에 의해 식별된 엔티티와 특정 금융 거래를 연관시키는 것은 인식된 엔티티를 나타내는 식별자로 특정 금융 거래 데이터에 주석을 다는 것을 포함할 수 있다.

액션은 머신 러닝 기반 애노테이터로부터 후보 엔터티를 식별하는 데이터를 수신하고 특정 금융 거래의 당사자였던 검색자의 검색자 프로필을 기반으로 식별된 후보 엔터티로부터 특정 금융 거래와 연관된 엔터티를 선택하는 것을 포함할 수 있습니다.

검색자 프로파일에 기초하여 후보 엔티티로부터 특정 금융 거래와 연관되는 엔티티를 선택하는 것은 금융 거래 데이터에 의해 표시된 날짜에 검색자 프로파일이 검색자가 금융 거래와 연관된 위치에 위치하는 것을 제안한다고 결정하는 것을 포함할 수 있습니다. 실재.

Searcher Ation Data 특허의 머신 러닝 명확화

머신 러닝 기반 어노테이터는 레이블이 지정된 학습 데이터를 사용하여 학습됩니다.

특허 받은 Searcher Action Data 프로세스의 작업에는 다음이 포함될 수 있습니다.

  • 특정 금융거래의 당사자였던 검색자로부터 질의 수신
  • 쿼리와 연결된 엔터티 유형 확인
  • 특정 금융 거래와 관련된 엔터티가 쿼리와 관련된 엔터티 유형과 일치하는지 결정
  • 쿼리에 대한 응답으로 엔터티를 식별하는 응답 제공

특허는 다음과 같습니다.

검색자 작업 데이터의 기계 학습 명확화
후원자: 매튜 코완
양수인: Google LLC
미국 특허: 11,151,198
부여: 2021년 10월 19일
출원일: 2020년 1월 22일

추상적 인

컴퓨터 저장 매체에 인코딩된 컴퓨터 프로그램을 포함하는 방법, 시스템 및 장치로, 복수의 개체 유형의 개체에 대해 특정 검색자가 취한 작업을 나타내는 데이터를 수신하고, 기계를 사용하여 데이터에 지정된 개체를 식별하여 데이터를 명확하게 합니다. 엔티티를 인식하고 데이터에 주석을 달고 특정 검색자로부터 특정 쿼리를 수신하고 특정 검색자가 수행한 작업을 나타내는 데이터를 쿼리하고 수행된 작업을 나타내는 데이터에서 쿼리에 대한 답변을 생성하도록 훈련된 학습 기반 주석 특정 검색자에 의해 쿼리에 대한 답변을 제공합니다.