Wyszukiwanie cytatów podmiotów w Google

Opublikowany: 2017-08-15

Zmiana jest prawem życia. A ci, którzy patrzą tylko w przeszłość lub teraźniejszość, z pewnością tęsknią za przyszłością. – John F. Kennedy

Wyszukiwanie cytatów w Google

Istnieje szeroki zakres informacji, których ludzie szukają w sieci. Zauważyłem niedawno przyznany patent Google, który skupia się na znajdowaniu i wyświetlaniu cytatów znanych osób i celebrytów oraz innych osób na określone tematy. Jedną z interesujących rzeczy w tym patencie był sposób, w jaki decydował on o punktacji za cytaty, które określały sposób wyświetlania wyników cytatów. Podobnie jak większość patentów, ten wskazuje na potencjalne problemy związane z tym, w jaki sposób obecne (przed patentem) wyniki mogą być pokazywane i problemy z nimi. Patent podaje następujący przykład:

Jednak takie wyszukiwania tekstowe często nie dają wyników najbardziej pożądanych przez użytkownika. Na przykład wyszukiwanie frazy „przełamywanie złych” może zwrócić cytaty typu: „Większość ludzi nie ma takiej chęci do przełamywania złych nawyków. Mają wiele wymówek i mówią jak ofiary”. Ten cytat, choć prawdziwy, nie odnosi się do popularnego programu telewizyjnego „Breaking Bad”. Użytkownik wyszukujący cytaty związane z programem telewizyjnym „Breaking Bad” może zatem otrzymać cytaty niezwiązane z zapytaniem użytkownika.

Patent wykorzystuje podejście, które zwraca uwagę na jednostki w zapytaniu. Jak powiedział nam Paul Haahr w swojej prezentacji z SMX w zeszłym roku, How Google Works, wyszukiwarka często szuka podmiotów w zapytaniach jako pierwszy krok w zwracaniu wyników wyszukiwania. To jest teraźniejszość poszukiwań. Wyszukując cytat, wygląda na to, że Google może spróbować znaleźć podmiot, który jest cytowany, oraz podmiot będący przedmiotem cytatu. Patent wskazuje na to od razu na początku opisu, jak to działa:

Niniejsze ujawnienie przedstawia zaimplementowane komputerowo systemy i metody wyszukiwania kwotowań jednostek na podstawie zapytania użytkownika. W ramach wyszukiwania można zidentyfikować jedną lub więcej podmiotów powiązanych z zapytaniem. Niniejsze ujawnienie dotyczy również systemów i sposobów, które wykorzystują bazę danych do identyfikacji zestawu cytatów odpowiadających zapytaniu lub jednej lub większej liczbie zidentyfikowanych podmiotów. Co więcej, zapewniono systemy i metody do generowania kolejności rang zidentyfikowanych cytatów, gdzie kolejność rang opiera się na ocenach cytatów. Ponadto zapewniono systemy i sposoby przesyłania informacji w celu wyświetlenia wybranych cytatów na urządzeniu wyświetlającym.

Jedną z rzeczy, które przykuły moją uwagę, był sposób oceniania cytatów w rankingu. Pomyślałem, że warto się podzielić. Rozejrzałem się też dookoła, aby zobaczyć, czy mogę zobaczyć przykłady użycia cytatów przez Google i zauważyłem, że w niektórych panelach wiedzy, takich jak ten od Zygmunta Freuda, było kilka cytatów i opcja kliknięcia linku i zobaczenia więcej cytaty. Wygląda więc na to, że Google jest zainteresowany nie tylko pokazywaniem nam informacji o podmiotach, ale także o tym, co mogli powiedzieć w przeszłości.

Patent przyznany w zeszłym tygodniu w USPTO to:

Systemy i metody wyszukiwania notowań podmiotów korzystających z bazy danych
Wynalazcy: Eyal Segalis, Gal Chechik, Yossi Matias, Yaniv Leviathan i Yoav Tzur
Przypisany: GOOGLE
Patent USA: 9 727 617
Przyznano: 8 sierpnia 2017 r.
Złożony: 10 marca 2014 r.

Abstrakcyjny

Dostępne są systemy i metody wyszukiwania i identyfikowania cytatów w odpowiedzi na zapytanie użytkownika. Zgodnie z pewnymi przykładami wykonania, zapewniono systemy i metody do identyfikowania jednej lub większej liczby podmiotów objętych zapytaniem oraz do identyfikowania, z bazy danych lub wyników wyszukiwania uzyskanych w odpowiedzi na zapytanie, zestawu cytatów odpowiadających jednemu lub większej liczbie podmiotów będących podmiotami . Ponadto, zapewniono systemy i metody do określania ocen cytatów dla zidentyfikowanych cytatów w oparciu o co najmniej jeden z powiązań każdego cytatu z jednym lub większą liczbą podmiotów, aktualności każdego cytatu i popularności każdego cytatu. Ponadto zapewniono systemy i metody służące do organizowania zidentyfikowanych cytatów w kolejności rankingowej w oparciu o wyniki cytatów i wybierania cytatów w oparciu o porządek rankingowy lub w oparciu o wyniki cytatów. Ponadto zapewniono systemy i sposoby przesyłania informacji w celu wyświetlenia wybranych cytatów na urządzeniu wyświetlającym.

Baza danych cytatów może składać się z treści, takich jak „cytaty, autorzy cytatów, podmioty powiązane z cytatami i/lub korpus elementów treści itp.”. Mogą to być „dokumenty, prezentacje, wiadomości, artykuły, posty na blogach, książki, recenzje książek, czasopisma, artykuły z czasopism, nagrania audio lub wideo, wiadomości tekstowe, wiadomości e-mail, treści w mediach społecznościowych lub innego rodzaju elementu informacyjnego znanego w sztuce.”

Poza tym patent mówi nam, że wyniki mogą również obejmować „dzienniki wyszukiwania zawierające ciągi wyszukiwania używane przez użytkownika do wyszukiwania elementów treści i/lub cytatów”. Myślę, że byłoby to pomocne, gdyby ktoś próbował znaleźć coś, co znalazł wcześniej.

Identyfikowanie cytatów do wyszukiwania

Jednym z pierwszych procesów opisanych w patencie jest ten, który koncentruje się na identyfikacji i przechowywaniu cytatów oraz informacji związanych z cytatami. Dowiadujemy się o cytatach i sposobach ich znajdowania przez program indeksujący w wyszukiwarkach.

Po pierwsze, dowiadujemy się o cytatach:

Cytat może zawierać pojedyncze słowo, frazę, stwierdzenie i/lub formę odmienną, ustną, pisemną lub wyrażoną w jakiejś formie przez autora lub podmiot. Na przykład pojedyncze słowo, takie jak „eureka”, „wierzyć”, „odważyć się” lub „działanie”, może reprezentować cytat. Ponadto, na przykład, zdanie lub fraza, taka jak „ostrożny rzadko błądzi” lub „nadzieja jest snem na jawie”, może stanowić cytat. Cytaty mogą również zawierać akapit lub zbiór zdań lub fraz. Autor może obejmować osobę, grupę lub organizację. Na przykład autorem cytatu może być osoba taka jak prezydent Obama. Dalej jako przykład autorem cytatu może być Organizacja Narodów Zjednoczonych, która jest organizacją.

Cytat może być powiązany z określonym adresem URL lub innym identyfikatorem, który może określać „stronę internetową, dokument, obraz lub inne zasoby”.

Zidentyfikowanie cytatu może wiązać się z przeanalizowaniem treści tekstowej w elemencie treści, na przykład wyszukaniem słowa „powiedział”, które mogłoby poprzedzać cytat, np. „Prezydent Obama powiedział”, po którym może następować fraza lub zdanie w cytacie znaki.

Patent mówi nam tam również, że „obecność cudzysłowów może być wykorzystana do zidentyfikowania jednego lub więcej cytatów w elemencie treści”.

Oprócz cudzysłowów do identyfikacji cudzysłowów mogą być używane inne symbole, na przykład „cytaty mogą pojawić się w elemencie treści jako autor cytatu, po którym następuje znak interpunkcyjny, taki jak dwukropek, po którym następuje słowo, fraza lub zdanie, które można zidentyfikować jako cytat”.

Autorowi książki może kojarzyć się cytat zaczerpnięty z książki. Wypowiedź dźwiękowa może być powiązana z mówcą zidentyfikowanym jako wypowiadający to oświadczenie.

Podmioty podmiotu i cytaty

Oprócz określenia, od kogo pochodzi cytat, może pomóc określić, o czym jest cytat, określając podmiot powiązany z cytatem. Można to zrobić, wyodrębniając kilka słów z cytatu i sprawdzając, czy o nich chodzi, na przykład w cytacie: „Edukacja jest najpotężniejszą bronią, której możesz użyć, aby zmienić świat”, słowa takie jak „edukacja ” i „zmiana” mogą wskazywać podmioty, które mogą być powiązane z cytatem.

Informacje związane z cytatami

Indeksator wyszukiwarki może próbować zidentyfikować datę powiązaną z cytatem. Może wtedy, gdy po raz pierwszy zostało wypowiedziane, napisane lub wyrażone. Mogło to być wtedy, gdy zostało po raz pierwszy opublikowane lub przedstawione jako wiadomości.

Weryfikowanie cytatów

Widziałem już w sieci cytaty przypisywane niewłaściwej osobie, więc dobrze było zobaczyć to w patencie.

Patent mówi nam, że ten proces identyfikacji kwotowań może obejmować etap weryfikacji kwotowań oraz że kwotowania mogą być weryfikowane na więcej niż jeden sposób:

  1. Cytat można sprawdzić, sprawdzając, czy dokładny cytat pojawia się w więcej niż jednym elemencie treści w zbiorze elementów treści.
  2. Jest również uważany za ważny, jeśli „pojawia się w więcej niż jednym elemencie treści od różnych autorów, wydawców, sieci i/lub mediów”.
  3. Innym sposobem sprawdzenia cytatu jest sprawdzenie, czy „dokładny cytat pojawia się w elemencie treści zawierającym transkrypcję zawierającą cytat”.
  4. Można to również zweryfikować „poprzez potwierdzenie dokładności cytatu z autorem cytatu”.

Powiązane informacje związane z wyceną

Kontekst wydaje się mieć duże znaczenie, jeśli chodzi o większość informacji.

Patent mówi nam, że „informacje powiązane z cytatem mogą obejmować autora powiązanego z cytatem, jeden lub więcej podmiotów powiązanych z cytatem i/lub datę powiązaną z cytatem”.

Spersonalizowane informacje o wycenie

To też było interesujące. Może się zdarzyć, że czyjeś wyszukiwanie informacji o cytatach może wyświetlić spersonalizowane wyniki, takie jak cytaty wykonane przez użytkownika lub kontakty użytkownika w mediach społecznościowych. Wygląda na to, że to kolejny sposób na pokazanie informacji lub tweetów z Google+.

Jak działa zapytanie do wyszukiwania cytatów

Patent zawiera trzy różne przykłady wyszukiwania cytatów.

1. Zapytanie może identyfikować zarówno autora, jak i podmiot powiązany z cytatem, na przykład: „Co X powiedział o Y?” z X jako autorem cytatu i Y jako podmiotem powiązanym z cytatem. Byłoby to więc podobne do zapytania: „Co prezydent Obama powiedział o Nelsonie Mandeli” z autorem cytatów, prezydentem Obamą, mówiącym o podmiocie, Nelsonie Mandeli.

2. Zapytanie może identyfikować tylko podmiot w żądanej wycenie, taki jak „Tesla Motors”, z Tesla Motors jako podmiotem w żądanej wycenie.

3. Zapytanie może zawierać słowo „cytaty”. Tak więc „Breaking Bad cytaty” byłyby prośbą o cytaty związane z „Breaking Bad”.

Wypróbowałem je i nie uzyskałem wyników, które zawierałyby kilka cytatów; wydaje się wskazywać, że tego rodzaju wyszukiwanie cytatów nie zostało jeszcze włączone w Google. Myślę, że warto uważać, żeby się pojawił.

Jednostki podmiotu powiązane z Zapytaniami

Patent mówi nam o kroku, który identyfikuje podmioty powiązane z zapytaniem. Jednostki tematu mogą obejmować na przykład autora, osobę, miejsce, temat, przedmiot lub rzecz i/lub wydarzenie itp. powiązane z zapytaniem. Na przykład zapytanie „Cytaty Mandeli” może zawierać podmiot „Mandela”, który jest osobą.

Patent bardziej szczegółowo wyjaśnia, w jaki sposób można znaleźć podmioty objęte:

Podmioty podmiotu mogą być identyfikowane z zapytania na wiele sposobów. Tytułem przykładu, sama struktura zapytania może być wykorzystana do określenia tematów powiązanych z zapytaniem. Na przykład zapytanie typu „co X powiedział o Y” może zostać przeanalizowane w celu zidentyfikowania tematów X i Y oddzielonych słowami „mówi o”. W innych przykładach wykonania słowa lub frazy mogą być wyodrębnione z zapytania. Wyodrębnione słowa lub frazy mogą być porównane z podmiotami w bazie danych podmiotów w celu zidentyfikowania podmiotu powiązanego z zapytaniem. Na przykład zapytanie takie jak „Breaking Bad Quotes” może zawierać słowa „breaking”, „bad” oraz frazę „breaking bad”. Te wyodrębnione słowa i/lub frazy mogą być porównywane do słów lub fraz przechowywanych w bazie danych podmiotu.

Więcej niż jeden przedmiot w bazie danych podmiotów podmiotu

Nie jest zaskoczeniem, że niektóre słowa lub odniesienia do bytów mogą mieć więcej niż jedno znaczenie. Patent odnosi się do tej możliwości i mówi nam, że „Gdy więcej niż jedna jednostka przedmiotowa w bazie danych jednostek przedmiotowych pasuje do wyodrębnionych słów i/lub fraz, oceny istotności związane z jednostkami przedmiotowymi mogą być użyte do wybrania jednej lub większej liczby jednostek przedmiotowych. ” Wynik istotności odpowiadający każdemu podmiotowi podmiotu może być pobrany z bazy danych podmiotu.

Patent mówi nam, w jaki sposób można obliczyć wyniki trafności, aby pomóc w określeniu właściwego podmiotu. Wyniki trafności użyte w zapytaniu dla podmiotu mogą być określone na kilka sposobów, jak wskazano w patentach.

1. Oceny trafności dla podmiotu przedmiotowego mogą być oparte na popularności podmiotu w korpusie elementów treści.
2. Wyniki trafności dla podmiotu będącego przedmiotem umowy mogą być oparte na popularności podmiotu w wyszukiwanych terminach używanych przez użytkowników podczas wyszukiwania informacji w Internecie lub sieci.
3. Ocena trafności może być oparta na popularności podmiotu w danym okresie.
4. Popularność podmiotu można określić na podstawie częstotliwości występowania podmiotu w (1) korpusie treści, (2) w wyszukiwanych hasłach używanych przez użytkowników, (3) na stronach internetowych itp.

Patent pokazuje, jak można zastosować te różne sposoby oceniania trafności przedmiotu:

Wyniki trafności dla podmiotu będącego przedmiotem „złego zepsucia” mogą opierać się na elementach treści opublikowanych od czasu wydania pierwszego odcinka programu telewizyjnego „Breaking Bad” do jednego roku po wydaniu ostatniego odcinka. Jedna lub więcej jednostek przedmiotowych odpowiadających najwyższym ocenom istotności może być zidentyfikowanych jako jednostki przedmiotowe odpowiadające zapytaniu. Na przykład, wynik trafności podmiotu będącego przedmiotem „niezdolny” może być wyższy niż odpowiadające mu wyniki trafności słów „niedostateczne” i „złe”, ponieważ program telewizyjny „Niedostateczny wynik” może być bardzo popularny, a wyrażenie „ „breaking bad” może wystąpić bardzo często w korpusie elementów treści lub w wyszukiwanych hasłach użytkowników.

Filtrowanie ofert podczas zapytań

Mogą istnieć sposoby na filtrowanie wyświetlanych wyników wyszukiwania. Patent wskazuje nam kilka z nich:

1. Na podstawie tematów, takich jak „program telewizyjny”.
2. Na podstawie personalizacji, na przykład tego, co kontakty z mediów społecznościowych mogły powiedzieć na dany temat.

Identyfikowanie elementów Grafu wiedzy powiązanych z podmiotem

Nie zdziwiło mnie odniesienie do wykresów wiedzy w tym patencie.

Gdy Google patrzy na zapytanie, aby sprawdzić, czy wspomina lub zawiera jednostkę, może to dać mu o wiele więcej informacji do pracy. Jak mówi nam patent:

Element wykresu wiedzy dla podmiotu przedmiotowego może zawierać zbiór informacji i elementów treści związanych z podmiotem przedmiotowym. Zbiór informacji może zawierać nazwy, miejsca, rzeczy, wydarzenia i/lub elementy treści. W niektórych przykładach wykonania element wykresu wiedzy może zawierać łącza (na przykład adresy URL) do zbioru informacji. W innych przykładach wykonania element wykresu wiedzy może zawierać odniesienia lub łącza do innych elementów wykresu wiedzy i/lub baz danych zawierających zbiór informacji.

Patent zawiera konkretne przykłady wykorzystujące podmiot, który był popularnym programem telewizyjnym:

Na przykład element wykresu wiedzy dla podmiotu przedmiotowego „Breaking Bad” może zawierać zbiór informacji, w tym nazwiska aktorów, którzy grali w programie telewizyjnym „Breaking Bad”, producentów, reżyserów, operatorów itp. związanych z program telewizyjny, informacje o dacie pierwszej premiery, liczbie odcinków, liczbie sezonów i/lub czasie trwania programu telewizyjnego, nagrodach otrzymanych przez program telewizyjny lub aktorów programu telewizyjnego, streszczenia odcinków, wpisy na blogu, krytycy recenzje, recenzje użytkowników, artykuły z wiadomościami, artykuły z czasopism, przemówienia, książki lub inne elementy treści związane z programem telewizyjnym „Breaking Bad” itp. Tytułem innego przykładu element wykresu wiedzy może zawierać dodatkowe informacje, takie jak częstotliwość których użytkownicy 112, 114 mogli wyszukiwać informacje lub zamieszczać komentarze dotyczące serialu telewizyjnego „Breaking Bad” lub popularności nazwy programu „Breaking Bad” w zbiorze treści.

Panel wiedzy Breaking Bad

Rozszerzając informacje, które mogą być znane na temat konkretnego podmiotu w oparciu o wykres wiedzy, można powiedzieć o wiele więcej o tej istocie. Patent mówi nam:

Na przykład, nazwiska każdego z aktorów, producentów, reżyserów itp. serialu telewizyjnego „Breaking Bad”, uzyskane z powiązanego elementu wykresu wiedzy, mogą stanowić dodatkowe byty podmiotowe. Tytułem innego przykładu, nazwy wydarzeń, takie jak rozdanie nagród, w których wspomniano o programie telewizyjnym i/lub nazwiska celebrytów, którzy wzięli udział w rozdaniu nagród itp., mogą również stanowić dodatkowe podmioty podmiotowe. W niektórych przykładach wykonania identyfikacja dodatkowych podmiotów podmiotowych może obejmować proces rekurencyjny. Na przykład, po uzyskaniu nazw wydarzeń, w których wspomniano o programie telewizyjnym, elementy wykresu wiedzy powiązane z wydarzeniami mogą być przeszukiwane w celu zidentyfikowania prelegentów, prezenterów lub innych osób związanych z tymi wydarzeniami jako podmiotami. Jedna lub większa liczba dodatkowych jednostek będących przedmiotem zlecenia może być wybrana spośród zidentyfikowanych dodatkowych jednostek będących przedmiotem zlecenia z wykorzystaniem ocen istotności opartych na procesach podobnych do tych omówionych, dotyczących na przykład etapu 404 procesu 400.

Ten szerszy zakres podmiotów tematycznych z wykorzystaniem informacji związanych z wykresem wiedzy oznacza, że ​​w wyszukiwaniu cytatów można uwzględnić znacznie szerszy zakres cytatów (co brzmi, jakby to mogło być ekscytujące).

Jednym z aspektów tego patentu, który mnie zainteresował, była sekcja skupiająca się na wynikach, które mogą określać, w jaki sposób wyniki cytatów mogą być pozycjonowane i wyświetlane przez Google.

Wyniki związane z cytatami

Wyniki strony źródłowej

Nie powinno to dziwić. Cytaty mogą być oceniane na podstawie wyniku strony źródłowej dla elementu treści, mogą być oparte na trafności elementu treści, reputacji lub wiarygodności autora, wydawcy lub dostawcy elementu treści powiązanego z elementem treści i/lub popularności element treści itp. Powiedziano nam, że:

Wynik strony źródłowej oparty na reputacji lub wiarygodności można określić, uzyskując dostęp do wyniku strony źródłowej z bazy danych, która przechowuje wyniki strony źródłowej w oparciu o reputację lub wiarygodność we współpracy z autorami, wydawcami lub dostawcami elementów treści. Baza danych wyników stron źródłowych może być zawarta w bazie cytatów, w bazie danych treści i/lub w innej bazie danych powiązanej z systemem.

Popularność elementów treści

Oprócz reputacji i wiarygodności nie możemy przeoczyć takich rzeczy, jak popularność elementu treści lub autora elementu treści. Można to określić na podstawie „popularności elementu treści, autora lub kombinacji elementu treści i autora w korpusie elementów treści”. Nic dziwnego, ponieważ wyszukiwarka może śledzić takie rzeczy, popularność elementu treści można określić na podstawie (1) liczby uzyskiwanych przez użytkowników dostępu do elementu treści lub (2) na podstawie liczby wyszukiwań element treści w sieci.

Wpływ dużej popularności?

Wyższy wynik strony źródłowej może zostać przyznany, gdy element treści i/lub autor elementu treści ma stosunkowo dużą popularność. W niektórych przykładach wykonania popularność elementu treści można określić, na przykład określając popularność podmiotu, jak omówiono powyżej w odniesieniu do etapu 404 procesu 400. Tytułem przykładu, artykuł zawierający cytat prezydenta Obamy na temat Serial telewizyjny „Breaking Bad” może mieć wysoki wynik strony źródłowej, jeśli odwiedziła ją duża liczba użytkowników, na przykład kilka tysięcy użytkowników w porównaniu z artykułem, do którego mogło wejść tylko 50 do 100 użytkowników.

Wyniki trafności cytatów

Nie jestem pewien, czy moglibyśmy powiedzieć, że ten patent pochodzi od Google, gdyby ten czynnik nie został wymieniony w patencie:

Ocena trafności cytatu może być oparta na tym, czy cytat odpowiada na zapytanie. W niektórych przykładach wykonania responsywność można określić na podstawie popularności cytatu, popularności elementu treści zawierającego cytat, popularności autora cytatu, popularności podmiotów tematycznych powiązanych z zapytaniem itp. Popularność cytatu, element treści lub autor cytatu lub elementu treści można określić w sposób opisany powyżej, na podstawie, na przykład, popularności cytatu, elementu treści i/lub autora w zbiorze elementów treści lub wyszukiwań użytkowników w sieci. Popularność cytatu, elementu treści lub autora cytatu lub elementu treści można również określić, na przykład na podstawie częstotliwości, z jaką cytat, element treści i/lub autor pojawiają się z jednym lub kilkoma siebie nawzajem w korpusie elementów treści w wynikach wyszukiwania użytkowników w sieci. W niektórych przykładach wykonania cytat może otrzymać wyższą ocenę trafności, gdy popularność cytatu, elementów treści zawierających cytat i/lub autorów cytatu lub elementów treści zawierających cytat jest wysoka. W innych przykładach wykonania cytat może otrzymać wysoki wynik trafności, gdy popularność cytatu wraz z podmiotami powiązanymi z zapytaniem w zbiorze elementów treści lub wyszukiwań użytkowników w sieci jest wysoka. W jeszcze innych przykładach wykonania ocena trafności może być oparta na względnych ocenach tożsamości podmiotu zidentyfikowanych na przykład w etapie 404 procesu 400 i/lub etapie 506 procesu 500.

Ta sekcja zawiera przykłady, które pozwolą nam lepiej umieścić ten aspekt punktacji w kontekście:

Na przykład cytat opisujący, jak zepsucie czegoś może zostać uznane za złe, może otrzymać niską ocenę trafności w porównaniu z cytatem związanym z programem telewizyjnym „Breaking Bad” ze względu na dużą popularność programu telewizyjnego „Breaking Bad”. Tytułem innego przykładu, cytat dotyczący Nelsona Mandeli pojawiający się z podmiotem prezydenta Obamy może otrzymać wyższy wynik częstotliwości, ponieważ cytat może pojawiać się częściej w zbiorze elementów treści lub wyszukiwań użytkowników w porównaniu z cytatem dotyczącym Nelsona Mandeli pojawiającego się z podmiot podmiotowy, taki jak „światowy lider”. Ponadto, w innych przykładach wykonania, ocena trafności może być określona na podstawie tego, czy cytat może być istotny dla konkretnego użytkownika. Na przykład wynik trafności można określić, określając popularność cytatu w profilu konkretnego użytkownika lub w historii wyszukiwania.

Najnowsze wyniki dla cytatów

Coś, co często widzimy w wynikach wiadomości, to ostatni wynik. I to jest coś, o czym wspomina się o wyszukiwaniu cytatów. To chyba nie powinno być niespodzianką. Patent mówi nam, że:

Ocena aktualności może opierać się na czasie, jaki upłynął od utworzenia cytatu do czasu, gdy cytat został zidentyfikowany jako powiązany z zapytaniem. W niektórych przykładach wykonania czas, który upłynął, może być określany na podstawie bieżącej daty, na przykład daty zapytania i danych związanych z cytatem, na podstawie informacji związanych z cytatem uzyskanych, na przykład, z bazy danych cytatów. Na przykład cytat z roku 2014 może otrzymać wyższy wynik aktualności w porównaniu z cytatem z roku 2012 w odpowiedzi na zapytanie z roku 2014.

Wyniki częstotliwości dla cytatów

Ponieważ jest to coś, co może śledzić wyszukiwarka, warto zobaczyć to tutaj. Podejrzewam, że może to być głośny sygnał, ale mogą istnieć sposoby ograniczenia tego, jak głośny może być, na przykład ograniczenie użytkowników uzyskujących dostęp do tych informacji do osób zidentyfikowanych przez pliki cookie lub identyfikatory urządzeń. Patent mówi nam, że:

Określanie wyniku częstotliwości może obejmować na przykład określenie, ile razy użytkownicy mogli uzyskać dostęp do cytatu, ile razy cytat pojawił się w korpusie elementów treści lub ile razy cytat mógł zostać zidentyfikowany w odpowiedź na zapytanie. Na przykład cytat może otrzymać wyższy wynik częstotliwości, jeśli oferta została udostępniona przez większą liczbę użytkowników w porównaniu z cytatem, do którego mogło uzyskać dostęp mniej użytkowników.

Ogólny wynik wyceny za wycenę

Wiele różnych wyników wymienionych w patencie można połączyć w ogólną ocenę cytatu. Może to obejmować wynik strony źródłowej, wynik trafności, wynik aktualności, wynik częstotliwości i/lub inny wynik powiązany z cytatem. Patent mówi nam, że te wyniki można łączyć na kilka różnych sposobów.

Grupowanie cytatów w zestawy

Coś, co możesz zobaczyć w miejscach, takich jak odwrotne wyszukiwanie grafiki, to grupowanie wyników w różne kategorie. Ten patent mówi nam, że „cytaty mogą być grupowane w zestawy na podstawie relacji między cytatami, relacji między zidentyfikowanymi podmiotami i/lub relacji między autorami cytatów”.

Ponownie patent stanowi dla nas przykład:

…cytaty osobistości politycznych, takich jak prezydent Barack Obama czy Hillary Clinton, dotyczące „Breaking Bad” można pogrupować w jeden zestaw cytatów, podczas gdy cytaty autorstwa osobistości filmowych, takich jak Clint Eastwood czy Robert De Nero, dotyczące „Breaking Bad” ” można zgrupować w inny zestaw. Każdemu zestawowi cytatów można przypisać punktację na podstawie ocen zawartych w każdym zestawie. W niektórych przykładach wykonania, set scores można określić w oparciu o popularność autorów związanych z cytatami.

Ranking cytatów według wyników cytatu

Być może będziemy musieli poczekać, aż zobaczymy wyszukiwanie ofert w akcji, aby sprawdzić, czy wydaje się, że wyniki cytatów zostały użyte do rankingu wyników cytatów. Wydaje się to interesującym sposobem przekazywania informacji wyszukiwarkom w oparciu o to, co konkretni ludzie powiedzieli na określone tematy. Chciałbym, aby firma Google dostarczyła nam to. Myślę, że byłoby to zarówno zabawne, jak i pouczające.

Dodano 6 stycznia 2020 r. Ten patent został zaktualizowany poprzez patent kontynuacyjny, a proces związany z patentem został zaktualizowany. Pisałem o aktualizacji w poście, Google zaktualizowało wyszukiwanie cytatów, aby skupić się na filmach