Wskaźniki klikalności użytkowników i rankingi wyników wyszukiwania w Google
Opublikowany: 2019-03-19Czy Google bierze pod uwagę współczynniki klikalności użytkowników i zachowania użytkowników, aby wpływać na rankingi wyszukiwania?
Google Rzecznicy powiedzieli nam, że Google nie uwzględnia współczynników klikalności użytkowników podczas umieszczania stron w rankingach wyszukiwania – są one zbyt głośne i z innych powodów. Nowy patent od Google opisuje, w jaki sposób współczynniki klikalności i inne informacje o zachowaniu użytkowników mogą wpływać na rankingi w wynikach wyszukiwania. Ten nowy patent nie jest pierwszym, który chroni proces Google przed innymi wyszukiwarkami, które mogą rozważyć ten proces. Po kilku pierwszych patentach dotyczących interakcji wyszukiwarek z wynikami wyszukiwania i tego, jak te informacje mogą być wykorzystywane do wpływania na rankingi wyszukiwania, ciekawi mnie, czy takie informacje będą nadal pojawiać się w Patentach Google, i zachęca do bliższego przyjrzenia się takim rzeczom, jak kliknięcie użytkownika- Poprzez stawki. Zwłaszcza, gdy zaangażowane podejścia stały się bardziej szczegółowe.
Ten patent był aktualizowany trzykrotnie przy użyciu patentów kontynuacyjnych. Patenty kontynuacyjne to sposoby aktualizowania roszczeń patentowych w celu odzwierciedlenia zmian w procesach związanych z patentem. Patent mówi nam, że rankingi wyszukiwania mogą opierać się na długości czasu, jaki osoba wyszukująca może spędzić na przeglądaniu strony z wyników wyszukiwania, a dokumenty mogą później uzyskać wyższą pozycję w rankingu, jeśli będą przeglądane przez dłuższy czas:
Jeden aspekt zagadnienia opisanego w tej specyfikacji może być zawarty w metodzie implementowanej komputerowo, która obejmuje określenie miary istotności dla wyniku dokumentu w kontekście zapytania wyszukiwania, dla którego zwracany jest wynik dokumentu, przy czym określenie to opiera się na pierwsza liczba dotyczy drugiej liczby, pierwsza liczba odpowiada dłuższym widokom wyniku dokumentu, a druga liczba odpowiada co najmniej krótszym widokom wyniku dokumentu; oraz wyprowadzanie miary istotności do mechanizmu rankingowego w celu rankingu wyników wyszukiwania, w tym wyników dokumentu, dla nowego wyszukiwania odpowiadającego zapytaniu wyszukiwania. Pierwsza liczba może zawierać liczbę dłuższych widoków wyniku dokumentu, druga liczba może obejmować całkowitą liczbę widoków wyniku dokumentu, a określenie może obejmować podzielenie liczby dłuższych widoków przez całkowitą liczbę widoków.
Metoda może ponadto obejmować śledzenie poszczególnych wyborów wyników dokumentu w kontekście zapytania wyszukiwania, dla którego zwracany jest wynik dokumentu; ważenie widoków dokumentu wynikających z wyborów opartych na przeglądaniu informacji o długości w celu uzyskania ważonych widoków wyniku dokumentu; i połączenie ważonych widoków wyniku dokumentu w celu określenia pierwszej liczby. Druga liczba może obejmować całkowitą liczbę wyświetleń wyniku dokumentu, określenie może obejmować podzielenie pierwszej liczby przez drugą liczbę, a miara istotności może być niezależna od trafności innych wyników dokumentów zwróconych w odpowiedzi na zapytanie wyszukiwania.
To trochę bardziej skomplikowane niż tylko patrzenie na czas przeglądania dokumentów. Patent sugeruje również, że kategorie zapytań wyszukiwania, dla których znajdują się te dokumenty, mogą również odgrywać rolę w wpływie na czas oglądania i współczynniki klikalności użytkowników:
Ważenie może obejmować ważenie widoków dokumentu na podstawie informacji o oglądanej długości w połączeniu z wyróżnikiem oglądanej długości. Wyróżnik długości oglądania może obejmować czynnik zależny od określonej kategorii zapytania wyszukiwania, a ważenie może obejmować ważenie widoków dokumentu na podstawie określonej kategorii zapytania wyszukiwania. Wyróżnik długości oglądania może obejmować współczynnik zależny od określonego typu użytkownika generującego indywidualne wybory, a ważenie może obejmować ważenie widoków dokumentu na podstawie określonego typu użytkownika.
Powiedziano nam, że przestrzeganie procesu opisanego w tym patencie na współczynniki klikalności może przynieść:
- Podsystem rankingowy może zawierać mechanizm modyfikujący rangę, który wykorzystuje niejawne informacje zwrotne od użytkowników, aby spowodować zmianę rankingu wyników wyszukiwania w celu poprawy ostatecznego rankingu prezentowanego użytkownikowi systemu wyszukiwania informacji.
- Wybrane przez użytkownika wyniki wyszukiwania (dane dotyczące kliknięć) można śledzić i przekształcać w ułamek kliknięć, który można wykorzystać do zmiany rankingu przyszłych wyników wyszukiwania.
- Dane mogą być zbierane na podstawie zapytania, a dla danego zapytania można określić preferencje użytkownika dotyczące wyników dokumentów.
- Co więcej, miara trafności (np. ułamek kliknięcia LC|C) może być określona na podstawie niejawnych opinii użytkowników, gdzie miara trafności może być niezależna od trafności dla innych wyników dokumentów zwróconych w odpowiedzi na zapytanie, a miara trafność może zmniejszyć skutki stronniczości prezentacji (w wynikach wyszukiwania wyświetlanych użytkownikowi), które w przeciwnym razie mogłyby przenikać do niejawnych informacji zwrotnych.
Najnowszą wersję tego patentu na współczynniki klikalności można znaleźć pod adresem:
Modyfikowanie rankingu wyników wyszukiwania na podstawie niejawnych opinii użytkowników
Wynalazcy: Hyung-Jin Kim, Simon Tong, Noam M. Shazeer i Michelangelo Diligenti
Pełnomocnik: Google LLC
Patent USA: 10 229 166
Przyznano: 12 marca 2019 r.
Złożono: 25 października 2017 r.
Abstrakcyjny
Niniejsze ujawnienie obejmuje systemy i techniki związane z rankingiem wyników wyszukiwania zapytania wyszukiwania. Ogólnie rzecz biorąc, przedmiot opisany w tej specyfikacji może być zawarty w metodzie zaimplementowanej komputerowo, która obejmuje określenie miary istotności dla wyniku dokumentu w kontekście zapytania wyszukiwania, dla którego zwracany jest wynik dokumentu, przy czym określenie to opiera się na pierwsza liczba odpowiada drugiej liczbie, pierwsza liczba odpowiada dłuższym widokom wyniku dokumentu, a druga liczba odpowiada co najmniej krótszym widokom wyniku dokumentu; oraz wyprowadzanie miary istotności do mechanizmu rankingowego w celu rankingu wyników wyszukiwania, w tym wyników dokumentu, dla nowego wyszukiwania odpowiadającego zapytaniu wyszukiwania. Przedmiot opisany w tej specyfikacji może być również zawarty w różnych odpowiednich produktach, urządzeniach i systemach programów komputerowych.
Roszczenia z tego patentu dają nam wyobrażenie o tym, jak Google może śledzić interakcje użytkowników z wynikami wyszukiwania i danymi pochodzącymi z tych interakcji. Roszczenia patentowe są tym, na co przyglądają się prokuratorzy z USPTO, aby zdecydować, czy przyznać patent, czy nie. Twierdzenia te mówią nam o „dzienniku wyboru wyników” oraz o tym, jakie informacje mogą być w nim przechowywane i jak można je zmierzyć. Dołączyłem pierwsze 5 zastrzeżeń patentu, ponieważ wszystkie są ze sobą powiązane i zapewniają pewien wgląd w to, na co patrzy wyszukiwarka, gdy przeprowadzamy w niej wyszukiwania:
Twierdzi się, że:
1. System składający się z: jednego lub większej liczby komputerów i jednego lub większej liczby urządzeń pamięci masowej, na których przechowywane są instrukcje, które po wykonaniu przez co najmniej jeden komputer powodują wykonanie przez co najmniej jednego komputera operacji obejmujących: utrzymywanie, w dziennik wyboru wyników, dane dotyczące interakcji użytkowników z wynikami wyszukiwania z wyszukiwarki internetowej dla wielu użytkowników, przy czym każdy wpis dziennika w dzienniku wyboru wyników dla rzeczywistej interakcji jest specyficzny dla jednej interakcji i zawiera dane identyfikujące odpowiedniego użytkownika, zapytanie przesłane przez użytkownika, jeden lub więcej wyników wyszukiwania przedstawionych przez wyszukiwarkę w odpowiedzi na zapytanie, dokument wybrany przez użytkownika spośród wyników wyszukiwania, pozycję porządkową w kolejności prezentacji wyników wyszukiwania wybranego przez użytkownika wyniku wyszukiwania , czas spędzony przez użytkownika nad dokumentem, język używany przez użytkownika oraz kraj, w którym użytkownik prawdopodobnie się znajduje, przy czym wpisy dziennika zawierają wpisy identyfikującewielu użytkowników, wiele dokumentów, wiele języków i wiele krajów; określanie na podstawie wpisów w dzienniku wyboru wyników (i) ułamki ważonych kliknięć dla każdej z wielu par zapytanie-dokument, (ii) ułamki ważonych kliknięć dla każdej z wielu par zapytanie-dokument-język oraz (iii) ważone- ułamki kliknięć dla każdej z wielu par zapytanie-dokument-język-kraj, przy czym każdy ułamek ważonego kliknięcia jest oparty na sumie ważonej liczby dokumentów wybranych przez użytkownika, a każda waga jest oparta na tym, ile czasu użytkownik spędził na dokument; oraz modyfikowanie wyniku wyszukiwania informacji w wyszukiwarce internetowej dla określonego dokumentu przez zastosowanie jednego z ułamków ważonego kliknięcia lub przekształcenie jednego z ułamków ważonego kliknięcia na wynik wyszukiwania informacji dla określonego dokumentu.
2. System według zastrzeżenia 1, w którym czas spędzony przez użytkownika na dokumencie jest mierzony jako czas, jaki upłynął od pierwszego kliknięcia do wyniku dokumentu, do momentu powrotu użytkownika do wyników wyszukiwania prezentowanych przez wyszukiwarkę i wybrania innego wynik dokumentu.
3. System według zastrzeżenia 1, w którym dane dziennika obejmują również dla każdej z wielu prezentacji wyników wyszukiwania przez wyszukiwarkę: czy wynik dokumentu został przedstawiony odpowiedniemu użytkownikowi, ale nie został wybrany, odpowiednie pozycje jednego lub więcej wyborów w interfejs użytkownika prezentacji wyników wyszukiwania, wyniki wyszukiwania informacji wybranych dokumentów, wyniki wyszukiwania informacji wszystkich dokumentów wyświetlanych przed wybranym dokumentem oraz tytuły i fragmenty wyświetlane użytkownikowi przed wybraniem przez niego dokumentu.
4. System według zastrzeżenia 1, w którym operacje obejmują ponadto: przypisywanie niższych wag do frakcji kliknięć w oparciu o użytkowników, którzy prawie zawsze wybierają najwyżej sklasyfikowany wynik, niższe wagi niż frakcje kliknięć w oparciu o użytkowników, którzy częściej wybierają wyniki niżej w rankingu jako pierwsze we frakcjach kliknięcia ważonego.
5. System według zastrzeżenia 1, w którym operacje obejmują ponadto: klasyfikację poszczególnych wyborów wyników dokumentu na dwie lub więcej kategorii czasu oglądania i przypisywanie wag do poszczególnych wyborów na podstawie klasyfikacji, kategorie czasu oglądania zawierające kategorię dla krótkiego kliknięcia i kategorię na długie kliknięcie.
Patent ten wprowadza również pewne zmiany w tym, co określa się w nim jako „tradycyjne techniki rankingowania”. Mówi o rankingu opartym na kombinacji wyniku pobierania informacji i wyniku autorytetu za pomocą PageRank, ale opiera się na PageRank, patrząc na linki do stron z innych odpowiednich dokumentów:
Wyszukiwarka może zawierać mechanizm rankingowy, który ocenia dokumenty związane z zapytaniem użytkownika. Ranking dokumentów można przeprowadzić przy użyciu tradycyjnych technik określania wyniku wyszukiwania informacji (IR) dla zindeksowanych dokumentów na podstawie danego zapytania. Istotność konkretnego dokumentu w odniesieniu do konkretnego wyszukiwanego terminu lub innych dostarczonych informacji można określić za pomocą dowolnej odpowiedniej techniki. Na przykład ogólny poziom linków zwrotnych do dokumentu, który zawiera dopasowania do wyszukiwanego terminu, może zostać użyty do ustalenia trafności dokumentu. W szczególności, jeśli dokument jest połączony (np. jest celem hiperłącza) przez wiele innych odpowiednich dokumentów (np. dokumenty, które również zawierają dopasowania do wyszukiwanych terminów), można wywnioskować, że dokument docelowy jest szczególnie istotny. Taki wniosek można wyciągnąć, ponieważ autorzy dokumentów wskazujących prawdopodobnie wskazują w większości inne dokumenty, które są istotne dla ich odbiorców.
Jeśli dokumenty wskazujące są z kolei celem linków z innych odpowiednich dokumentów, można je uznać za bardziej istotne, a pierwszy dokument można uznać za szczególnie istotny, ponieważ jest celem odpowiednich (lub nawet bardzo istotnych) dokumentów. Taka technika może być wyznacznikiem trafności dokumentu lub jednym z wielu wyznaczników. Przykładem tej techniki jest GOOGLE.RTM. System PageRank, który traktuje link z jednej strony do drugiej jako wskaźnik jakości dla tej drugiej strony, dzięki czemu zwycięża strona z największą liczbą takich wskaźników jakości. Można również zastosować odpowiednie techniki w celu zidentyfikowania i wyeliminowania prób oddawania fałszywych głosów w celu sztucznego podniesienia trafności strony.
Patent wprowadza również mechanizm modyfikujący rangę, który analizuje również inne sposoby mierzenia trafności.
Aby jeszcze bardziej ulepszyć takie tradycyjne techniki rankingowania dokumentów, mechanizm rankingu może odbierać dodatkowy sygnał z silnika modyfikującego rangę, aby pomóc w określeniu odpowiedniego rankingu dokumentów. Mechanizm modyfikujący rangę zapewnia jedną lub więcej miar istotności dokumentów, które mogą być używane przez mechanizm rankingowy w celu poprawienia rankingu wyników wyszukiwania udostępnianego użytkownikowi. Mechanizm modyfikujący rangę może wykonać jedną lub więcej operacji opisanych poniżej w celu wygenerowania jednej lub więcej miar istotności.
Wyszukiwarka może przekazać ostateczną, rankingową listę wyników w sygnale wyników wyszukiwania po stronie serwera przez sieć. Po wyjściu z sieci sygnał wyników wyszukiwania po stronie klienta może zostać odebrany przez urządzenie klienckie, gdzie wyniki mogą być przechowywane w pamięci RAM i/lub wykorzystywane przez procesor do wyświetlania wyników na urządzeniu wyjściowym dla użytkownika.
Funkcje, na podstawie których system oceniania może oceniać wyniki
- Funkcje oparte na treści, które łączą zapytanie z wynikami dokumentu
- cechy niezależne od zapytania, które generalnie wskazują na jakość wyników dokumentów
- Komponent śledzący może służyć do rejestrowania informacji dotyczących indywidualnych wyborów użytkowników wyników prezentowanych w rankingu. Na przykład komponent śledzenia może być osadzonym kodem JavaScript zawartym w rankingu strony internetowej, który identyfikuje wybory użytkownika (kliknięcia) poszczególnych wyników dokumentu, a także identyfikuje, kiedy użytkownik powraca do strony wyników, wskazując w ten sposób ilość czasu, jaką użytkownik spędził na przeglądaniu wybrany wynik dokumentu.
Śledzenie współczynników klikalności użytkowników

Śledzenie współczynników klikalności użytkowników oznacza przeglądanie wielu informacji, takich jak wpisy w dzienniku, które wskazują, dla każdego wyboru użytkownika:
- Zapytanie (Q)
- Dokument (D)
- Czas (T) na dokumencie
- Język (L) używany przez użytkownika
- Kraj (C), w którym prawdopodobnie znajduje się użytkownik (np. na podstawie serwera używanego do uzyskania dostępu do systemu IR)
- Informacje negatywne, takie jak fakt, że wynik dokumentu został zaprezentowany użytkownikowi, ale nie został kliknięty
- Pozycja(a) kliknięć(a) w interfejsie użytkownika
- Wyniki IR klikniętych wyników
- Wyniki IR wszystkich wyników pokazanych przed kliknięciem
- Tytuły i fragmenty pokazywane użytkownikowi przed kliknięciem
- Plik cookie użytkownika
- ciasteczko
- Adres IP (protokół internetowy)
- Klient użytkownika przeglądarki itp.
- Podobne informacje dla całych sesji wyszukiwarek, potencjalnie rejestrując takie informacje dla każdego kliknięcia, które ma miejsce zarówno przed, jak i po bieżącym kliknięciu
Wszystkie te informacje o użytkowniku z dzienników wyboru wyników mogą zostać wykorzystane do późniejszego ulepszenia wyników dla innych wyszukiwarek
W tym patencie opisano również wyszukiwarki umożliwiające śledzenie informacji o kliknięciach nawet po kliknięciu określonych zapytań. Wymienione powyżej pozycje można śledzić, a także wizyty w innych zestawach dokumentów i wyniki wyszukiwania, w tym czas między dokumentami. Czas spędzony nad konkretnymi dokumentami można sklasyfikować jako dłuższe widoki lub krótsze widoki, przy czym dłuższe widoki są ogólną wskazówką jakości kliknięcia wyniku wyszukiwania.
Co mogą oznaczać różne czasy oglądania na stronie?
Patent na współczynniki klikalności zapewnia szczegółowe informacje na temat tego, co mogą oznaczać różne długości oglądania:
Na przykład krótkie kliknięcie można uznać za wskazujące na słabą stronę, a tym samym o niskiej wadze (np. -0,1 na kliknięcie), średnie kliknięcie można uznać za wskazujące na potencjalnie dobrą stronę, a tym samym otrzymać nieco wyższą wagę (np. , 0,5 za kliknięcie), długie kliknięcie można uznać za dobrą stronę, a tym samym o znacznie wyższą wagę (np. 1,0 za kliknięcie), a ostatnie kliknięcie (gdzie użytkownik nie wraca do strony głównej) może być uważane za prawdopodobny wskaźnik dobrej strony, a tym samym mieć dość wysoką wagę (np. 0,9). Pamiętaj, że wagę kliknięć można również dostosować na podstawie informacji o poprzednich kliknięciach.
Zamiast patrzeć tylko na czas, można również wziąć pod uwagę dodatkowe informacje dotyczące współczynników klikalności użytkownika:
Różne ramy czasowe używane do klasyfikowania krótkich, średnich i długich kliknięć oraz wagi, które należy zastosować, można określić dla danej wyszukiwarki, porównując dane historyczne z dzienników wyboru użytkowników z wyraźnymi informacjami zwrotnymi wygenerowanymi przez człowieka na temat jakości wyników wyszukiwania dla różnych danych. zapytań, a proces ważenia można odpowiednio dostosować.
Jak można zabezpieczyć przed złymi danymi
Słyszeliśmy, jak rzecznicy Google powiedzieli nam, że współczynniki klikalności nie są wykorzystywane do rankingów, a ten patent mówi nam, jak bezpieczniej wykorzystywać informacje zwrotne od użytkowników:
Należy pamiętać, że można zastosować zabezpieczenia przed spamerami (użytkownikami, którzy generują fałszywe kliknięcia, aby ulepszyć określone wyniki wyszukiwania), aby zapewnić, że dane dotyczące wyboru użytkownika są znaczące, nawet jeśli dla danego (rzadkiego) zapytania jest dostępnych bardzo mało danych. Te zabezpieczenia mogą obejmować stosowanie modelu użytkownika, który opisuje, jak użytkownik powinien zachowywać się w czasie, a jeśli użytkownik nie zastosuje się do tego modelu, jego dane dotyczące kliknięć mogą zostać zignorowane. Zabezpieczenia mogą być zaprojektowane tak, aby osiągnąć dwa główne cele: (1) zapewnić demokrację w głosowaniach (np. jeden głos na plik cookie i/lub adres IP dla danej pary zapytanie-URL) oraz (2) całkowicie usunąć informacje pochodzące z pliki cookie lub adresy IP, które nie wyglądają naturalnie podczas przeglądania (np. nietypowy rozkład pozycji kliknięć, czas trwania kliknięć, liczba kliknięć na minutę/godzinę/dzień itp.). Podejrzane kliknięcia można usunąć, a sygnały kliknięć dla zapytań, które wydają się być spamem, nie muszą być używane (np. zapytania, w przypadku których kliknięcia obejmują dystrybucję agentów użytkownika, wiek plików cookie itp., które nie wyglądają normalnie).
Trafność określona na podstawie długości wyświetleń
Powiedziano nam, że liczba wyświetleń wyników może wskazywać, jak trafna jest dla nich strona. Wyrażenie „tendencyjność prezentacji” jest używane do opisania, jak to może działać
Stronniczość prezentacji obejmuje różne aspekty prezentacji, takie jak atrakcyjny tytuł lub urywek dostarczany z wynikiem dokumentu oraz miejsce, w którym wynik dokumentu pojawia się w prezentowanym rankingu (pozycja). Zwróć uwagę, że użytkownicy mają tendencję do klikania wyników z dobrymi fragmentami lub tymi, które znajdują się wyżej w rankingu, niezależnie od rzeczywistego związku dokumentu z zapytaniem w porównaniu z innymi wynikami. Oceniając jakość danego wyniku dokumentu dla danego zapytania, niezależnie od innych wyników dokumentu dla danego zapytania, ta miara trafności może być stosunkowo odporna na stronniczość prezentacji.
Użyte zapytanie może wskazywać na potrzebę informacyjną, która może nie wymagać dużo czasu i może być odzwierciedlona w ilości czasu, jaki ktoś może spędzić na stronie. Patent zawiera kilka przykładów dotyczących zapytań nawigacyjnych i informacyjnych:
W związku z tym w przypadku ważenia nieciągłego (i przypadku ważenia ciągłego) progi (lub formuły) określające, co stanowi dobre kliknięcie, można ocenić na podstawie zapytania i podstaw specyficznych dla użytkownika. Na przykład kategorie zapytań mogą obejmować „nawigacyjne” i „informacyjne”, gdzie zapytanie nawigacyjne to takie, dla którego prawdopodobnie pożądana jest konkretna docelowa strona lub witryna (np. zapytanie takie jak „BMW”), a zapytanie informacyjne jest taki, dla którego wiele możliwych stron jest równie użytecznych (np. zapytanie takie jak „Urodziny Jerzego Waszyngtona”). Należy pamiętać, że takie kategorie mogą być również podzielone na podkategorie, takie jak informacyjne-szybkie i informacyjne-wolne: osoba może potrzebować tylko niewielkiej ilości czasu na stronie, aby zebrać informacje, których szuka, gdy zapytanie jest „ George Washington's Birthday”, ale ten sam użytkownik może potrzebować dużo więcej czasu, aby ocenić wynik, gdy zapytanie to „Samouczek przekształcenia Hilberta”.
Ten patent mówi nam również, w jaki sposób można brać pod uwagę takie rzeczy, jak czas przebywania, jeśli chodzi o zachowanie użytkownika:
Kategorie zapytań można zidentyfikować, analizując wyniki IR lub historyczną niejawną informację zwrotną dostarczaną przez ułamki kliknięć. Na przykład znaczne pochylenie w którymkolwiek z nich (co oznacza, że tylko jeden lub kilka dokumentów jest bardziej uprzywilejowanych niż inne) może wskazywać, że zapytanie ma charakter nawigacyjny. W przeciwieństwie do tego, bardziej rozproszone wzorce kliknięć dla zapytania mogą wskazywać, że zapytanie ma charakter informacyjny. Ogólnie rzecz biorąc, można zidentyfikować pewną kategorię zapytania (np. nawigacyjnego), zbiór takich zapytań można zlokalizować i pobrać z historycznych danych dotyczących kliknięć, a także przeprowadzić analizę regresji w celu zidentyfikowania jednej lub więcej cech, które wskazują na tego typu zapytania (np. średni czas pobytu dla zapytań nawigacyjnych w porównaniu z innymi kategoriami zapytań; termin „czas pobytu” odnosi się do czasu spędzonego na przeglądaniu wyników w dokumencie, znanego również jako czas przebywania w dokumencie).
Różne typy użytkowników i wzorce oraz kliknięcia
Ten patent wykracza również poza samo patrzenie na współczynniki klikalności użytkowników, aby zobaczyć, w jaki sposób można zidentyfikować informacje o różnych użytkownikach na podstawie tego, jak szybko klikają i na co klikają. Podejrzewam, że to, co nam tutaj powiedziano, to tylko kilka przykładów i że znaleziono więcej obserwacji, które mogą wskazywać na inne pomocne sposoby interpretacji takich kliknięć:
Typy użytkowników można również określić, analizując wzorce kliknięć. Na przykład użytkownicy znający się na komputerach często klikają szybciej niż mniej doświadczeni użytkownicy, dzięki czemu użytkownikom można przypisać różne funkcje ważenia na podstawie ich zachowań związanych z klikaniem. Te różne funkcje ważenia mogą być nawet w pełni specyficzne dla użytkownika (grupa użytkowników z jednym członkiem). Na przykład można określić średni czas trwania kliknięcia i/lub częstotliwość kliknięć dla każdego użytkownika, a progi dla każdego użytkownika można odpowiednio dostosować. Użytkowników można również grupować w grupy (np. za pomocą algorytmu grupowania K oznacza) w oparciu o różne wzorce zachowań kliknięć.
Co więcej, wagę można dostosować w zależności od określonego typu użytkownika, zarówno pod względem tego, jak czas trwania kliknięcia przekłada się na kliknięcia dobre, a na kliknięcia niezbyt dobre, a także pod względem wagi, jaką należy przypisać dobrym kliknięciom z konkretna grupa użytkowników w porównaniu z inną grupą użytkowników. Niejawne opinie niektórych użytkowników mogą być bardziej wartościowe niż innych użytkowników ze względu na szczegóły procesu sprawdzania przez użytkownika. Na przykład użytkownikowi, który prawie zawsze klika wynik o najwyższej pozycji w rankingu, można przypisać niższe wagi swoim dobrym kliknięciom niż użytkownikowi, który częściej klika wyniki znajdujące się na niższych pozycjach w rankingu jako pierwszy (ponieważ drugi użytkownik jest prawdopodobnie bardziej wybredny w swojej ocenie tego, co to dobry wynik). Ponadto użytkownika można sklasyfikować na podstawie strumienia zapytań. Można zakładać, że użytkownicy, którzy zadają wiele zapytań na dany temat (lub związanych z nim) (np. zapytania dotyczące prawa), mają wysoki poziom wiedzy na dany temat T, a ich dane dotyczące kliknięć mogą być odpowiednio ważone dla innych zapytania przez nich na (lub związane z) zadanym tematem T.
Hyung-Jin Kim Patenty na współczynnik klikalności użytkowników
Jednym z wynalazców patentu, o którym dzisiaj piszę, jest Hyung-Jin Kim. Natknąłem się już wcześniej na jego nazwisko.
Warto też poświęcić czas na ciekawy wpis na blogu AJ Kohna na temat współwymyślonego przez niego patentu. Czy współczynnik klikalności jest sygnałem rankingowym?
Kolejny post, który dotyczy patentu tego samego wynalazcy, to ten, który napisałem, zatytułowany Używanie danych użytkownika zapytań do klasyfikacji zapytań. Hyung-Jin Kim nie jest jedynym inżynierem wyszukiwarki Google, który pisze o współczynnikach klikalności użytkowników.
Widziałem również kilka patentów firmy Navneet Panda (tak, tego, od którego pochodzi nazwa Google Panda Update), który napisał o możliwości uczenia się Google na podstawie współczynników klikalności i zachowań użytkowników, które mogą wpływać na rankingi wyszukiwania
Napisałem również post The Long Click and the Quality of Search Success dotyczący patentu, w którym uwzględniono czas, jaki ktoś może spędzić na stronie, jako wskaźnik jakości tej strony. Wygląda na to, że długie kliknięcie jest wskaźnikiem, na który ludzie z Google zwracają dużą uwagę, co jest ściśle związane ze współczynnikami klikalności użytkowników.

