Patent für Google Safe Search-Ergebnisse und Neuranking oder Entfernung von Ergebnissen

Veröffentlicht: 2018-10-11

Wie verwendet Google einen Filter für sichere Suchergebnisse, um unangemessene, sensible oder anstößige Suchergebnisse zu verarbeiten?

Eines der Probleme, die Suchende mit dem Internet haben können, besteht darin, von Inhalten überrascht zu werden, von denen sie nicht erwarten, dass sie sie sehen oder bereit sind, auch andere Personen zu enthüllen. Ein kürzlich bei Google erteiltes Patent informiert uns über die Bemühungen der Suchmaschinen, Suchende vor solchen Inhalten zu schützen. Wie sie es in diesem Patent formulieren:

Internetnutzer können mithilfe von Suchmaschinen nach verschiedenen Arten von Inhalten suchen. Internetinhalte können sensible oder anstößige Inhalte wie beispielsweise Pornografie, blutige Bilder und gewalttätige Inhalte enthalten. In einigen Fällen können Benutzer unfreiwillig unangemessenen sensiblen oder anstößigen Inhalten ausgesetzt sein. Dementsprechend kann es wünschenswert sein, die Exposition gegenüber unangemessenen sensiblen oder anstößigen Inhalten, die im Internet verfügbar sind, zu begrenzen.

Das Patent bezieht sich mehrmals auf sichere Suchergebnisse, und ich erinnere mich, dass Matt Cutts von Google dafür verantwortlich war, dass Google sichere Suchergebnisse anzeigt, bevor er Googles Spam-Leiter wurde. Ich fragte mich, ob es ein Patent auf sichere Suchergebnisse gab oder ob er damit etwas zu tun hatte, aber ich hatte keins gesehen. In diesem Fall werden sichere Suchergebnisse so oft erwähnt, dass ich es wahrscheinlich als das Patent für sichere Suchergebnisse von Google bezeichnen werde.

Der Zweck des Patents für sichere Google-Suchergebnisse besteht darin, Suchende, die die Google-Suchmaschine verwenden, vor Inhalten zu schützen, die sie möglicherweise nicht sehen möchten:

Diese Offenbarung beschreibt im Allgemeinen ein Verfahren und ein System zum Anwenden von Klassifikatoren auf Suchanfragen und Suchergebnisse, um eine Sucherfahrung bereitzustellen, bei der Benutzer davor geschützt sind, unangemessenen anstößigen oder sensiblen Inhalten ausgesetzt zu sein.

Wie genau funktionieren solche sicheren Klassifikatoren für Suchergebnisse?

1) Als Antwort auf eine Anfrage gibt eine Suchmaschine einen vorläufigen Satz von SERPs zurück.
2) Die Abfrage wird durch einen Klassifikator klassifiziert, um festzustellen, ob sie einen oder mehrere Begriffe enthält, die mit einer geschützten Personengruppe verbunden sind, oder Begriffe, die mit sensiblen oder anstößigen Inhalten wie pornografischen oder gewalttätigen Inhalten verbunden sind.
3) Die vorläufigen Ergebnisse werden auch klassifiziert, um festzustellen, ob sie sensible oder anstößige Inhalte enthalten
4) Suchergebnisse werden an einen Suchenden zurückgegeben, damit einem Suchenden keine unangemessenen sensiblen oder anstößigen Inhalte angezeigt werden.

Der Suchende erhält einen Hinweis, dass die Suchanfrage so klassifiziert ist, dass sie Suchbegriffe enthält, die

(i) beziehen sich wahrscheinlich nicht auf eine bestimmte Klasse von Menschen,
(ii) wahrscheinlich mit der bestimmten Personengruppe verwandt, oder
(iii) beziehen sich wahrscheinlich auf die bestimmte Personengruppe und enthalten sensible oder anstößige Begriffe.

Außerdem wird ihnen mitgeteilt, dass das Suchergebnis als wahrscheinlich eingestuft wird, einschließlich

(i) nicht sensible und nicht beleidigende Inhalte oder
(ii) sensible oder anstößige Inhalte.

Aus dem Kandidatensatz der Suchergebnisse wird ein Präsentationssatz sicherer Suchergebnisse ausgewählt, der mindestens auf
(I) der Hinweis, dass die Suchanfrage so klassifiziert ist, dass sie Suchbegriffe enthält, die

(i) wahrscheinlich nicht mit der bestimmten Klasse von Menschen verwandt sind,
(ii) wahrscheinlich mit der bestimmten Personengruppe verwandt sind oder
(iii) wahrscheinlich mit der bestimmten Personengruppe verwandt sind und sensible oder beleidigende Begriffe enthalten, und

(II) der Hinweis, dass das Suchergebnis als wahrscheinlich eingestuft wird, einschließlich:

(i) nicht sensible und nicht beleidigende Inhalte oder
(ii) sensible oder anstößige Inhalte. Das eine oder die mehreren Suchergebnisse des Präsentationssatzes von Suchergebnissen werden als Reaktion auf die Suchanfrage zur Ausgabe bereitgestellt.

Für einige dieser Ergebnisse gibt es eine bestimmte Gruppe von Betroffenen, die eine Gruppe von Menschen umfasst, die mindestens ein demografisches Merkmal gemeinsam haben.

Und in einigen Ergebnissen können die sensiblen oder anstößigen Begriffe Begriffe enthalten, die mit Pornografie, Gewalt, Gore und Parodie in Verbindung stehen. Zu den sensiblen oder anstößigen Inhalten gehören Bilder, Videos oder Daten, die mit Pornografie, Gewalt, Gore und Parodie in Verbindung stehen.

In einigen Fällen umfasst die Auswahl des Präsentationssatzes sicherer Suchergebnisse aus dem Kandidatensatz von Suchergebnissen eine oder mehrere der folgenden Aktionen:

In einigen Fällen wird ein Ranking eines Suchergebnisses in der Kandidatenmenge von Suchergebnissen basierend auf reduziert

(i) der Hinweis, dass die zum Erhalt des Suchergebnisses verwendete Suchanfrage als wahrscheinlich mit der bestimmten Personengruppe in Zusammenhang stehend eingestuft ist, und
(ii) der Hinweis, dass das Suchergebnis als wahrscheinlich eingestuft wird und sensible oder anstößige Inhalte enthält.

In einigen Fällen kann ein Suchergebnis im Kandidatensatz von Suchergebnissen gefiltert werden , um das Suchergebnis aus dem Präsentationssatz von Suchergebnissen basierend auf zu entfernen

(i) der Hinweis, dass die zum Erhalt des Suchergebnisses verwendete Suchanfrage als wahrscheinlich mit der bestimmten Personengruppe in Zusammenhang stehend eingestuft wird und sensible oder anstößige Begriffe enthält, und
(ii) der Hinweis, dass das Suchergebnis als wahrscheinlich eingestuft wird und sensible oder anstößige Inhalte enthält.

In einigen Fällen kann ein Suchergebnis aus dem Kandidatensatz sicherer Suchergebnisse ausgewählt werden, um in den Präsentationssatz von Suchergebnissen aufgenommen zu werden, ohne eine Rangfolge des Suchergebnisses zu ändern oder das Suchergebnis basierend auf dem Hinweis zu filtern , dass die Suchabfrage verwendet wurde um das Suchergebnis zu erhalten, wird als wahrscheinlich nicht mit einer bestimmten Personengruppe verbunden und als wahrscheinlich mit nicht sensiblen und nicht beleidigenden Begriffen eingestuft.

In einigen Fällen umfasst die Auswahl des Präsentationssatzes von Suchergebnissen aus dem Kandidatensatz von Suchergebnissen eine oder mehrere der folgenden Aktionen:

(1) In einigen Fällen kann ein Suchergebnis aus dem Kandidatensatz von Suchergebnissen ausgewählt werden, um in den Präsentationssatz von Suchergebnissen aufgenommen zu werden, ohne eine Rangfolge des Suchergebnisses zu ändern oder das Suchergebnis basierend auf der Angabe zu filtern, dass die Suche Abfrage, die verwendet wird, um das Suchergebnis zu erhalten, wird als wahrscheinlich nicht mit einer bestimmten Personengruppe in Verbindung gebracht und als wahrscheinlich mit sensiblen oder anstößigen Begriffen eingestuft.

(2) In einigen Fällen kann ein Suchergebnis im Kandidatensatz von Suchergebnissen gefiltert werden, um das Suchergebnis aus dem Präsentationssatz von Suchergebnissen zu entfernen, basierend auf dem Hinweis, dass die zum Erhalten des Suchergebnisses verwendete Suchanfrage als wahrscheinlich eingestuft ist die sich auf die jeweilige Personengruppe beziehen und wahrscheinlich sensible oder anstößige Begriffe enthalten.

(3) In einigen Fällen können die Aktionen des computerimplementierten Verfahrens auch das Erzeugen einer Relevanzbewertung für ein Dokument, das jedem Suchergebnis in der Kandidatenmenge von Suchergebnissen entspricht, das Bestimmen einer Rangfolge für jedes Suchergebnis in der Kandidatenmenge von . umfassen Suchergebnisse und Empfangen von Benutzersitzungsdaten, die ein oder mehrere Attribute eines Benutzergeräts enthalten.

Die Relevanzbewertung gibt die Relevanz des Dokuments für die Suchanfrage an. Die Auswahl des Präsentationssatzes von Suchergebnissen aus dem Kandidatensatz von Suchergebnissen umfasst ferner das Modifizieren der Rangfolge von einem oder mehreren Suchergebnissen in dem Kandidatensatz von Suchergebnissen basierend auf den Benutzersitzungsdaten, die ein oder mehrere Attribute des Benutzergeräts beinhalten .

In einigen Fällen kann die Auswahl des Präsentationssatzes von Suchergebnissen aus dem Kandidatensatz von Suchergebnissen für jedes Dokument, das einem Suchergebnis entspricht, das Zuweisen eines Labels zu dem Dokument zumindest basierend auf der Angabe, dass das Suchergebnis als sensible oder anstößige Inhalte enthaltend klassifiziert wird, und das Bestimmen, das Suchergebnis zu filtern oder das Ranking des Suchergebnisses basierend auf dem zugewiesenen Label zu ändern. Das Etikett weist auf den im Dokument enthaltenen Gegenstand hin.

Das Patent, in dem all diese Filterungen oder Einschlüsse vorgenommen werden können, ist beschrieben in:

Schutz der Nutzer vor unangemessenen sensiblen oder anstößigen Suchergebnissen
Erfinder: Matthias Heiler, Michael Schaer, Nikola Todorovic, Robin Nittka, Thomas Fischbacher und Laura Dragoi;
Rechtsnachfolger: Google LLC
US-Patent: 10.083.237
Bewilligt: ​​25. September 2018
Gespeichert: 31. August 2015

Abstrakt

Es werden ein System und ein Verfahren zum Bereitstellen eines Sucherlebnisses beschrieben, bei dem Benutzer davor geschützt sind, unangemessenen anstößigen oder sensiblen Inhalten ausgesetzt zu sein. Ein Suchsystem kann eine Suchanfrage und als Reaktion auf die Suchanfrage erhaltene Kandidatensuchergebnisse klassifizieren. Basierend auf der Klassifizierung der Suchanfrage und der Suchergebnisse können die Kandidatensuchergebnisse modifiziert werden, um einen Satz von Suchergebnissen zu erzeugen, die einem Benutzer präsentiert werden, so dass die präsentierten Suchergebnisse keinen unangemessenen sensiblen oder anstößigen Inhalt enthalten.

Einige Definitionen im Rahmen des Patents für sichere Suchergebnisse

Das Patent definiert "sensible oder anstößige Inhalte" für uns als Bezugnahme auf Pornografie, blutige Bilder und gewalttätige Inhalte, ist aber nicht darauf beschränkt.

Es definiert auch „unangemessene sensible oder anstößige Inhalte“ als Unterkategorie der sensiblen oder anstößigen Inhalte und kann Inhalte wie:

  • Inhalte zur Bandenrekrutierung
  • Gewalt anstiftende Inhalte
  • Inhalte, die eine bestimmte demografische Gruppe verspotten oder zu Hass gegen eine bestimmte demografische Gruppe aufstacheln
  • Inhalt gefälscht

„Es kann sich auch allgemein auf alle Inhalte beziehen, die illegal, missbräuchlich oder für eine geschützte Klasse von Internetnutzern höchst anstößig sind.“

Das Patent sagt uns auch, dass es darauf abzielt, Suchende zu schützen, die möglicherweise auf einige Suchergebnisse empfindlich reagieren:

Diese geschützte Benutzerklasse kann jede Gruppe von Personen umfassen, die mindestens ein demografisches Merkmal gemeinsam haben und für die Schutz vor unangemessenen sensiblen oder anstößigen Internetinhalten gewünscht wird.

Wie Inhalte für Teenager als geschützte Klasse behandelt werden

Die Beschreibung des Patents für sichere Suchergebnisse beginnt mit einem Beispiel von Suchergebnissen, die auf Teenager als Antwort auf eine Anfrage wie "Warum Teenager Gruppen beitreten" abzielen. Die Suchmaschine empfängt diese Abfrage und erhält eine Reihe von Suchergebnissen, die als Antwort auf diese Abfrage angezeigt werden.

Die Suchmaschine empfängt auch mehrere Klassifizierungssignale und wählt basierend auf den Klassifizierungssignalen einen Satz von Suchergebnissen aus dem Satz von Kandidatensuchergebnissen aus, um sie einem Kindsucher zu präsentieren.

Eines der Suchergebnisse mit dem Titel „Teen Recruitment“ wird mit einer Relevanzbewertung von 96 bewertet und mit einem Label versehen, das angibt, dass das Suchergebnisdokument, das „Teen Recruitment“ entspricht, Inhalte enthält, die allen Benutzern, einschließlich eines untergeordneten Benutzers, präsentiert werden können und dies nicht tun keine sensiblen oder anstößigen Inhalte enthalten.

Ein weiteres Ergebnis trägt den Titel „Teen Gang Recruiter“ mit einer Relevanzbewertung von 87 und weist ein Label „v“ auf, das anzeigt, dass das Suchergebnisdokument, das „Teen Gang Recruiter“ entspricht, wahrscheinlich gewalttätige Inhalte oder verstörende Bilder enthält.

Einige andere Suchergebnisse haben den Titel „News: Teen Groups“ und „Groups of kids“, die Relevanzwerte von 79 bzw. 34 haben und mit zugewiesenen Labels versehen, die anzeigen, dass die Suchergebnisse Dokumente entsprechend „News: Teen Groups“ und „Groups von Kindern“ und enthalten wahrscheinlich Inhalte, die allen Benutzern präsentiert werden können, einschließlich eines untergeordneten Benutzers, und sie enthalten keine sensiblen oder anstößigen Inhalte.

Basierend auf den verwendeten Klassifizierungssignalen können einige Ergebnisse genehmigt, einige entfernt und andere neu eingestuft werden, bevor sie einem Kindersucher präsentiert werden.

Einige der Ergebnisse können neu geordnet werden, um in den Suchergebnissen höher angezeigt zu werden, wie zum Beispiel bei „News: Teen Groups“.

Einige der Ergebnisse werden möglicherweise in eine niedrigere Rangfolge eingestuft, wie beispielsweise das Ergebnis über „Teen-Gang-Recruiter“, bei denen wahrscheinlich gewalttätige Inhalte mit Teenagern in Verbindung gebracht werden.

Das Patent für sichere Suchergebnisse sagt uns, dass der Schwerpunkt dieses Ansatzes auf Folgendem liegt:

Der ausgewählte Satz von Suchergebnissen wird dann als ein Präsentationssatz von Suchergebnissen auf dem Benutzergerät ausgegeben, so dass der kindliche Benutzer ein sicheres Sucherlebnis genießen kann, ohne unangemessen sensiblen oder anstößigen Inhalten ausgesetzt zu sein.

Andere geschützte Gruppen und andere Filter

Das Patent für sichere Suchergebnisse bietet weitere Beispiele für andere Gruppen, z. B. Ergebnisse zu

(i) „Patentanwalts-Spoof“ mit einem Relevanzwert von 96 und einer Kennzeichnung, die angibt, dass das mit dem Suchergebnis verknüpfte Dokument mit dem Titel „Patentanwalts-Spoof“ wahrscheinlich unangemessen sensible oder anstößige Inhalte enthält, wie z (zB Patentanwälte).

(ii) „Pranks on IP Practitioners“ mit einem Relevanzwert von 92 und einem Label, das darauf hinweist, dass das mit dem Suchergebnis verknüpfte Dokument mit dem Titel „Pranks on IP Practitioners“ wahrscheinlich unangemessene sensible oder beleidigende Inhalte wie beleidigende Witze enthält, die an eine geschützte Klasse gerichtet sind von Leuten;

(iii) „Lustige Momente des Patentanwalts“ mit einer Relevanzbewertung von 89 und einer Kennzeichnung, die angibt, dass das mit dem Suchergebnis verknüpfte Dokument mit dem Titel „Lustige Momente des Patentanwalts“ wahrscheinlich keine sensiblen oder anstößigen Inhalte enthält; und

(iv) „Humor an Anwalt“ mit einer Relevanzbewertung von 74 und einer Kennzeichnung, die angibt, dass das mit dem Suchergebnis verknüpfte Dokument mit dem Titel „Humor an Anwalt“ wahrscheinlich keine sensiblen oder anstößigen Inhalte enthält.

Das Patent sagt uns, welche Inhalte aus diesen Abfragen wahrscheinlich entfernt oder neu eingestuft wurden.

Das Patent enthält auch andere Beispiele, die solche Dinge wie politische Witze, politische Meme und politische Skandale abdecken.

Es enthält auch weitere Details dazu, wie die Suchmaschine Inhalte identifiziert, die sie filtern möchte.

Größte Erkenntnis aus dem Patent für sichere Suchergebnisse

Ich hatte noch nie gesehen, dass Google etwas über das Entfernen oder Neuordnen von Suchergebnissen auf der Grundlage der Bereitstellung sicherer Suchergebnisse mit geschützten Gruppen gesagt hat. Ich erinnere mich jedoch an einen Rechtsstreit gegen Google, bei dem ein Bundesgericht im Jahr 2003 entschieden hatte, dass PageRank gemäß dem ersten Zusatzartikel sprachgeschützt sei.