Was ist latente semantische Indizierung? 7 Dinge, die Sie wissen müssen

Veröffentlicht: 2020-03-13

Sie fragen sich, was latente semantische Indizierung ist?

Es gibt eine Menge Verwirrung um LSI. Und sogar Kontroversen. In diesem Artikel erkläre ich, was es ist, wie die Suchmaschinen es verwenden und wie Sie es verwenden können, um in den Suchergebnissen höher zu ranken.

Aber zuerst…

what is latent semantic indexing
Inhaltsverzeichnis
1. Was ist latente semantische Indizierung?
2. Keyword-Analyse vs. latente semantische Indexierung
3. Latente semantische Indizierung und aktuelle Autorität
4. Latente semantische Indizierung und aktuelle Autorität
Aktuelle Autorität übertrumpft Domain-Autorität
Websites haben auch aktuelle Autorität
5. Latente semantische Indizierung und Vektoranalyse
6. Verwendet Google Latent Semantic Indexing?
Latente semantische Indizierung als „alte Technologie“
Patentanmeldung von Google von 2009
7. Wie kann LSI Ihnen helfen, bei Google besser zu ranken?
Google: Es gibt keine LSI-Keywords
Fazit
Verwandte Artikel

1. Was ist latente semantische Indizierung?

Was genau ist also latente semantische Indizierung?

Latent Semantic Indexing ist eine mathematische Methode zum Auffinden von Mustern in der Art und Weise, wie Wörter in Online-Inhalten gruppiert werden. Diese Informationen werden dann indiziert, damit sie zur Beantwortung von Anfragen verwendet werden können.

Anders ausgedrückt untersucht die latente semantische Indexierung das gemeinsame Vorkommen von Wörtern. Auf diese Weise findet es die verborgenen (latenten) Beziehungen zwischen Wörtern, was es wiederum ermöglicht, die Bedeutung (Semantik) zu verstehen.

Die latente semantische Indexierung war für das Textverstehen ein großer Fortschritt, da sie der Tatsache Rechnung trägt, dass sich die Bedeutung von Wörtern kontextabhängig ändert.

Hier sind einige Beispiele:

  • Arme beugen am Ellbogen.
  • Deutschland verkauft Waffen an Saudi-Arabien.
  • Erarbeiten Sie die Lösung in Ihrem Kopf.
  • Erhitzen Sie die Lösung auf 75° Celsius.
  • Der Schlüssel ist im Schloss abgebrochen.
  • Das Hauptproblem war nicht einer von Qualität , sondern der Quantität.

Das Herzstück der latenten semantischen Indizierung ist eine Theorie, die als Verteilungshypothese bezeichnet wird . Nach dieser Theorie haben Wörter, die im selben Kontext vorkommen, tendenziell ähnliche Bedeutungen. Wie ein Sprachwissenschaftler es ausdrückte: "Sie sollen ein Wort von der Gesellschaft kennen, die es pflegt."

Kurz gesagt , Wörter mit ähnlichen Kontexten haben in der Regel ähnliche Bedeutungen.

"Sie sollen ein Wort von der Gesellschaft kennen, die es pflegt."


JR Firth, 1957

2. Keyword-Analyse vs. latente semantische Indexierung

Was hat das mit Suchmaschinen zu tun?

In den späten 1990er Jahren, als die ersten Suchmaschinen auftauchten, war die Keyword-Dichte das einzige verfügbare Maß für die Relevanz. Je öfter ein Keyword in einem Inhalt vorkam, desto relevanter war es für die Suchanfrage.

Natürlich konnte die Keyword-Dichte den Kontext nicht verstehen. Und es war auch leicht zu manipulieren. Websites würden in den Suchergebnissen einen hohen Rang einnehmen, indem sie ihren Inhalt mit einem bestimmten Schlüsselwort füllen.

Als jedoch eine latente semantische Indexierung auftauchte, war das Keyword-Stuffing nicht mehr effektiv.

Wieso den?

Denn bei der latenten semantischen Indexierung suchen Suchmaschinen nicht nach einem einzelnen Schlüsselwort, sondern nach Schlüsselwortmustern .

Anders ausgedrückt: Suchmaschinen bewegen sich weg von der Keyword-Analyse hin zur Aktualität .

3. Latente semantische Indizierung und aktuelle Autorität

Durch die Identifizierung von Mustern in der Art und Weise, wie Wörter in Online-Inhalten gruppiert werden, kann die latente semantische Indexierung Wortgruppen identifizieren, die Themen und Unterthemen bilden.

Unabhängig davon, über welches Thema Sie schreiben, wissen die Suchmaschinen, welche Wortgruppe mit diesem Thema oder Unterthema verbunden ist . Und das bedeutet, dass Suchmaschinen die Aktualität eines Inhalts messen können.

In den alten Tagen (1990er bis ~2005) konnte man in den Suchergebnissen durch die Betonung eines Keywords ranken.

Aber um jetzt zu ranken, müssen Sie zeigen, dass Ihre Inhalte aktuelle Autorität haben. Und das bedeutet, die gesamte Wortgruppe zu verwenden, die durch latente semantische Indexierung mit Ihrem Thema identifiziert wurde.

4. Latente semantische Indizierung und aktuelle Autorität

Aktuelle Autorität übertrumpft Domain-Autorität

Die aktuelle Autorität wird zu einem wichtigen Rankingfaktor für Suchmaschinen. Bei Google können Sie beispielsweise Websites mit viel höherer Domain-Autorität (dh Websites mit einem viel stärkeren Link-Profil) übertreffen, indem Sie Inhalte mit sehr hoher Aktualität erstellen.

Als meine Domain-Autorität erst 24 Jahre alt war, habe ich in den 80er und 90er Jahren regelmäßig Websites mit DA überholt, indem ich einfach Inhalte mit hoher Aktualität erstellte.

Websites haben auch aktuelle Autorität

Bisher habe ich über aktuelle Autorität gesprochen, die sich auf eine einzelne Webseite oder einen einzelnen Blogbeitrag bezieht.

Aber eine Website selbst hat aktuelle Autorität. Und Suchmaschinen wie Google haben bereits eine sehr gute Vorstellung von der Aktualität Ihrer Website.

Wenn Sie beispielsweise nur über Jazzmusik der 1930er Jahre schreiben, hat Ihre Website eine sehr hohe Aktualität zu diesem Thema. Wenn Sie Artikel zu diesem Thema veröffentlichen, wird Ihre Webseite einen sehr hohen Rang einnehmen. Es ist wahrscheinlich, dass Sie Websites mit einer höheren Domänenautorität übertreffen würden.

Aber wenn Ihre Website alle Genres und Epochen des Jazz abdeckt, die es jemals gegeben hat, wird Ihre Website über den Jazz der 1930er Jahre wahrscheinlich nicht so hoch rangieren wie der Artikel der anderen Website.

5. Latente semantische Indizierung und Vektoranalyse

Wir haben viel über latente semantische Indizierung gesprochen. Aber es ist nicht das einzige Werkzeug, mit dem Computer versuchen, die Bedeutung von Wörtern zu verstehen.

Es gibt auch eine Sache namens Vektoranalyse.

Was also ist Vektoranalyse, wenn sie auf Wörter angewendet wird?

Ein Wortvektor ist eine Reihe von mathematischen Werten, die einem einzelnen Wort zugeordnet sind. Jeder Wert in der Zeile erfasst eine Dimension der Wortbedeutung.

Hier ist ein Beispiel:

latent semantic indexing

(Quelle)

Jede Zahl in der Reihe versucht, die Bedeutung des Wortes gemäß einem von vier verschiedenen Vektoren (Tier, domestiziert, Haustier, flauschig) zu kapseln.

Der Unterschied zwischen latenter semantischer Indizierung und Wortvektoren besteht darin, dass LSI ein zählbasiertes Modell ist – es zählt einfach, wie oft Wörter in einem bestimmten Kontext vorkommen. Wortvektoren sind jedoch ein prädiktionsbasiertes Modell – sie versuchen, die Bedeutung eines Wortes basierend auf der Vektoranalyse vorherzusagen.

Durch die Vektoranalyse beispielsweise versteht der Google-Algorithmus „dass Paris und Frankreich genauso verwandt sind wie Berlin und Deutschland (Hauptstadt und Land) und nicht so wie Madrid und Italien“

6. Verwendet Google Latent Semantic Indexing?

Hier beginnt die Kontroverse...

Latente semantische Indizierung als „alte Technologie“

In letzter Zeit sind eine Reihe von Artikeln online erschienen, in denen behauptet wird, dass Google keine latente semantische Indexierung verwendet. Einige von ihnen gehen weiter und behaupten, dass das Verständnis der Funktionsweise von LSI Ihrer SEO nicht helfen wird.

Natürlich weiß niemand außerhalb von Google genau, was der Google-Algorithmus macht.

Aber schauen wir uns die Wahrscheinlichkeit (oder nicht) an, dass Google latente semantische Indizierung verwendet.

Einige haben argumentiert, dass LSI, da es in den 1980er Jahren entwickelt wurde, "alte Technologie" ist und es daher unwahrscheinlich ist, dass Google LSI in seinem Algorithmus verwendet.

Dieses Argument hat ein Problem .

Das Datum, an dem LSI entdeckt wurde, ist unerheblich dafür, ob es heute von Google verwendet wird.

Tatsächlich hat das Datum, an dem eine Technologie entdeckt wurde, keinen Einfluss darauf, ob wir sie heute noch verwenden.

Wilhelm Conrad Roentgen, discoverer of X rays

Wilhelm Conrad Röntgen, Entdecker der Röntgenstrahlen

(Quelle)

Zum Beispiel wurden Röntgenstrahlen 1895 entdeckt (von Wilhelm Conrad Roentgen, Professor an der Universität Würzburg in Deutschland). Streng genommen handelt es sich also um „alte Technik“.

Aber es wäre absurd für Krankenhäuser zu sagen: „Weil Röntgen auf alter Technik basiert, werden wir sie nicht mehr verwenden“.

Hier ist ein weiteres Beispiel, näher an zu Hause.

what is latent semantic indexing

Gottfried Wilhelm Leibniz, Erfinder des Binärsystems

(Quelle)

Computer basieren auf einem Binärsystem, bei dem alle Daten auf eine '0' oder eine '1' reduziert werden.

Das binäre System wurde von Gottfried Wilhelm Leibniz erfunden, der seine Erfindung 1701 in einem Aufsatz mit dem Titel "Essay d'une nouvelle science des nombres" veröffentlichte.

So könnte man Jahrhundert auf eine 18 moderne Computer basiert Erfindung argumentieren , dass sind.

The Turing machine, forerunner of the modern computer

Die Turing-Maschine, Vorläufer des modernen Computers

(Quelle)

Manche argumentieren für einen neueren Ursprung . Sie führen den modernen Computer auf Alan Turings Erfindung der „universellen Maschine“ (heute Turing-Maschine) zurück.

In jedem Fall basieren Computer auf „alter Technologie“ (1701 oder 1936, je nach Sichtweise).

Die Tatsache, dass LSI in den 1980er Jahren entdeckt wurde, ist also weder hier noch dort – es bedeutet nicht, dass LSI nicht mehr relevant oder nützlich ist.

Patentanmeldung von Google von 2009

Wie gesagt, Google ist sehr zurückhaltend in Bezug auf die Funktionsweise seiner Algorithmen.

Doch im März 2009 meldete Google in den USA ein Patent an (US 8.145.636 B1). Die Patentanmeldung trug den Titel „Klassifizieren von Text in hierarchische Kategorien“.

Google patent application, 2009

Der Antrag enthält diesen Absatz:

„Textklassifikationstechniken können verwendet werden, um Text in eine oder mehrere Themenkategorien zu klassifizieren. Die Textklassifikation/-kategorisierung ist ein Forschungsgebiet der Informationswissenschaft, das sich mit der inhaltlichen Zuordnung von Text zu einer oder mehreren Kategorien beschäftigt. Typische Textklassifikationstechniken basieren auf naiven Bayes-Klassifikatoren, tf-idf, latenter Semantik Indizierung , Support Vector Machines und künstliche neuronale Netze zum Beispiel“.

Google patent application, 2009

Verwendet Google also eine latente semantische Indexierung?

Wir wissen es nicht genau.

Aber es wäre außergewöhnlich, wenn dies nicht der Fall wäre (und es wäre sicherlich nicht, weil LSI 'alte Technologie' ist).

7. Wie kann LSI Ihnen helfen, bei Google besser zu ranken?

Es gibt verschiedene Möglichkeiten, wie LSI Ihnen helfen kann, bei Google einen höheren Rang zu erreichen. Das Wichtigste ist einfach zu erkennen, dass sich Google auf Themen konzentriert, nicht auf Keywords.

Wie oben erwähnt, kann Google durch latente semantische Indexierung ganze Themen und die Unterthemen, aus denen diese Themen bestehen, abbilden. Das wiederum bedeutet, dass der Algorithmus messen kann, wie gut der Inhalt eines Stücks ein bestimmtes Thema abdeckt.

Anders ausgedrückt: Google kann die Aktualität Ihres Inhalts messen.

Hier sind einige Möglichkeiten, um sicherzustellen, dass Ihre Inhalte eine hohe Aktualität haben:

Führen Sie eine Themenanalyse durch. Sehen Sie sich die Top-5-Suchergebnisse für Ihr Fokus-Keyword an und notieren Sie die Themen und Unterthemen, die diese Webseiten abdecken. Stellen Sie sicher, dass Ihr Inhalt mehr dieser Themen und Unterthemen abdeckt als jeder andere Inhalt

Erstellen Sie Themencluster. Schreiben Sie einen Kernartikel, der ein Thema ausführlich behandelt. Und dann 'Satelliten'-Artikel schreiben, die Unterthemen detaillierter behandeln.

Sie könnten zum Beispiel einen Kernartikel über britische Kampfflugzeuge des Zweiten Weltkriegs schreiben. Und dann könnten Sie einen Satellitenartikel über Spitfires, einen weiteren Artikel über Hurricanes, einen weiteren über Gloster Gladiators und so weiter schreiben.

Die Satellitenartikel zu den einzelnen Kampfflugzeugen bauen die aktuelle Autorität Ihres Kernartikels aus.

Verwenden Sie Google Auto Suggest. Beginnen Sie mit der Eingabe Ihres Fokus-Keywords in Google und beachten Sie die Long-Tail-Variationen, die Google bietet. Das sind alles Unterthemen, die zu Ihrem Hauptthema gehören. Versuchen Sie, diese Unterthemen als Überschriften in Ihren Artikel aufzunehmen.

Machen Sie dasselbe mit Googles „People Also Ask“ (normalerweise ein Drittel weiter unten auf der Ergebnisseite) und Googles „Related Searches“ (am Fuß der Ergebnisseite) – dies sind alles verwandte Themen oder Unterthemen. Fügen Sie sie unter Überschriften ein, gefolgt von einigen Absätzen, und Sie werden die Aktualität Ihres Artikels erhöhen.

Google: Es gibt keine LSI-Keywords

Ich kann diesen Artikel nicht beenden, ohne auf den Tweet von John Mueller vom Juli 2019 einzugehen.

Hier ist es:

Was ist davon zu halten?

Nun, erstens hat er nicht gesagt, dass Google keine latente semantische Indexierung verwendet. Und zweitens hat er vielleicht einfach Einwände gegen die Terminologie „latente semantische Schlüsselwörter“.

Aber gibt es für das Thema, über das Sie schreiben, eine Gruppe verwandter Wörter, die sich in einem vorhersehbaren Muster zusammenschließen ? Und verwendet Google diese Wortcluster, um Themen zu identifizieren?

Darauf wette ich gerne!

Fazit

Die latente semantische Indexierung ist eine mathematische Methode zum Verstehen der Bedeutung von Wörtern durch das Studium von Mustern in der Art und Weise, wie Wörter in Textinhalten gruppiert werden.

Obwohl es keine eindeutigen Beweise dafür gibt, dass Suchmaschinen es verwenden, ist es mehr als wahrscheinlich, dass dies der Fall ist. Suchmaschinen wie Google verwenden wahrscheinlich eine latente semantische Indexierung, um den Kontext zu verstehen und Themen und Unterthemen abzubilden.

Die aktuelle Autorität ersetzt die Keyword-Dichte als Rankingfaktor. Ein Verständnis der latenten semantischen Indexierung wird Ihnen helfen, aktuelle Autorität für Ihre Artikel und Ihre Website aufzubauen und einen höheren Rang in den Suchergebnissen zu erreichen.

Verwandte Artikel

  • Was sind LSI-Keywords (einfache Möglichkeit, Ihre SEO zu steigern)
  • Was sind Themencluster und warum sie Ihre SEO steigern?
  • So erstellen Sie eine Silostruktur auf Ihrer Website (eine illustrierte Anleitung)