Die seltsame Sache mit der Keyword-basierten Suche (und wie wir damit umgehen)

Kurze Frage: Was hat sich in den letzten 25 Jahren in der Technologie geändert? Offenkundig so ziemlich alles, von Mobiltelefonen über E-Mail bis hin zu

By Yext

Juni 15, 2021

6 min

Kurze Frage: Was hat sich in den letzten 25 Jahren in der Technologie geändert?

Offenkundig so ziemlich alles, von Mobiltelefonen über E-Mail bis hin zu den eindringlichen Tönen der frühen Internetmodems … Schwieriger wäre die Frage, was sich nicht verändert hat.

Eine Sache ist jedoch seit über 20 Jahren auf Erfolgskurs, ohne sich groß geändert zu haben: die Stichwort-basierte Suche. Man würde annehmen, dass sich die Suche seit den 90er Jahren dramatisch verändert hat. Und das stimmt auch. Die Suche hat sich in diesem Zeitraum dank Google für Konsumenten deutlich verbessert. Aber es gibt einen Bereich der Suche, der in seiner Anfangsphase stecken geblieben ist, aber noch nie beliebter war: die Stichwort-basierte Suche. Diese Art der Suche gibt es auf den meisten Unternehmens-Websites, aber das Sucherlebnis unterscheidet sich stark von dem, was man bei Google bekommt.

Doch warum ist das so? Warum hat sich die Stichwort-basierte Suche so lange gehalten und wurde nicht zusammen mit Faxgeräten und Festnetztelefonen auf dem Technikfriedhof beerdigt? Um diese Fragen zu beantworten, müssen wir zunächst in das Jahr 1994 zurückreisen und uns die Erfindung der (zweit-)wichtigsten Stichwort-Suchmaschine, die jemals entwickelt wurde, genauer ansehen.

Hyperlinks? Von wegen!

1994, zu Beginn des Zeitalters des „World Wide Web", brach auch die Ära der Stichwort-basierten Suche an – die Funktion, ein Stichwort in eine Suchleiste eingeben zu können, z. B. „Muschelkette" (wenn wir uns schon in die 90er-Jahre zurückversetzen), und tatsächlich Links zu Seiten zu finden, auf denen Muschelketten erwähnt werden.

Damals war das ein großer Fortschritt. In nur 36 Monaten wurden Dutzende von Keyword-basierten-Suchmaschinen eingeführt, darunter Infoseek, Yahoo!, Lycos, Webcrawler, Looksmart, Excite und AltaVista. Im Jahr 1998 führte Google PageRank ein, was sich als der beste Algorithmus herausstellte, um eine Rangfolge von Web-Ergebnisse für Stichwort-basierte Suchen im Internet zu erstellen.

Aber hier endete die Entwicklung für die meisten Sucherlebnisse – vor 23 Jahren.

Etwa zur gleichen Zeit brachte nämlich der ehemalige Xerox PARC-Ingenieur Doug Cutting eine Open-Source-Keyword-Suchmaschine namens Apache Lucene auf den Markt.

Das war bahnbrechend, denn mit Lucene konnten Unternehmensentwickler eine Keyword-basierte-Suchmaschine zu ihren Websites, Unternehmensanwendungen, Helpdesks, E-Commerce-Websites, Unternehmens-Apps und mehr hinzufügen. Wenn Sie es Leuten ermöglichen wollten, Ihre eigene Website zu durchsuchen – nicht nur über Google oder Ask Jeeves (möge es in Frieden ruhen)–, war das nun endlich möglich.

Auch heute verwenden Sie Lucene-gestützte Suchfunktionen wahrscheinlich fast genauso oft wie Google-gestützte Suchfunktionen. Sie wissen es nur nicht. Lucene (oder ElasticSearch, die auf Lucene aufbaut), unterstützt die Suchfunktion auf den meisten Websites.

Aber da liegt das Problem: Während es in den 90er Jahren keinen großen Unterschied zwischen den beiden gab, ist die Google-Suche im Jahr 2021 der von Lucene betriebenen Stichwort-Suche weit überlegen.

Dies liegt daran, dass Google nach einem Durchbruch in der Such-Technologie namens Natural Language Processing oder NLP zum Pionier wurde.

Das fehlende Puzzleteil in der Keyword-basierten Suche

Die natürliche Sprachverarbeitung (Natural Language Processing, kurz NLP) ist ein Teilgebiet aus dem Feld der künstlichen Intelligenz (KI) und beschäftigt sich damit, wie ein Softwareprogramm Sprache aufnehmen, verstehen und beeinflussen kann. Einfach ausgedrückt, geht es um die Fähigkeit eines Computerprogramms, die menschliche Sprache, so wie sie gesprochen wird, zu verstehen.

NLP versteht Fragen wie „Wann wurde Marco Polo geboren?" und antwortet „15. September 1253". Diese Antwort stammt aus dem Google Knowledge Graph.

Die Keyword-basierte Suche sucht hingegen nach den Stichwörtern, die Sie eingegeben haben – also etwa wörtlich „Polo". Diese Sucherlebnisse liefern meistens eine Liste von Ergebnissen aus blauen Links – basierend auf einzelnen Stichwörtern –, die selten die gewünschte Antwort enthalten. Das ist uns allen schon passiert, oder? Sie klicken auf die Lupe auf einer Website, geben ein Stichwort ein und erhalten eine Reihe irrelevanter Ergebnisse, sodass Sie aufgeben und anderswo weitersuchen.

Natürlich geben wir immer noch Stichwörter ein, wenn wir online etwas suchen. Wir fragen vielleicht nach Marco Polo, indem wir „Marco Polo Geburtstag" sagen. Nicht gerade eine vollständige Frage – aber das ist in Ordnung, denn NLP versteht, was wir meinen. Der veraltete Teil ist die Plattform der Keyword-basierten Suche, die nicht in der Lage ist, zwischen einer Reihe von Stichwörtern und einer Reihe von Stichwörtern, die implizit eine Frage stellen, zu unterscheiden.

Was ist die Alternative? Ein wirklich modernes, Google-ähnliches Sucherlebnis auf der eigenen Website. Moderne Suchfunktionen weisen diese vier Elemente auf:

  1. Nutzt NLP-basierte, fortschrittliche KI, um Fragen in natürlicher Sprache (wie in den obigen Beispielen) zu verstehen

  2. Verwendet mehrere Algorithmen, um verschiedene Ergebnisse zu präsentieren

  3. Läuft auf einer dynamischen Benutzeroberfläche (UI)

  4. Basiert auf einem Knowledge Graph

Sehen wir uns diese vier Elemente genauer an.

Die Eingabe

Die Keyword-basierte Suche funktioniert wie die „Strg-F"-Funktion in einem Word-Dokument. Das Problem dabei ist, dass man meistens nicht mit Stichwörtern sucht, die genau dem entsprechen, was man braucht.

Wenn Sie also etwa nach dem Stichwort „Ärzte in Berlin" suchen, erhalten Sie nicht die gewünschten Ergebnisse.

Es kommt nämlich auf der gesamten Website nie die genaue Wortfolge „Ärzte in Berlin" vor – ein schlechtes Sucherlebnis also.

Moderne Suchmaschinen nutzen stattdessen KI-gestützte natürliche Sprache, um die grundlegende Bedeutung der Eingaben des Benutzers zu verstehen. So können sehr präzise Fragen wie „Ärzte in Berlin, die die gesetzliche Krankenversicherung akzeptieren und Türkisch sprechen" verstehen.

Single- und Multi-Algorithmen

Der Stichwort-basierte Suchansatz à la „Steuerung-F" funktioniert gut bei nicht allzu großen Dokumenten wie Forschungsarbeiten oder selbst bei einem 500-seitigen Buch, da der Benutzer einfach „Weiter suchen" klicken und das Dokument chronologisch durchsuchen kann.

Aber das World Wide Web hat mittlerweile Milliarden von Seiten. Das Stichwort „Marco Polo" zum Beispiel wird an 207 Millionen Stellen erwähnt – viel zu viele, um sie einzeln durchzusehen. Diese Seiten müssen in Ranglisten geordnet werden. Also passten sich die Keyword-Suchmaschinen der späten 90er Jahre an, indem sie sich auf ihren RankingAlgorithmus konzentrierten. Um diese über 200 Millionen Ergebnisse zu sortieren, brauchten die Suchmaschinen einen starken Algorithmus, der Hyperlinks nach Relevanz ordnete.

In der modernen Suche ist diese (lange) Liste blauer Links nur der allerletzte Versuch.

Zum Beispiel zeigt Google Search Engine Result Pages (SERP) für das Stichwort „McDonalds" 500 Millionen Ergebnisse an, aber nur eine einzige Webseite ganz oben: McDonalds.com. Der Rest steht kaum sichtbar am Ende der Liste. Google kombiniert Snippets, Karten, Knowledge Cards und andere Elemente, um Benutzern mehrere Optionen für ihre Ergebnisse zu präsentieren.

Jedes dieser Elemente verwendet einen anderen Algorithmus – und genau so sollte die moderne On-Site-Suche funktionieren. Für jede eingehende Anfrage müssen mehrere Algorithmen auf die Frage angewendet werden. Der Benutzer erhält dann dynamische Ergebnisse, die am besten zur Anfrage passen.

Hyperlinks und Antworten

Die Keyword-basierte Suche liefert einfach eine Liste von Hyperlinks, die nach Relevanz geordnet sind. Sie müssen also auf den Link klicken und die Ergebnisse selbst lesen. Sie haben noch nicht die Ende der Suche erreicht – Sie wurden nur in die richtige Richtung gewiesen.

Die moderne Suche schließt den Suchvorgang ab, indem sie die Fragen des Benutzers direkt beantwortet und als nächsten Schritt die Transaktion ermöglicht.

Benutzer erhalten mehrere Elemente, die ihre Fragen beantworten. Das können extraktive QA-Snippets, eine Liste aus dem Knowledge Graph (KG) wie Karten oder eine Liste von Personen, oder direkte Antworten aus dem KG sein.

Das Beste daran: Wenn der Benutzer seine Ergebnisse erhält, kann er direkt auf der SERP eine Transaktion durchführen. Je nach Frage bieten Ihre Ergebnisse verschiedene Möglichkeiten für Transaktionen: Sie können online bestellen, eine Wegbeschreibung anfordern, anrufen oder ein Produkt kaufen.

Auf der Suche nach besseren Erlebnissen

Moderne Suche, die auf einem Multi-Algorithmus und auf Antworten basiert, ist in jeder Hinsicht besser als die Stichwort-Suche der späten 90er. Deshalb haben wir unsere Answers-Plattform entwickelt.

Mit einer vollständig KI-gesteuerten, auf Antworten ausgerichteten Suchplattform können Unternehmen jetzt einen einzigen, strukturierten Knowledge Graph für ihre Organisation aufbauen und statt Links jetzt Antworten liefern. Das funktioniert überall, wo Benutzer suchen: in intelligenten Diensten wie Google und Siri und mit Suchanfragen in natürlicher Sprache auf ihren eigenen Websites, Support-Websites und E-Commerce.

Trennen wir uns also von der Stichwort-basierten Suche der Vergangenheit und begrüßen die KI-basierte Suche von heute.

Klicken Sie hier, um mehr zu erfahren – oder vereinbaren Sie einen Termin für eine Demo.

Share this Article