Was wäre, wenn das Web zu einer Datenbank würde, die wie ein offenes Buch lesbar ist? Ein Technologie-Startup namens Exa hat sich mit seiner Suchmaschine Websets dieses ambitionierte Ziel gesetzt. Mit dem Versprechen, die Logik der Schlüsselwörter zu übertreffen, könnte diese Innovation unsere Art des Online-Surfens revolutionieren.
Websuche: Vorher / Nachher?
Während fast zwei Milliarden Websites um unsere Aufmerksamkeit konkurrieren, gleicht das Finden einer präzisen Information manchmal einer unmöglichen Aufgabe. Klassische Tools wie Google basieren auf Rankings durch Schlüsselwörter. Doch auch wenn diese Systeme für einfache Suchen effizient sind, stoßen sie bei komplexen Anfragen an ihre Grenzen. Hier kommt Exa Websets ins Spiel.
Diese Suchmaschine, die sich noch in der Einführungsphase befindet, nutzt einen völlig neuen Ansatz:
Embeddings. Im Gegensatz zu herkömmlichen Methoden kodiert diese Technologie Informationen, indem sie sie nach Sinn und Kontext gruppiert, anstatt spezifische Begriffe zuzuordnen. Das Ergebnis? Antworten, die direkt zum Punkt kommen.
Will Bryk, CEO von Exa, erklärt, dass die von Websets verwendete Methode besonders bei der Verarbeitung hochkomplexer Anfragen brilliert. Bei einer Demonstration beantwortete die Suchmaschine eine detaillierte Anfrage zu „allen Doktoranden, die an Produkten für Entwickler gearbeitet haben, Absolventen renommierter Universitäten sind und einen Blog betreiben“. Websets erstellte eine umfassende Liste von Namen, ergänzt durch Links zu deren LinkedIn-Profilen. Diese Präzision, die mit traditionellen Suchmaschinen nicht erreichbar ist, zeigt ihre Fähigkeit, eine feine semantische Suche mit einer hochgradigen Kontextualisierung der Ergebnisse zu kombinieren.
Doch diese Präzision hat ihren Preis. Exa musste Milliarden von Webseiten kodieren – eine enorme Aufgabe, wenngleich noch bescheiden im Vergleich zu den riesigen Indizes von Google. Jede Suche erfordert beeindruckende Rechenleistung, was die Wartezeit manchmal auf mehrere Minuten verlängert. Ein Kompromiss, den Nutzer gerne in Kauf nehmen, um maßgeschneiderte Ergebnisse zu erhalten.
Demonstration von Exa Websets
Indem Websets fortgeschrittene Sprachmodelle integriert, geht es über einfache Wortvorhersagen hinaus, um die relevantesten Verbindungen zu antizipieren. Laut Andrew Gao, einem Informatikstudenten, ist dieses Tool besonders dann nützlich, wenn präzise Begriffe fehlen. Für direkte Fragen, wie ein einzelner Fakt oder eine Definition, bleiben jedoch traditionelle Suchmaschinen schneller.
Einige Experten bleiben skeptisch. Die Embedding-Technologie, so leistungsstark sie auch ist, kann zu Informationsverlusten führen. Bryk ist sich dessen bewusst, erklärt jedoch, dass sein Team aktiv daran arbeitet, diese Grenzen zu überwinden. Das ultimative Ziel: die Sucherfahrung so strukturiert wie effizient zu gestalten.
Auch wenn der Weg zu einem organisierten Web noch lang ist, gibt Exa einen Einblick in die mögliche Zukunft. Eine Suchmaschine, die nicht nur sucht, sondern versteht. Eine langsame, aber vielversprechende Revolution.
Was ist die von Exa Websets verwendete Embedding-Methode?
Die Embedding-Methode basiert auf dem Prinzip der digitalen Kodierung von Textinformationen, um deren kontextuelle Bedeutung zu erfassen. Jedes Wort, jeder Satz oder jedes Dokument wird in eine Reihe mathematischer Werte umgewandelt, die ihre semantischen Beziehungen darstellen.
Beispielsweise werden ähnliche Begriffe wie „Forscher“ und „Wissenschaftler“ durch ähnliche Werte repräsentiert, was ihre Zuordnung erleichtert. Diese Darstellung ermöglicht es dem Algorithmus, nicht nur die Wörter selbst zu verstehen, sondern auch ihre Bedeutung in einem bestimmten Kontext.
In der Praxis bedeutet dies, dass die Suchmaschine relevante Verbindungen zwischen komplexen Anfragen und Webdaten herstellen kann, selbst wenn keine exakten Schlüsselwörter vorhanden sind.
Diese Methode ist besonders nützlich, wenn thematische Beziehungen und mehrstufige Anfragen untersucht werden müssen und die Grenzen einfacher Schlüsselwortsuche überschritten werden.
Autor des Artikels: Cédric DEPOND
Quelle: MIT Technology Review