Retrieval mit ChatGPT

ChatGPT wird auch die Form des Information Retrieval grundlegend verändern.
Sascha Lobo: Das Ende von Google, wie wir es kannten. Spiegel Online 28.12.2022 sieht z.B. einen grundlegenden Paradigmenwechsel in der Suche, der durch die dialogische Form und eventuelle Rückkopplung bedingt ist:
„Googles Suchmaschine sieht die Welt als Liste an, eine KI in der Bauart von ChatGPT sucht einzelne, gute Antworten. Dieser technokulturelle Unterschied lässt Google als Maschine erscheinen und ChatGPT als digitalen Gesprächspartner. Und wenn etwas die bis dato extrem machtvolle Schlagwortsuche verdrängen könnte, wären es dialogartige Suchformen. Denn es ist für die Nutzenden einfacher, in normaler Alltagssprache ihre gewünschten Informationen zu bekommen.
Vor allem aber ist eine neue Suchintelligenz gefragt, die noch stärker auf die persönlichen Bedürfnisse eingehen kann. Durch die dialogische Art gibt es erstmals einen Feedback-Kanal zur Suchqualität.
Es gibt im Netz verschiedene Artikel, die die Resultate von Google und ChatGPT mit unterschiedlichen Ergebnissen vergleichen. Es gibt jetzt auch AddOns für Chrome und Firefox. Voraussetzung ist, dass man sich bei ChatGPT angemeldet hat. Versieht man die Suchbegriff noch mit einem Fragezeichen, wird parallel zur Google-Suche eine Antwort von ChatGPT ausgegeben. Allerdings fällt diese bei der Erweiterung erheblich knapper aus, als wenn direkt auf der ChatGPT-Seite die Eingabe erfolgt ist.
Ein Problem ist die Evaluation der Suchergebnisse. Ruth Fulterer: Hype um neue künstliche Intelligenz, Neue Zürcher Zeitung 24.12.2022 Papierausgabe:
„Bei einer Recherche ist zudem relevant, woher eine Information kommt. Genau das verschleiert das Sprachmodell. Auch Google filtert mit seinem Such-Algorithmus die Inhalte. Aber zumindest steht dabei, woher sie kommen. Nutzer können selbst entscheiden, welcher Quelle sie vertrauen.“
Die Gefahr besteht, das Ergebnisse von ChatGPT durch die dialogische Form plausibler erscheinen.
Teresa Kubacka, Schweizer Datenwissenschaftlerin, hat experimentell ChatGPT als wissenschaftliche Fake-News-Schleuder entlarvt. Daniel Schurter: Datenwissenschaftlerin aus Zürich warnt vor ChatGPT und den bösen Folgen. Watson.ch 13.12.2022
„«Sie liess ChatGPT einen Essay dazu schreiben und fragte den Chatbot danach mit einem Trick nach den Quellen (dabei musste sie dem Chatbot sagen, er solle so tun, als sei er Wissenschaftler). Die Quellenangaben, die das Programm dann ausspuckte, sah sich Kubacka im Anschluss näher an. Sie musste dabei feststellen, dass die Referenzen offenbar gar nicht existieren.»
Als die Datenwissenschaftlerin die Textausgabe von ChatGPT analysierte, bemerkte sie verschiedene Fälschungen. Einmal existierte zwar tatsächlich der Forschende, der das von der KI zitierte wissenschaftliche «Paper» geschrieben haben soll, doch die wissenschaftliche Arbeit gab es nicht.
Ein anderes Mal gab es zwar einen ähnlichen Forschenden an einer Universität mit ähnlichem Namen, dieser forschte aber in einem völlig anderen Bereich. Und bei weiteren Quellenangaben, die die KI machte, stellte sich heraus, dass es weder die Forschenden gab noch die referenzierte Arbeit.“

Einerseits kann die dialogische Form die Recherche erheblich verbessern, indem Aspekte eines Sachproblems aufgezeigt werden, die ansonsten vielleicht verlässigt worden wären. Bleibt es andererseits bei dem von Kubacka festgestellten Problem, müsste die Evaluation der Rechercheergebnisse bei wissenschaftlichen Themen mit neuen Techniken angegangen werden.

Abstieg der Suchmaschine Qwant

Die als europäische Alternative zu Google vielgerühmte französische Suchmaschine Qwant hat ihre Ankündigungen, eigene Suchindizes aufzubauen, nicht eingelöst, sondern sich nach wie vor nur auf die Ergebnisse der Microsoft Suchmaschine Bing gestützt. Sie ist inzwischen in finanzielle Schwierigkeiten geraten, ist mit 47 Millionen Euro verschuldet und hat Hilfe von Huawei erhalten. Der Gründer hat das Unternehmen verlassen und eine private Überwachungs- und Spionageunternehmen mit Anlehnung an Palantir gegründet.

Elisa Braun: France’s Mr. Privacy turns cybersnooper. How the disgraced co-founder of France’s answer to Google moved into the murky world of cybersurveillance. Politico 07.12.2022

Markus Reute: Der Absturz der Suchmaschine Qwant und ihres Gründers. Netzpolitik.Org 08.12.2022

Google selbstreferentiell

Michael Moorstedt: Die Suchmaschine wird laut Kritikern immer schlechter. Sind wir nur zu verwöhnt, wie der Konzern behauptet?, Süddeutsche Zeitung 27.06.2022 beschreibt, wie die Google-Suche durch drie Faktoren immer schlechter wird: „Die Ergebnisse sind überladen, voll von Werbung und Produktanzeigen.“ Google verweist immer mehr auf eigene Seiten, zu denen auch kleine, aus anderen Webseiten extrahierte Inhalte gehören, zu deren vollständigen Angebote der Benutzer gar nicht erst gelangt. Schließlich verzerren auch die SEO-Tools der Suchmaschinenoptimireung die Suchergebnisse. Eine umfangreiche Studie hierzu legen Adrianne Jeffries und Leon Yin: Google’s Top Search Result? Surprise! It’s Google. The search engine dedicated almost half of the first page of results in our test to its own products, which dominated the coveted top of the page, TheMarkup 28.07.2020 vor.

Neue Suchmaschine You

Eine neue Suchmaschine YOU bewertet die Suchergebnisse und klassifiziert sie in Rastern. Suchergebnisse sollen somit nicht linear dargestellt werden, sondern bevorzugte Quellen sollen schnell ausgewählt und als Präferenzen festgehalten werden. In dem Artikel „Suchmaschine You.com: Google-Alternative macht vieles anders. tn3 10.11.2021“ wird dies wie folgt charakterisiert: „Im Gegensatz zur linearen Auflistung von Ergebnissen präsentiert you.com die Suchantwort anders. Ein Gitter zeigt Infoblöcke, die nach Quellen sortiert sind. In der Sektion „You Apps“ können Nutzer die Quellen gliedern und ihnen Relevanz zuordnen. Dabei tauchen hochgestufte Quellen weiter oben auf, neutrale oder heruntergestufte unten. Unter den Plattformen finden sich zum Beispiel Wikipedia, Reddit, Twitter, Linkedin, Tiktok, Youtube, GitHub, Arxiv, Yelp, Goodreads oder Techcrunch. Doch auch reine Mediensektionen wie Videos, Bilder, News und Musik sind möglich. „

Die Suchmaschine ist im Beta-Stadium und nur in englischsprachiger Oberfläche vorhanden. Es wird nicht offengelegt, auf welche Indizes (z.B. von Bing) sie sich stützt oder ob sie sich als Metasuchmaschine versteht. Personendaten werden nicht gespeichert und personenbezogene Werbung soll es nicht geben.

https://you.com/

 

Suchmaschine Brave

BRAVE war als Browser angetreten, das Internet-Geschäftsmodell zu revolutionieren. Die automatisiert dem Benutzer aufgespielte Werbung sollte blockiert werden. Der Benutzer sollte stattdessen mit Micropayment über eine Kryptowährung für das Ansehen von Werbung bezahlt werden. Dies ist vor allem an dem Widerstand der Werbetreibenden gescheitert. Mit dem akquirierten Geld von Investoren startet Brave jetzt eine Suchmaschine. In den Ankündigungen zunächst wieder euphorisch für den Datenschutz gepriesen, wurde dieser schon in Diskussionen hinterfragt, weil Brave bei der Suchanzeige Identifikatoren mitsendet. Aber was ist mit dem eigentlich Zweck einer Suchmaschine, der Suche?
Brave behauptet, einen eigenen Index zu haben: „Brave Search beta is based on an independent index, the first of its kind. However, for some queries, Brave can anonymously check our search results against third-party results, and mix them on the results page. This mixing is a means-to-an-end toward 100% independence. For full transparency and to measure Brave’s progress toward that goal, Brave provides a “Results independence” metric. This anonymous calculation shows the % of search results that come from Brave versus these third parties. Note that no matter the independence metric, your privacy will always be 100%.

Heise berichtet: „Anfang des Jahres wurde bekannt, dass der amerikanische Browser-Hersteller die Suchmaschinen-Technologie Tailcat aus dem Nachlass der Burda-Tochter Cliqz gekauft hat.“ Wie der eigene Index aussieht und welche „third-party results“ wie eingemischt werden, bleibt unklar.

Der Archivar und Blogger Klaus Graf hat schon andere Suchmaschinen mit Known Item Searches geprüft. Hinsichtlich der Brave Suchmaschine kommt er zu dem Ergebnis:Die neue Suchmaschine https://search.brave.com/ überzeugt mich als Google-Alternative nicht. Bei meinem großen Suchmaschinentest 2021 hätte die Suchmaschine nicht einmal das Knockout-Kriterium a) geschafft. Bei einer Auswahl der 18 Fragen ergab sich folgendes schwache Bild: 6 null Punkte, 7 zehn = Maximalpunktzahl, 8 (Bookmarkfunktion) null, 9 zehn, 13 null, 16 zehn, 18 null. Macht 30 Punkte, Google 60 Punkte (neu überprüft).“

https://brave.com/search/

Neuzeitliche Informationsvermittlung als „Suchmaschine“

Der neuzeitliche Umgang mit Informationen führte in den Metropolen zur Gründung von Informationsbüros, in dem keine persönlichen Netzwerke und Klientelbeziehungen für den Zugang zu Informationen erforderlich waren. Richard Hemmer und Daniel Meßner: Kleine Geschichte eines Arztes, der vor Langem die Suchmaschine erfand, Spektrum 28.07.2021 beschreiben, wie Théophraste Renaudot (1586–1653) 1630 in Paris das »Bureau d’adresse« gründete. Das Dienstleistungsunternehmen vermittelte gegen eine geringe Gebühr Arbeit, Wohnungen, Tiere und Gegenstände. Später gingen die Adressbüros in Zeitungsredaktionen auf, die Informationen nicht direkt vermittelten, sondern öffentlich als Anzeigen präsentierten.

Anton Tantner: Adressbüros im Europa der Frühen Neuzeit, Habilitationsschrift Wien 2011

Buchseite 3 von 5
1 2 3 4 5