Retrieval Benchmark

Hongjin Su, Howard Yen, Mengzhou Xia, Weijia Shi, Niklas Muennighoff, Han-yu Wang, Haisu Liu, Quan Shi, Zachary S. Siegel, Michael Tang, Ruoxi Sun, Jinsung Yoon, Sercan O. Arik, Danqi Chen, Tao Yu: BRIGHT: A Realistic and Challenging Benchmark for Reasoning-Intensive Retrieval
Abstract: „Bestehende Retrieval-Benchmarks bestehen in erster Linie aus informationssuchenden Abfragen (z.B. aggregierte Fragen von Suchmaschinen), bei denen ein Keyword- oder semantisch-basiertes Retrieval in der Regel ausreichend ist. Viele komplexe Abfragen in der Praxis erfordern jedoch eine gründliche Argumentation, um relevante Dokumente zu identifizieren, die über den Abgleich von Oberflächenformen hinausgehen. Um beispielsweise eine Dokumentation für eine Codierungsfrage zu finden, müssen Sie die Logik und Syntax der beteiligten Funktionen verstehen. Um das Retrieval bei solch anspruchsvollen Abfragen besser zu vergleichen, führen wir BRIGHT ein, den ersten Text-Retrieval-Benchmark, der intensives Denken erfordert, um relevante Dokumente abzurufen. Unser Datensatz besteht aus 1.384 realen Abfragen aus verschiedenen Bereichen wie Wirtschaft, Psychologie, Mathematik und Programmierung. Diese Abfragen basieren auf natürlich vorkommenden und sorgfältig kuratierten menschlichen Daten. Eine umfangreiche Evaluierung zeigt, dass selbst moderne Retrieval-Modelle auf BRIGHT schlecht abschneiden. Das führende Modell auf der MTEB-Bestenliste (Muennighoff et al., 2023) SFR-Embedding-Mistral (Meng et al., 2024), das eine Punktzahl von 59,0 nDCG@10,1 erreicht, erzeugt eine Punktzahl von nDCG@10 von 18,3 auf BRIGHT. Wir zeigen, dass die Einbeziehung expliziter Argumentation für die Abfrage die Abrufleistung um bis zu 12,2 Punkte verbessert. Darüber hinaus steigert die Einbeziehung von abgerufenen Dokumenten aus dem leistungsstärksten Retriever die Leistung bei der Beantwortung von Fragen. Wir glauben, dass BRIGHT den Weg für zukünftige Forschungen zu Rückholsystemen in realistischeren und anspruchsvolleren Umgebungen ebnet.“

Digitaler Sprachumbau

Adrian Lobe: Wenn Sie diese Wörter verwenden, hat die KI schon Ihr Hirn verändert, Die Welt 20.05.2025 (hinter der Bezahlschranke)
Chatsbots verändern das Wording in wissenschaftlichen Fachpublikationen. Insbesondere steigt die Zahl der Stilwörter wie „wesentlich“ und „präsentieren“. Außerdem steigt die Gefahr gefälschter Publikationen durch die Papermills. „Sprachmodelle mögen ein nützliches Tool sein, um Studienergebnisse zusammenzufassen. Aber sie verändern auch das Publikationswesen, weil sich jeder mit frei zugänglichen Chatsbots seine Studie zusammenzuprompten.“ Auch bei gesprochener Sprache, bei der Untersuchung von 280.000 englischsprachiger YouTube-Videos von Präsentationen werden einschlägige Begriffe festgestellt: „Der Mensch spricht die Sprache der Maschinen.“ Die Gefahr von weitergehenden Manipulation besteht. „Man muss dem Menschen keine Gehirnchips implantieren, um in ihre Köpfe einzudringen – es reicht, ihre Sprache zu verändern.“

Angriff der Rechten auf Wikipedia

Michael Moorstedt: Nicht zu verkaufen. Boykottaufrufe, Übernahmefantasien und die Einschüchterung von Mitarbeitern: Wie die neue Rechte Wikipedia auf Linie bringen will., Süddeutsche Zeitung 05.05.2025 (hinter der Bezahlschranke) Es wird beschrieben, wie Elon Musk sich über die Wikipedia-Einträge, die ihn betreffen empört. Angegriffen wird Wikipedia, weil bestimmte rechte Nachrichtenseiten nicht als seriös akzeptiert werden und es eine Programm für „Sicherheit und Inklusion“ und „Fairness“ gibt, dass unterrepräsentierte Themen fördern und koordinierte Desinformationskampagnen stoppen soll. „Unliebsame Berichterstattung wird im Neusprech zu ‚Fake News‘. die maulige Forderung, ‚alle Meinungen zu hören‘ führt zur Leugnung von Klimakrise und Geschichtsrevisionismus. Faktentreuses Dokumentieren zählt hier schon zu einem unverzeihlichen Affront, Neutralität ist nicht vorgesehen.“ Neben dem Fragenkatalog eines Staatsanwalts, die auf den Status der Steuerbefreiung zielt, „sind die Attacken gegen Wikipedia Teil eines konzertierten Plans des ultrakonservativen Thinktanks Heritage Foundation.“ Allerdings: „Trotz ihrer Größe zeigt sich die Enzyklopädie dann auch erstaunlich resilient gegenüber den Attacken von rechts. Die im System verbaute Transparenz macht Manipulation schnelle sichtbar und korrigierbar.“

Browser Vivaldi mit VPN

Stephan Scheuer: Jon von Tetzchner. Europas Browser-Rebell sieht Trump positiv. Mit seinem Browser Vivaldi hat der Unternehmer eine europäische Alternative zu Google Chrome geschaffen. Verhilft die erratische US-Politik nun zum Durchbruch? Handelsblatt 16.4.2025 Papierausgabe

Tetzchner, vorher einer der Gründer des Browsers Opera, hat 2015 den Browser Vivaldi gestartet. Er grenzt sich ab von den datensammelnden Browser sowie von Firefox (aufgrund der Nähe zu Google), „Tatsächlich verzichtet Vivaldi auf Tracking und Werbung, finanziert sich durch Partnerschaften mit alternativen Suchmaschinen wie DuckDuckGo oder Ecosia und bietet umfangreiche Anpassungsmöglichkeiten.“ Allerdings basiert es auch auf Chromium. Vivaldi hat in seinen Desktop Browser den schweizerischen VPN-Dienst integriert. „Beide Unternehmen teilen eine klare Vision: ein freies Internet ohne Überwachung durch Big Tech.“

Buchseite 5 von 25
1 3 4 5 6 7 25