Kritik an Google Scholar

Aaron Tay: Why EXACTLY is Google Scholar bad for evidence synthesis, systematic reviews?, in: Aaron Tay’s Musings about librarianship 12.05.2024
1. Google Scholar ranks at most 1,000 results.
2. Google Scholar has no official bulk export function
3. Google Scholar lacks features needed for high recall, high precision searching.
4. Google Scholar is not a database?!?! or Google Scholar crawls the web so it’s index is unstable
5. Google Scholar is a black box, the algorithm is not transparent or known
6. We do not understand how Google Scholar works, results are not interpretable or explainable
7. Google Scholar is just not reproducible

Grenzen der KI bei Profi-Suche

Heike Baller: Warum ich KI bei der Recherche nicht empfehlen kann. Profi-Wissen beschreibt die Grenzen der KI-Suche. “Doch die Sache hat bei den Tools rund um Recherche in der Regel einen Haken. Sie zeigen zwar, wie das Vorgehen und auch das Ergebnis aussehen, doch eine inhaltliche Auseinandersetzung mit den Ergebnissen findet in der knappen Zeit nicht statt. Mit anderen Worten, sie schauen nicht, ob die Treffer, die solche KI-gestützten Recherche-Tools auswerfen, auch tatsächlich den Anforderungen der Anfrage entsprechen. Das ist jedoch für mich ein ganz wichtiger Aspekt, der darüber entscheidet, ob ich ein Tool nutze oder nicht. Bei meinen eigenen Versuchen sehe ich häufig Ergebnisse, die mit der Anfrage nur sehr wenig zu tun haben.”

Knowledge Extraction

Der Sammelband “Digital Writing Technologies in Higher Education. Theory, Research and Practice, Springer Cham 2023 ist als Open Access zugänglich. Ein Beitrag Fernando Benites: Information Retrieval and Knowledge Extraction for Academic Writing. Abstract: “The amount of unstructured scientific data in the form of documents, reports, papers, patents, and the like is exponentially increasing each year. Technological advances and their implementations emerge at a similarly fast pace, making for many disciplines a manual overview of interdisciplinary and relevant studies nearly impossible. Consequently, surveying large corpora of documents without any automation, i.e. information extraction systems, seems no longer feasible. Fortunately, most articles are now accessible through digital channels, enabling automatic information retrieval by large database systems. Popular examples of such systems are Google Scholar or Scopus. As they allow us to rapidly find relevant and high-quality citations and references to previous work, these systems are particularly valuable in academic writing. However, not all users are aware of the mechanisms underlying relevance sorting, which we will address in this chapter. For example, in addition to searching for specific terms, new tools facilitate the discovery of relevant studies by using synonyms as well as similar works/citations. The near future holds even better tools for the creation of surveys, such as automatic summary generation or automatic question-answering systems over large corpora. In this chapter, we will discuss the relevant technologies and systems and their use in the academic writing context.”

Informationsfreiheitsgesetze als Werkzeug

Ausgabe 27 der Online-Recherche Newsletter: ORN #37 An nicht-öffentliche Dokumente rankommen. “In dieser Ausgabe geht es um ein mächtiges Werkzeug: Informationsfreiheitsgesetze, kurz IFG. Sie machen ungeahnte Recherchen möglich und bringen unter Verschluss gehaltene Dokumente ans Tageslicht. Dabei helfen auch internationale Websites. Im Werkstatt-Interview berichtet Haluka Maier-Borst von seiner Daten-Recherche über die frustrierende Wartezeit auf Praxistermine.”

Datenquellen

“Im Internet und in öffentlichen Registern stecken viele Datenschätze mit Informationen über Unternehmen. Das Panel zeigt einige lohnenswerte Datenbanken und welche Geschichten mit ihrer Hilfe entstehen können. Es wird auch erklärt, wie ein Antrag auf Einsicht in das Grundbuchamt gestellt werden kann. Unter den vorgestellten Datenbanken sind das Handelsregister, eine Datenbank über Fördermittel des Bundes und eine Datenbank für Ausschreibungen in der Europäischen Union: Tenders Electronic Daily. Die Datenbanken lassen sich auch für Lokaljournalismus nutzen.”
Ein auf Youtube aufgezeichneter Livestream der Netzwerk Recherche – Jahreskonferenz 2023

Gutes Google-Fu

Google-Fu ist die scherzhafte Bezeichnung im Online-Slang, sich analog der Kampfsportart Kung-Fu Informationen durch verschiedene Suchmaschinen zu erkämpfen. Sie wird von Jack Leeming: Searching the web for science: how small mistakes create big problems. Typos, acronyms and authors’ names all present issues when trawling the literature. Can next-generation search engines do better? Nature 06.04.2023 anhand verschiedener Beispiele aus der Wissenschaft verdeutlicht. Übernahme falscher Quellen, Schreibfehler, falsche Sonderzeichen, Akronyme und Homonyme können zu falschen oder irreführenden Ergebnissen führen. Um Fehler zu vermeiden, schlägt er stufenweise Recherche in 3 Schritten vor: 1. Suche in institutionellen Bibliotheken mit Schlüsselwörtern nach Autoren. 2. Suche in spezialisierten Suchmaschinen nach diesen Autoren. 3. Suche in Google Scholar und anschließend in Google.

Suchergebnisse durch Präferenz steuern

Dirk Lewandowski: Search engines that give users control over their results, Information Today 07.03.2023 stellt die Suchmaschinen  Brave SearchNeeva und You.com vor. Traditionelle Suchmaschinen wie Google und Bing ermitteln die Relevanz der Resultate einer Suchanfrage mittels verschiedener Algorithmen, die Daten der Nutzer, die zuvor ermittelt und gespeichert wurden, einbeziehen. Im Gegensatz dazu ermöglichen diese drei Suchmaschinen, eigene Präferenzen und Quellen einzugeben. Diese neue Sichtweise kann ein völlig neues Ranking der Suchergebnisse anzeigen. Allerdings ist es genausogut möglich, dass man sich gezielt seine eigene Informationsblase schafft. “While one may question whether it is a good idea that users should choose news sources to be displayed based on their political preferences – and thereby ignoring other sources from the political spectrum, re-ranking results is what really differentiates these search engines from Google and similar search engines.” Nach Lewandowski überwiegt allerdings der Nutzen gegenüber potentiellen Risiken: “Giving users control over search results may benefit them more than slight improvements in the overall relevance of results.”

Buchseite 1 von 2
1 2