Grenzen der KI bei Profi-Suche

Heike Baller: Warum ich KI bei der Recherche nicht empfehlen kann. Profi-Wissen beschreibt die Grenzen der KI-Suche. „Doch die Sache hat bei den Tools rund um Recherche in der Regel einen Haken. Sie zeigen zwar, wie das Vorgehen und auch das Ergebnis aussehen, doch eine inhaltliche Auseinandersetzung mit den Ergebnissen findet in der knappen Zeit nicht statt. Mit anderen Worten, sie schauen nicht, ob die Treffer, die solche KI-gestützten Recherche-Tools auswerfen, auch tatsächlich den Anforderungen der Anfrage entsprechen. Das ist jedoch für mich ein ganz wichtiger Aspekt, der darüber entscheidet, ob ich ein Tool nutze oder nicht. Bei meinen eigenen Versuchen sehe ich häufig Ergebnisse, die mit der Anfrage nur sehr wenig zu tun haben.“

OSINT Newsletter

In dem wöchentlichen Newsletter „Week in OSINT“ vom SectorQ35 werden Tipps und Tools zu OSINT vorgestellt: „Here you can find all the published articles (still migrating some from Medium. Including your weekly dose of OSINT news published every Monday at 8:00 AM CEST!“

KI killt das Internet

Unter bezug auf den Essay von James Vincent in „The Verge“ reflektiert Adrian Lobe: Google war einmal, was kommt als Nächstes? – Die KI killt das alte Internet, vor unseren Augen entsteht gerade ein neues Web, Neue Zürcher Zeitung 04.12.2023 über den Strukturwandel des Internet. „KI könnte die Art, wie in der Wissenschaftsgesellschaft Informationen produziert und rezipiert werden, radikal verändern. Die Idee der KI-Vordenker ist es grob gesagt, das Internet in eine Box zu packen und einen neuen Hypertext zu weben. Statt Websites zu indexieren und nach Relevanz zu sortieren, wie es Google tut, werden die Texte von Wikipedia, Reddit und anderen Quellen, mit denen KI-Systeme wie Chat-GPT trainiert werden, nach einem Wahrscheinlichkeitsmodell neu arrangiert.“ Damit gehen drei Prozesse einher: Die Inhalte des Internet werden von der KI verdaut, es bleibt nur noch die technische Verbindung des Netzwerks. Indem hochwertige urheberrechtlich geschützte Inhalte sich vor automatisierten Zugriff der KI abschotten, bleibt nur der Rest, bis zuletzt KI-Systeme mit KI-Inhalten gefüttert werden. Die Such- und Filterfunktionen der Suchmaschinen werden überfordert.

Lücken in Free-Access Datenbanken

Lorena Delgado-Quiros, Isidro F. Aguillo, Alberto Martín-Martín, Emilio Delgado Lopez-Cozar, Enrique Orduña-Malea, José Luis Ortega: Why are these publications missing? Uncovering the
reasons behind the exclusion of documents in free-access scholarly database, Journal of the Association for Information Science and Technology 2023
untersuchen, warum free Access Akademische Datenbanken wissenschaftliche Publikationen nicht vollständig erfassen: „The results show that coverage differences are mainly caused by the way each service builds their databases. While classic bibliographic databases ingest almost the exact same content from Crossref (Lens and Scilit miss 0.1% and 0.2% of the records, respectively), academic search engines present lower coverage (Google Scholar does not find: 9.8%, Semantic Scholar: 10%, and Microsoft Academic: 12%). Coverage differences are mainly attributed to external factors, such as web accessibility and robot exclusion policies (39.2%–46%), and internal requirements that exclude secondary content (6.5%–11.6%).“

Digital Research Books

Die New York Public Library hat eine Suche über wissenschaftliche Bücher („research books“), die entweder Public Domain oder unter Creative Commons Lizenz frei zugänglich sind, in Beta-Version veröffentlicht. „Digital Research Books Beta is an experimental project, now in early Beta testing, that collects digital versions of research books from many different sources, including Open Access publications, into one convenient place to search.“

Knowledge Extraction

Der Sammelband „Digital Writing Technologies in Higher Education. Theory, Research and Practice, Springer Cham 2023 ist als Open Access zugänglich. Ein Beitrag Fernando Benites: Information Retrieval and Knowledge Extraction for Academic Writing. Abstract: „The amount of unstructured scientific data in the form of documents, reports, papers, patents, and the like is exponentially increasing each year. Technological advances and their implementations emerge at a similarly fast pace, making for many disciplines a manual overview of interdisciplinary and relevant studies nearly impossible. Consequently, surveying large corpora of documents without any automation, i.e. information extraction systems, seems no longer feasible. Fortunately, most articles are now accessible through digital channels, enabling automatic information retrieval by large database systems. Popular examples of such systems are Google Scholar or Scopus. As they allow us to rapidly find relevant and high-quality citations and references to previous work, these systems are particularly valuable in academic writing. However, not all users are aware of the mechanisms underlying relevance sorting, which we will address in this chapter. For example, in addition to searching for specific terms, new tools facilitate the discovery of relevant studies by using synonyms as well as similar works/citations. The near future holds even better tools for the creation of surveys, such as automatic summary generation or automatic question-answering systems over large corpora. In this chapter, we will discuss the relevant technologies and systems and their use in the academic writing context.“

Buchseite 3 von 5
1 2 3 4 5