Information Retrieval Vorlesung

Ghislain Fourny, senior scientist in the Department of Computer Science at ETH Zurich, hat Folge von 30 Vorlesungen zu Information Retrieval gehalten: Ghislain Fourny’s lectures:
Introduction (1/2) – Information Retrieval – ETH Zurich – Spring 2024
Introduction (2/2) – Information Retrieval – ETH Zurich – Spring 2024
Boolean retrieval (1/2) – Information Retrieval – ETH Zurich – Spring 2024
Boolean retrieval (2/2) – Information Retrieval – ETH Zurich – Spring 2024
Term vocabulary (1/3) – Information Retrieval – ETH Zurich – Spring 2024
Term vocabulary (2/3) – Information Retrieval – ETH Zurich – Spring 2024
Term vocabulary (3/3) – Information Retrieval – ETH Zurich – Spring 2024
Tolerant retrieval (1/4) – Information Retrieval – ETH Zurich – Spring 2024
Tolerant retrieval (2/4) – Information Retrieval – ETH Zurich – Spring 2024
Tolerant retrieval (3/4) – Information Retrieval – ETH Zurich – Spring 2024
Tolerant retrieval (4/4) – Information Retrieval – ETH Zurich – Spring 2024
Index construction (1/3) – Information Retrieval – ETH Zurich – Spring 2024
Index construction (2/3) – Information Retrieval – ETH Zurich – Spring 2024
Index construction (3/3) – Information Retrieval – ETH Zurich – Spring 2024
Index compression (1/3) – Information Retrieval – ETH Zurich – Spring 2024
Index compression (2/3) – Information Retrieval – ETH Zurich – Spring 2024
Index compression (3/3) – Information Retrieval – ETH Zurich – Spring 2024
Vector space model (1/2) – Information Retrieval – ETH Zurich – Spring 2024
Vector space model (2/2) – Information Retrieval – ETH Zurich – Spring 2024
Vector databases (1/1) – Information Retrieval – ETH Zurich – Spring 2024
Evaluation (1/1) – Information Retrieval – ETH Zurich – Spring 2024
Probabilistic information retrieval (1/4) – Information Retrieval – ETH Zurich – Spring 2024
Probabilistic information retrieval (2/4) – Information Retrieval – ETH Zurich – Spring 2024
Probabilistic information retrieval (3/4) – Information Retrieval – ETH Zurich – Spring 2024
Probabilistic information retrieval (4/4) – Information Retrieval – ETH Zurich – Spring 2024
Language models (1/3) – Information Retrieval – ETH Zurich – Spring 2024
Language models (2/3) – Information Retrieval – ETH Zurich – Spring 2024
Language models (3/3) – Information Retrieval – ETH Zurich – Spring 2024
Wrap up (1/2) – Information Retrieval – ETH Zurich – Spring 2024
Wrap up (2/2) – Information Retrieval – ETH Zurich – Spring 2024

Kritik an Google Scholar

Aaron Tay: Why EXACTLY is Google Scholar bad for evidence synthesis, systematic reviews?, in: Aaron Tay’s Musings about librarianship 12.05.2024
1. Google Scholar ranks at most 1,000 results.
2. Google Scholar has no official bulk export function
3. Google Scholar lacks features needed for high recall, high precision searching.
4. Google Scholar is not a database?!?! or Google Scholar crawls the web so it’s index is unstable
5. Google Scholar is a black box, the algorithm is not transparent or known
6. We do not understand how Google Scholar works, results are not interpretable or explainable
7. Google Scholar is just not reproducible

Grenzen der KI bei Profi-Suche

Heike Baller: Warum ich KI bei der Recherche nicht empfehlen kann. Profi-Wissen beschreibt die Grenzen der KI-Suche. “Doch die Sache hat bei den Tools rund um Recherche in der Regel einen Haken. Sie zeigen zwar, wie das Vorgehen und auch das Ergebnis aussehen, doch eine inhaltliche Auseinandersetzung mit den Ergebnissen findet in der knappen Zeit nicht statt. Mit anderen Worten, sie schauen nicht, ob die Treffer, die solche KI-gestützten Recherche-Tools auswerfen, auch tatsächlich den Anforderungen der Anfrage entsprechen. Das ist jedoch für mich ein ganz wichtiger Aspekt, der darüber entscheidet, ob ich ein Tool nutze oder nicht. Bei meinen eigenen Versuchen sehe ich häufig Ergebnisse, die mit der Anfrage nur sehr wenig zu tun haben.”

Knowledge Extraction

Der Sammelband “Digital Writing Technologies in Higher Education. Theory, Research and Practice, Springer Cham 2023 ist als Open Access zugänglich. Ein Beitrag Fernando Benites: Information Retrieval and Knowledge Extraction for Academic Writing. Abstract: “The amount of unstructured scientific data in the form of documents, reports, papers, patents, and the like is exponentially increasing each year. Technological advances and their implementations emerge at a similarly fast pace, making for many disciplines a manual overview of interdisciplinary and relevant studies nearly impossible. Consequently, surveying large corpora of documents without any automation, i.e. information extraction systems, seems no longer feasible. Fortunately, most articles are now accessible through digital channels, enabling automatic information retrieval by large database systems. Popular examples of such systems are Google Scholar or Scopus. As they allow us to rapidly find relevant and high-quality citations and references to previous work, these systems are particularly valuable in academic writing. However, not all users are aware of the mechanisms underlying relevance sorting, which we will address in this chapter. For example, in addition to searching for specific terms, new tools facilitate the discovery of relevant studies by using synonyms as well as similar works/citations. The near future holds even better tools for the creation of surveys, such as automatic summary generation or automatic question-answering systems over large corpora. In this chapter, we will discuss the relevant technologies and systems and their use in the academic writing context.”

Informationsfreiheitsgesetze als Werkzeug

Ausgabe 27 der Online-Recherche Newsletter: ORN #37 An nicht-öffentliche Dokumente rankommen. “In dieser Ausgabe geht es um ein mächtiges Werkzeug: Informationsfreiheitsgesetze, kurz IFG. Sie machen ungeahnte Recherchen möglich und bringen unter Verschluss gehaltene Dokumente ans Tageslicht. Dabei helfen auch internationale Websites. Im Werkstatt-Interview berichtet Haluka Maier-Borst von seiner Daten-Recherche über die frustrierende Wartezeit auf Praxistermine.”

Buchseite 1 von 2
1 2