Knowledge Extraction

Der Sammelband “Digital Writing Technologies in Higher Education. Theory, Research and Practice, Springer Cham 2023 ist als Open Access zugänglich. Ein Beitrag Fernando Benites: Information Retrieval and Knowledge Extraction for Academic Writing. Abstract: “The amount of unstructured scientific data in the form of documents, reports, papers, patents, and the like is exponentially increasing each year. Technological advances and their implementations emerge at a similarly fast pace, making for many disciplines a manual overview of interdisciplinary and relevant studies nearly impossible. Consequently, surveying large corpora of documents without any automation, i.e. information extraction systems, seems no longer feasible. Fortunately, most articles are now accessible through digital channels, enabling automatic information retrieval by large database systems. Popular examples of such systems are Google Scholar or Scopus. As they allow us to rapidly find relevant and high-quality citations and references to previous work, these systems are particularly valuable in academic writing. However, not all users are aware of the mechanisms underlying relevance sorting, which we will address in this chapter. For example, in addition to searching for specific terms, new tools facilitate the discovery of relevant studies by using synonyms as well as similar works/citations. The near future holds even better tools for the creation of surveys, such as automatic summary generation or automatic question-answering systems over large corpora. In this chapter, we will discuss the relevant technologies and systems and their use in the academic writing context.”

Informationsfreiheitsgesetze als Werkzeug

Ausgabe 27 der Online-Recherche Newsletter: ORN #37 An nicht-öffentliche Dokumente rankommen. “In dieser Ausgabe geht es um ein mächtiges Werkzeug: Informationsfreiheitsgesetze, kurz IFG. Sie machen ungeahnte Recherchen möglich und bringen unter Verschluss gehaltene Dokumente ans Tageslicht. Dabei helfen auch internationale Websites. Im Werkstatt-Interview berichtet Haluka Maier-Borst von seiner Daten-Recherche über die frustrierende Wartezeit auf Praxistermine.”

Datenquellen

“Im Internet und in öffentlichen Registern stecken viele Datenschätze mit Informationen über Unternehmen. Das Panel zeigt einige lohnenswerte Datenbanken und welche Geschichten mit ihrer Hilfe entstehen können. Es wird auch erklärt, wie ein Antrag auf Einsicht in das Grundbuchamt gestellt werden kann. Unter den vorgestellten Datenbanken sind das Handelsregister, eine Datenbank über Fördermittel des Bundes und eine Datenbank für Ausschreibungen in der Europäischen Union: Tenders Electronic Daily. Die Datenbanken lassen sich auch für Lokaljournalismus nutzen.”
Ein auf Youtube aufgezeichneter Livestream der Netzwerk Recherche – Jahreskonferenz 2023

Gutes Google-Fu

Google-Fu ist die scherzhafte Bezeichnung im Online-Slang, sich analog der Kampfsportart Kung-Fu Informationen durch verschiedene Suchmaschinen zu erkämpfen. Sie wird von Jack Leeming: Searching the web for science: how small mistakes create big problems. Typos, acronyms and authors’ names all present issues when trawling the literature. Can next-generation search engines do better? Nature 06.04.2023 anhand verschiedener Beispiele aus der Wissenschaft verdeutlicht. Übernahme falscher Quellen, Schreibfehler, falsche Sonderzeichen, Akronyme und Homonyme können zu falschen oder irreführenden Ergebnissen führen. Um Fehler zu vermeiden, schlägt er stufenweise Recherche in 3 Schritten vor: 1. Suche in institutionellen Bibliotheken mit Schlüsselwörtern nach Autoren. 2. Suche in spezialisierten Suchmaschinen nach diesen Autoren. 3. Suche in Google Scholar und anschließend in Google.

Suchergebnisse durch Präferenz steuern

Dirk Lewandowski: Search engines that give users control over their results, Information Today 07.03.2023 stellt die Suchmaschinen  Brave SearchNeeva und You.com vor. Traditionelle Suchmaschinen wie Google und Bing ermitteln die Relevanz der Resultate einer Suchanfrage mittels verschiedener Algorithmen, die Daten der Nutzer, die zuvor ermittelt und gespeichert wurden, einbeziehen. Im Gegensatz dazu ermöglichen diese drei Suchmaschinen, eigene Präferenzen und Quellen einzugeben. Diese neue Sichtweise kann ein völlig neues Ranking der Suchergebnisse anzeigen. Allerdings ist es genausogut möglich, dass man sich gezielt seine eigene Informationsblase schafft. “While one may question whether it is a good idea that users should choose news sources to be displayed based on their political preferences – and thereby ignoring other sources from the political spectrum, re-ranking results is what really differentiates these search engines from Google and similar search engines.” Nach Lewandowski überwiegt allerdings der Nutzen gegenüber potentiellen Risiken: “Giving users control over search results may benefit them more than slight improvements in the overall relevance of results.”

Handbuch Informationsressourcen

Das Handbuch für Bibliothekare und Informationsspezialisten steht als Open Access zum Download zur Verfügung:
“Die vollständig aktualisierte und erweiterte Neuauflage des etablierten Werks bietet Informationsspezialistinnen und -spezialisten aus allen Sparten einen umfassenden Überblick über die Entwicklungen und die Typologie wissenschaftlicher Informationsressourcen. Darauf aufbauend werden rund 430 Informationsressourcen, die für die allgemeine und fachspezifische Informationsrecherche von besonderer Bedeutung sind, in ihren Inhalten und Funktionalitäten sowie ihrer Bedeutung vorgestellt. Klassische bibliothekarische Ressourcentypen wie Bibliothekskataloge, Bibliographien, Nachschlagewerke und Portale für Fachinformationen werden dabei ebenso berücksichtigt wie Forschungsdatenverzeichnisse, Patent- und Normdatenbanken, Angebote zu Statistiken, Open-Access- und Open-Educational-Resources-Publikationen sowie Datenbanken zu Zeitungen, Bildern, Filmen und Audiomaterialien. Die Verbindung von einführender Typologie und konkreter Vorstellung zentraler Ressourcen sorgt dafür, dass das hier vermittelte Grundwissen unmittelbar in der beruflichen Praxis einsetzbar ist.”

Grundlagen der Informationswissenschaft

Grundlagen der Informationswissenschaft, Herausgegeben von: Rainer Kuhlen , Dirk Lewandowski , Wolfgang Semar und Christa Womser-Hacker, 7.Auflage De Gruyter Saur 2023 steht als Open Access zur Lektüre und Download kostenlos zur Verfügung. In 73 Artikeln wird ein umfassender Überblick über alle Aspekte gegeben. Einzelne Kapitel behandeln u.a. Information Retrieval mit den Grundlagen, Recherchestrategien, Audio- und Musik-Retrieval, Cross-Language Information Retrieval, Evaluation, Sprachmodelle und neuronale Netze, Modellierung, Informationsrecherche und Empfehlungssysteme. In einem weiteren Kapitel werden Text Mining und Date Mining behandelt.

Buchseite 1 von 2
1 2