OSINT Newsletter

In dem wöchentlichen Newsletter “Week in OSINT” vom SectorQ35 werden Tipps und Tools zu OSINT vorgestellt: “Here you can find all the published articles (still migrating some from Medium. Including your weekly dose of OSINT news published every Monday at 8:00 AM CEST!”

KI killt das Internet

Unter bezug auf den Essay von James Vincent in “The Verge” reflektiert Adrian Lobe: Google war einmal, was kommt als Nächstes? – Die KI killt das alte Internet, vor unseren Augen entsteht gerade ein neues Web, Neue Zürcher Zeitung 04.12.2023 über den Strukturwandel des Internet. “KI könnte die Art, wie in der Wissenschaftsgesellschaft Informationen produziert und rezipiert werden, radikal verändern. Die Idee der KI-Vordenker ist es grob gesagt, das Internet in eine Box zu packen und einen neuen Hypertext zu weben. Statt Websites zu indexieren und nach Relevanz zu sortieren, wie es Google tut, werden die Texte von Wikipedia, Reddit und anderen Quellen, mit denen KI-Systeme wie Chat-GPT trainiert werden, nach einem Wahrscheinlichkeitsmodell neu arrangiert.” Damit gehen drei Prozesse einher: Die Inhalte des Internet werden von der KI verdaut, es bleibt nur noch die technische Verbindung des Netzwerks. Indem hochwertige urheberrechtlich geschützte Inhalte sich vor automatisierten Zugriff der KI abschotten, bleibt nur der Rest, bis zuletzt KI-Systeme mit KI-Inhalten gefüttert werden. Die Such- und Filterfunktionen der Suchmaschinen werden überfordert.

Lücken in Free-Access Datenbanken

Lorena Delgado-Quiros, Isidro F. Aguillo, Alberto Martín-Martín, Emilio Delgado Lopez-Cozar, Enrique Orduña-Malea, José Luis Ortega: Why are these publications missing? Uncovering the
reasons behind the exclusion of documents in free-access scholarly database, Journal of the Association for Information Science and Technology 2023
untersuchen, warum free Access Akademische Datenbanken wissenschaftliche Publikationen nicht vollständig erfassen: “The results show that coverage differences are mainly caused by the way each service builds their databases. While classic bibliographic databases ingest almost the exact same content from Crossref (Lens and Scilit miss 0.1% and 0.2% of the records, respectively), academic search engines present lower coverage (Google Scholar does not find: 9.8%, Semantic Scholar: 10%, and Microsoft Academic: 12%). Coverage differences are mainly attributed to external factors, such as web accessibility and robot exclusion policies (39.2%–46%), and internal requirements that exclude secondary content (6.5%–11.6%).”

Digital Research Books

Die New York Public Library hat eine Suche über wissenschaftliche Bücher (“research books”), die entweder Public Domain oder unter Creative Commons Lizenz frei zugänglich sind, in Beta-Version veröffentlicht. “Digital Research Books Beta is an experimental project, now in early Beta testing, that collects digital versions of research books from many different sources, including Open Access publications, into one convenient place to search.”

Knowledge Extraction

Der Sammelband “Digital Writing Technologies in Higher Education. Theory, Research and Practice, Springer Cham 2023 ist als Open Access zugänglich. Ein Beitrag Fernando Benites: Information Retrieval and Knowledge Extraction for Academic Writing. Abstract: “The amount of unstructured scientific data in the form of documents, reports, papers, patents, and the like is exponentially increasing each year. Technological advances and their implementations emerge at a similarly fast pace, making for many disciplines a manual overview of interdisciplinary and relevant studies nearly impossible. Consequently, surveying large corpora of documents without any automation, i.e. information extraction systems, seems no longer feasible. Fortunately, most articles are now accessible through digital channels, enabling automatic information retrieval by large database systems. Popular examples of such systems are Google Scholar or Scopus. As they allow us to rapidly find relevant and high-quality citations and references to previous work, these systems are particularly valuable in academic writing. However, not all users are aware of the mechanisms underlying relevance sorting, which we will address in this chapter. For example, in addition to searching for specific terms, new tools facilitate the discovery of relevant studies by using synonyms as well as similar works/citations. The near future holds even better tools for the creation of surveys, such as automatic summary generation or automatic question-answering systems over large corpora. In this chapter, we will discuss the relevant technologies and systems and their use in the academic writing context.”

Informationsfreiheitsgesetze als Werkzeug

Ausgabe 27 der Online-Recherche Newsletter: ORN #37 An nicht-öffentliche Dokumente rankommen. “In dieser Ausgabe geht es um ein mächtiges Werkzeug: Informationsfreiheitsgesetze, kurz IFG. Sie machen ungeahnte Recherchen möglich und bringen unter Verschluss gehaltene Dokumente ans Tageslicht. Dabei helfen auch internationale Websites. Im Werkstatt-Interview berichtet Haluka Maier-Borst von seiner Daten-Recherche über die frustrierende Wartezeit auf Praxistermine.”

Datenquellen

“Im Internet und in öffentlichen Registern stecken viele Datenschätze mit Informationen über Unternehmen. Das Panel zeigt einige lohnenswerte Datenbanken und welche Geschichten mit ihrer Hilfe entstehen können. Es wird auch erklärt, wie ein Antrag auf Einsicht in das Grundbuchamt gestellt werden kann. Unter den vorgestellten Datenbanken sind das Handelsregister, eine Datenbank über Fördermittel des Bundes und eine Datenbank für Ausschreibungen in der Europäischen Union: Tenders Electronic Daily. Die Datenbanken lassen sich auch für Lokaljournalismus nutzen.”
Ein auf Youtube aufgezeichneter Livestream der Netzwerk Recherche – Jahreskonferenz 2023

Buchseite 1 von 3
1 2 3