Blog – Seite 19 – Retrieval Dreams

KI killt das Internet

Unter bezug auf den Essay von James Vincent in „The Verge“ reflektiert Adrian Lobe: Google war einmal, was kommt als Nächstes? – Die KI killt das alte Internet, vor unseren Augen entsteht gerade ein neues Web, Neue Zürcher Zeitung 04.12.2023 über den Strukturwandel des Internet. „KI könnte die Art, wie in der Wissenschaftsgesellschaft Informationen produziert und rezipiert werden, radikal verändern. Die Idee der KI-Vordenker ist es grob gesagt, das Internet in eine Box zu packen und einen neuen Hypertext zu weben. Statt Websites zu indexieren und nach Relevanz zu sortieren, wie es Google tut, werden die Texte von Wikipedia, Reddit und anderen Quellen, mit denen KI-Systeme wie Chat-GPT trainiert werden, nach einem Wahrscheinlichkeitsmodell neu arrangiert.“ Damit gehen drei Prozesse einher: Die Inhalte des Internet werden von der KI verdaut, es bleibt nur noch die technische Verbindung des Netzwerks. Indem hochwertige urheberrechtlich geschützte Inhalte sich vor automatisierten Zugriff der KI abschotten, bleibt nur der Rest, bis zuletzt KI-Systeme mit KI-Inhalten gefüttert werden. Die Such- und Filterfunktionen der Suchmaschinen werden überfordert.

Open Access Quellen

Christoph Hornung: Open-Access-Fachliteratur gezielt suchen und finden: 13 Anlaufstellen für die Recherche. IRights.info 16.05.2023
Welche Suchmaschinen und Tools gibt es, um wissenschaftliche Open-Access-Literatur zu recherchieren und zu finden? Was unterscheidet sie und wie sind die Quellen zu bewerten? Eine Auswahl der wichtigsten Werkzeuge in 13 Kategorien:
Eine sehr große Suchmaschine: BASE
Reine Open-Access-Journals: DOAJ
Für Monografien: DOAB
Verzeichnis eines Bots: Google Scholar
Lizenzierungspflichtige Datenbanken: Web of Science und Scopus
Digitalisate: Hathi Trust Library
Suche in Repositorien wie Zenodo, arXiv, SSOAR
Mehrsprachige Suche: GoTriple
Europäischer Fokus: OpenAire
Automatisierte Suche per Browser-Plugin: Unpaywall, OA Button, OA Helper
Bibliothekskataloge, WorldCat
Wissenschaftliche Netzwerke
Suche nach Forschungsdaten
Fazit: Die Mischung macht’s

Schattenbibliotheken

Georg Fischer: Schattenbibliotheken: Wie sich das Netz den Zugang zu Wissenschaft und Journalismus erzwingt. iRights.info 22.11.2023 beschreibt die Schattenbibliotheken SciHub, LibGen und Anna’s Archive.

KI überfordert die Skalierbarkeit des Internet

James Vincent: AI is killing the old web, and the new web struggles to be born, The Verge 26.06.2023 kritisiert, wie KI parasitär die Inhalte im heutigen Internet ausbeutet. „These models are trained on strata of data laid down during the last web-age, which they recreate imperfectly. Companies scrape information from the open web and refine it into machine-generated content that’s cheap to generate but less reliable. This product then competes for attention with the platforms and people that came before them. Sites and users are reckoning with these changes, trying to decide how to adapt and if they even can. “ Die Versuche von Webseiten wie Reddit, sich dagegen zu sperren, wirken hiflos. Eine neue Qualität würde aber entstehen, wenn Google durch KI generierte Zusammenfassungen der Linkinhalte präsentieren würde, die über den eigenlichen Links steht und den Traffic von diesen Seiten abzieht. „In the end, Google might kill the ecosystem that created its value, or change it so irrevocably that its own existence is threatened.“ Eine andere Gefahr besteht darin, dass KI – wie an einem Beispiel demonstriert – Informationen falsch gewichtet und statt Fachkenntnissen abgeleitete Vermutungen präsentiert. „AI-generated misinformation is insidious because it’s often invisible. It’s fluent but not grounded in real-world experience, and so it takes time and expertise to unpick. If machine-generated content supplants human authorship, it would be hard — impossible, even — to fully map the damage. And yes, people are plentiful sources of misinformation, too, but if AI systems also choke out the platforms where human expertise currently thrives, then there will be less opportunity to remedy our collective errors. „ Die Veränderungen der KI sind im Grunde nach wie vor ein Kampf um Informationen, die durch die Skalierbarkeit der KI, der neuen Fülle der Informationen verändert wird. Dies könnte auf der anderen Seite wieder zu einer Wertschätzung kontrollierter Information führen. „The new web is struggling to be born, and the decisions we make now will shape how it grows“.

Lücken in Free-Access Datenbanken

Lorena Delgado-Quiros, Isidro F. Aguillo, Alberto Martín-Martín, Emilio Delgado Lopez-Cozar, Enrique Orduña-Malea, José Luis Ortega: Why are these publications missing? Uncovering the
reasons behind the exclusion of documents in free-access scholarly database, Journal of the Association for Information Science and Technology 2023 untersuchen, warum free Access Akademische Datenbanken wissenschaftliche Publikationen nicht vollständig erfassen: „The results show that coverage differences are mainly caused by the way each service builds their databases. While classic bibliographic databases ingest almost the exact same content from Crossref (Lens and Scilit miss 0.1% and 0.2% of the records, respectively), academic search engines present lower coverage (Google Scholar does not find: 9.8%, Semantic Scholar: 10%, and Microsoft Academic: 12%). Coverage differences are mainly attributed to external factors, such as web accessibility and robot exclusion policies (39.2%–46%), and internal requirements that exclude secondary content (6.5%–11.6%).“

Handbuch Informationsfreiheit

Das Legal-Team von FragDenStaat hat ein Handbuch Informationsfreiheit erarbeitet, das auch als Open Access zugänglich ist. Der Inhalt:
Einleitung
Unsichtbare Infrastrukturen
Die Informationsfreiheit in der Europäischen Menschenrechtskonvention
Die Informationsfreiheit in der Aarhus-Konvention
Amtliche Informationen
Der Informationsbegriff nach den Umweltinformationsgesetzen
Der Informationsbegriff im VIG
Informationspflichtige Stellen
Besondere öffentliche Interessen
Geheimnisschutzvorschriften
Öffentliche Sicherheit
Verfahrensbezogene Ablehnungsgründe
Schutz personenbezogener Daten
Schutz des geistigen Eigentums und von Betriebs- oder Geschäftsgeheimnissen
Weitere Ablehnungsgründe
Verfahren
Kosten
Beauftragte für die Informationsfreiheit
Rechtsschutz
Veröffentlichungspflichten
Zugang zu Dokumenten der Europäischen Union

Open Access Resources

Fordham University Libraries haben eine Übersicht Open Access Resources erstellt aufgeteilt in Books, Journals und Databases.

Digital Research Books

Die New York Public Library hat eine Suche über wissenschaftliche Bücher („research books“), die entweder Public Domain oder unter Creative Commons Lizenz frei zugänglich sind, in Beta-Version veröffentlicht. „Digital Research Books Beta is an experimental project, now in early Beta testing, that collects digital versions of research books from many different sources, including Open Access publications, into one convenient place to search.“

Knowledge Extraction

Der Sammelband „Digital Writing Technologies in Higher Education. Theory, Research and Practice, Springer Cham 2023 ist als Open Access zugänglich. Ein Beitrag Fernando Benites: Information Retrieval and Knowledge Extraction for Academic Writing. Abstract: „The amount of unstructured scientific data in the form of documents, reports, papers, patents, and the like is exponentially increasing each year. Technological advances and their implementations emerge at a similarly fast pace, making for many disciplines a manual overview of interdisciplinary and relevant studies nearly impossible. Consequently, surveying large corpora of documents without any automation, i.e. information extraction systems, seems no longer feasible. Fortunately, most articles are now accessible through digital channels, enabling automatic information retrieval by large database systems. Popular examples of such systems are Google Scholar or Scopus. As they allow us to rapidly find relevant and high-quality citations and references to previous work, these systems are particularly valuable in academic writing. However, not all users are aware of the mechanisms underlying relevance sorting, which we will address in this chapter. For example, in addition to searching for specific terms, new tools facilitate the discovery of relevant studies by using synonyms as well as similar works/citations. The near future holds even better tools for the creation of surveys, such as automatic summary generation or automatic question-answering systems over large corpora. In this chapter, we will discuss the relevant technologies and systems and their use in the academic writing context.“

Deepfakes entlarven mit OSINT

Deepfakes entlarven mit OSINT (Open Source Intelligence). Verschiedene Techniken werden kurz vorgestellt: Unmasking Deepfakes: Utilizing OSINT Techniques for Detecting Digital Deception Medium OSINT Team 27.09.2023

Buchseite 19 von 41

« Previous 1 … 17 18 19 20 21 … 41 Next »