KI überfordert die Skalierbarkeit des Internet

James Vincent: AI is killing the old web, and the new web struggles to be born, The Verge 26.06.2023 kritisiert, wie KI parasitär die Inhalte im heutigen Internet ausbeutet. “These models are trained on strata of data laid down during the last web-age, which they recreate imperfectly. Companies scrape information from the open web and refine it into machine-generated content that’s cheap to generate but less reliable. This product then competes for attention with the platforms and people that came before them. Sites and users are reckoning with these changes, trying to decide how to adapt and if they even can. ” Die Versuche von Webseiten wie Reddit, sich dagegen zu sperren, wirken hiflos. Eine neue Qualität würde aber entstehen, wenn Google durch KI generierte Zusammenfassungen der Linkinhalte präsentieren würde, die über den eigenlichen Links steht und den Traffic von diesen Seiten abzieht. “In the end, Google might kill the ecosystem that created its value, or change it so irrevocably that its own existence is threatened.” Eine andere Gefahr besteht darin, dass KI – wie an einem Beispiel demonstriert – Informationen falsch gewichtet und statt Fachkenntnissen abgeleitete Vermutungen präsentiert. “AI-generated misinformation is insidious because it’s often invisible. It’s fluent but not grounded in real-world experience, and so it takes time and expertise to unpick. If machine-generated content supplants human authorship, it would be hard — impossible, even — to fully map the damage. And yes, people are plentiful sources of misinformation, too, but if AI systems also choke out the platforms where human expertise currently thrives, then there will be less opportunity to remedy our collective errors. “ Die Veränderungen der KI sind im Grunde nach wie vor ein Kampf um Informationen, die durch die Skalierbarkeit der KI, der neuen Fülle der Informationen verändert wird. Dies könnte auf der anderen Seite wieder zu einer Wertschätzung kontrollierter Information führen. “The new web is struggling to be born, and the decisions we make now will shape how it grows”.

Lücken in Free-Access Datenbanken

Lorena Delgado-Quiros, Isidro F. Aguillo, Alberto Martín-Martín, Emilio Delgado Lopez-Cozar, Enrique Orduña-Malea, José Luis Ortega: Why are these publications missing? Uncovering the
reasons behind the exclusion of documents in free-access scholarly database, Journal of the Association for Information Science and Technology 2023
untersuchen, warum free Access Akademische Datenbanken wissenschaftliche Publikationen nicht vollständig erfassen: “The results show that coverage differences are mainly caused by the way each service builds their databases. While classic bibliographic databases ingest almost the exact same content from Crossref (Lens and Scilit miss 0.1% and 0.2% of the records, respectively), academic search engines present lower coverage (Google Scholar does not find: 9.8%, Semantic Scholar: 10%, and Microsoft Academic: 12%). Coverage differences are mainly attributed to external factors, such as web accessibility and robot exclusion policies (39.2%–46%), and internal requirements that exclude secondary content (6.5%–11.6%).”

Handbuch Informationsfreiheit

Das Legal-Team von FragDenStaat hat ein Handbuch Informationsfreiheit erarbeitet, das auch als Open Access zugänglich ist. Der Inhalt:
Einleitung
Unsichtbare Infrastrukturen
Die Informationsfreiheit in der Europäischen Menschenrechtskonvention
Die Informationsfreiheit in der Aarhus-Konvention
Amtliche Informationen
Der Informationsbegriff nach den Umweltinformationsgesetzen
Der Informationsbegriff im VIG
Informationspflichtige Stellen
Besondere öffentliche Interessen
Geheimnisschutzvorschriften
Öffentliche Sicherheit
Verfahrensbezogene Ablehnungsgründe
Schutz personenbezogener Daten
Schutz des geistigen Eigentums und von Betriebs- oder Geschäftsgeheimnissen
Weitere Ablehnungsgründe
Verfahren
Kosten
Beauftragte für die Informationsfreiheit
Rechtsschutz
Veröffentlichungspflichten
Zugang zu Dokumenten der Europäischen Union

Digital Research Books

Die New York Public Library hat eine Suche über wissenschaftliche Bücher (“research books”), die entweder Public Domain oder unter Creative Commons Lizenz frei zugänglich sind, in Beta-Version veröffentlicht. “Digital Research Books Beta is an experimental project, now in early Beta testing, that collects digital versions of research books from many different sources, including Open Access publications, into one convenient place to search.”

Knowledge Extraction

Der Sammelband “Digital Writing Technologies in Higher Education. Theory, Research and Practice, Springer Cham 2023 ist als Open Access zugänglich. Ein Beitrag Fernando Benites: Information Retrieval and Knowledge Extraction for Academic Writing. Abstract: “The amount of unstructured scientific data in the form of documents, reports, papers, patents, and the like is exponentially increasing each year. Technological advances and their implementations emerge at a similarly fast pace, making for many disciplines a manual overview of interdisciplinary and relevant studies nearly impossible. Consequently, surveying large corpora of documents without any automation, i.e. information extraction systems, seems no longer feasible. Fortunately, most articles are now accessible through digital channels, enabling automatic information retrieval by large database systems. Popular examples of such systems are Google Scholar or Scopus. As they allow us to rapidly find relevant and high-quality citations and references to previous work, these systems are particularly valuable in academic writing. However, not all users are aware of the mechanisms underlying relevance sorting, which we will address in this chapter. For example, in addition to searching for specific terms, new tools facilitate the discovery of relevant studies by using synonyms as well as similar works/citations. The near future holds even better tools for the creation of surveys, such as automatic summary generation or automatic question-answering systems over large corpora. In this chapter, we will discuss the relevant technologies and systems and their use in the academic writing context.”

KI-Ressourcen

Tabellarisch wird eine Übersicht über KI-Ressourcen im Kontext von akademischen Lese- und Schreibprozessen wiedergegeben: Literaturrecherche, Textverstehen, Textproduktion, Tectbearbeitung/ -Korrektur, Feedback-Tools, Textklassifizierung, übergreifende Assistenzsysteme, Übersichten zu generativen KI-Tools. “Hier geben wir einen Überblick über KI-Tools im Kontext von akademischen Lese- und Schreibprozessen. Diese Liste erfüllt weder Werbezwecke noch sind damit Aussagen über die Qualität der jeweiligen Tools verbunden. Im Zuge der gegenwärtig rasanten Entwicklung KI-gestützter Software hat diese Übersicht auch keinen Anspruch auf Vollständigkeit, versteht sich aber als Living Document.”

https://www.vkkiwa.de/ki-ressourcen/

Buchseite 5 von 27
1 3 4 5 6 7 27