Webarchiv der DNB

Marina Strohm: Die Herausforderung eines Webarchivs, Blog der Deutschen Nationalbibliothek 17.11.2023 gibt einen Überblick über den aktuellen Stand des Webarchivs. „Aktuell können fast 60.000 Momentaufnahmen von knapp 8.000 deutschen Websites zur Recherche genutzt werden.“ Angesicht von 17 Millionen Websites mit der Domain-Endung .de ist allerdings nur ein winziger Bruchteil des Angebots.
Seit 2012 sammelt die Deutsche Nationalbibliothek Websites aus dem deutschen Raum. Mit einem Crawler wird eine Momentaufnahme der Website erstellt und diese wird in dem Katalog verzeichnet.

KI killt das Internet

Unter bezug auf den Essay von James Vincent in „The Verge“ reflektiert Adrian Lobe: Google war einmal, was kommt als Nächstes? – Die KI killt das alte Internet, vor unseren Augen entsteht gerade ein neues Web, Neue Zürcher Zeitung 04.12.2023 über den Strukturwandel des Internet. „KI könnte die Art, wie in der Wissenschaftsgesellschaft Informationen produziert und rezipiert werden, radikal verändern. Die Idee der KI-Vordenker ist es grob gesagt, das Internet in eine Box zu packen und einen neuen Hypertext zu weben. Statt Websites zu indexieren und nach Relevanz zu sortieren, wie es Google tut, werden die Texte von Wikipedia, Reddit und anderen Quellen, mit denen KI-Systeme wie Chat-GPT trainiert werden, nach einem Wahrscheinlichkeitsmodell neu arrangiert.“ Damit gehen drei Prozesse einher: Die Inhalte des Internet werden von der KI verdaut, es bleibt nur noch die technische Verbindung des Netzwerks. Indem hochwertige urheberrechtlich geschützte Inhalte sich vor automatisierten Zugriff der KI abschotten, bleibt nur der Rest, bis zuletzt KI-Systeme mit KI-Inhalten gefüttert werden. Die Such- und Filterfunktionen der Suchmaschinen werden überfordert.

Open Access Quellen

Christoph Hornung: Open-Access-Fachliteratur gezielt suchen und finden: 13 Anlaufstellen für die Recherche. IRights.info 16.05.2023
Welche Suchmaschinen und Tools gibt es, um wissenschaftliche Open-Access-Literatur zu recherchieren und zu finden? Was unterscheidet sie und wie sind die Quellen zu bewerten? Eine Auswahl der wichtigsten Werkzeuge in 13 Kategorien:
Eine sehr große Suchmaschine: BASE
Reine Open-Access-Journals: DOAJ
Für Monografien: DOAB
Verzeichnis eines Bots: Google Scholar
Lizenzierungspflichtige Datenbanken: Web of Science und Scopus
Digitalisate: Hathi Trust Library
Suche in Repositorien wie Zenodo, arXiv, SSOAR
Mehrsprachige Suche: GoTriple
Europäischer Fokus: OpenAire
Automatisierte Suche per Browser-Plugin: Unpaywall, OA Button, OA Helper
Bibliothekskataloge, WorldCat
Wissenschaftliche Netzwerke
Suche nach Forschungsdaten
Fazit: Die Mischung macht’s

KI überfordert die Skalierbarkeit des Internet

James Vincent: AI is killing the old web, and the new web struggles to be born, The Verge 26.06.2023 kritisiert, wie KI parasitär die Inhalte im heutigen Internet ausbeutet. „These models are trained on strata of data laid down during the last web-age, which they recreate imperfectly. Companies scrape information from the open web and refine it into machine-generated content that’s cheap to generate but less reliable. This product then competes for attention with the platforms and people that came before them. Sites and users are reckoning with these changes, trying to decide how to adapt and if they even can. “ Die Versuche von Webseiten wie Reddit, sich dagegen zu sperren, wirken hiflos. Eine neue Qualität würde aber entstehen, wenn Google durch KI generierte Zusammenfassungen der Linkinhalte präsentieren würde, die über den eigenlichen Links steht und den Traffic von diesen Seiten abzieht. „In the end, Google might kill the ecosystem that created its value, or change it so irrevocably that its own existence is threatened.“ Eine andere Gefahr besteht darin, dass KI – wie an einem Beispiel demonstriert – Informationen falsch gewichtet und statt Fachkenntnissen abgeleitete Vermutungen präsentiert. „AI-generated misinformation is insidious because it’s often invisible. It’s fluent but not grounded in real-world experience, and so it takes time and expertise to unpick. If machine-generated content supplants human authorship, it would be hard — impossible, even — to fully map the damage. And yes, people are plentiful sources of misinformation, too, but if AI systems also choke out the platforms where human expertise currently thrives, then there will be less opportunity to remedy our collective errors. „ Die Veränderungen der KI sind im Grunde nach wie vor ein Kampf um Informationen, die durch die Skalierbarkeit der KI, der neuen Fülle der Informationen verändert wird. Dies könnte auf der anderen Seite wieder zu einer Wertschätzung kontrollierter Information führen. „The new web is struggling to be born, and the decisions we make now will shape how it grows“.

Handbuch Informationsfreiheit

Das Legal-Team von FragDenStaat hat ein Handbuch Informationsfreiheit erarbeitet, das auch als Open Access zugänglich ist. Der Inhalt:
Einleitung
Unsichtbare Infrastrukturen
Die Informationsfreiheit in der Europäischen Menschenrechtskonvention
Die Informationsfreiheit in der Aarhus-Konvention
Amtliche Informationen
Der Informationsbegriff nach den Umweltinformationsgesetzen
Der Informationsbegriff im VIG
Informationspflichtige Stellen
Besondere öffentliche Interessen
Geheimnisschutzvorschriften
Öffentliche Sicherheit
Verfahrensbezogene Ablehnungsgründe
Schutz personenbezogener Daten
Schutz des geistigen Eigentums und von Betriebs- oder Geschäftsgeheimnissen
Weitere Ablehnungsgründe
Verfahren
Kosten
Beauftragte für die Informationsfreiheit
Rechtsschutz
Veröffentlichungspflichten
Zugang zu Dokumenten der Europäischen Union

Mit KI Sprachen lernen

Das ETH Spin-​off Quazel hat eine App entwickelt, die es ermöglicht, durch Gespräche mit einer Künstlichen Intelligenz (KI) Fremdsprachen zu lernen. Der KI-​Tutor passt sich den Sprachkenntnissen der Nutzenden an und korrigiert ihre Fehler. Sie wird in einem Artikel der ETHZürich News vom Mai 2023 ausführlich beschrieben. Gratis erhältlich für Android und iPhone.

Ancient Earth Globe

Neben einer umfassenden Dinosaurier-Datenbank gibt der Ancient Earth Globe eine spezielle Globusansicht der Erde, in der die Plattentektonik der Erde der letzten 750 Millionen Jahre argestellt wird. Steuerbar ist dies einmal durch eine Zeitleiste, zum anderen aber durch die Eingabe eines Ortes.

Buchseite 12 von 25
1 10 11 12 13 14 25