Openverse Bildersuchmaschine

Die Suchmaschine CCSearch für Creative-Commons-Inhalte wird jetzt von WordPress betrieben und heißt jetzt Openverse.
“Openverse ist ein Tool, mit dem offen lizenzierte und gemeinfreie Werke von allen entdeckt und verwendet werden können. Openverse durchsucht mehr als 300 Millionen Bilder aus offenen APIs und dem Common Crawl- Datensatz. Es geht über eine einfache Suche hinaus, um Ergebnisse aus mehreren öffentlichen Repositories in einem einzigen Katalog zusammenzufassen, und erleichtert die Wiederverwendung durch Funktionen wie maschinell generierte Tags und Zuordnung mit einem Klick. Derzeit sucht Openverse nur nach Bildern und Audio, wobei die Suche nach Videos über externe Quellen bereitgestellt wird. Wir planen jedoch, zusätzliche Medientypen wie offene Texte und 3D-Modelle hinzuzufügen, mit dem ultimativen Ziel, Zugang zu den geschätzten 2,5 Milliarden CC-lizenzierten und gemeinfreien Werken im Internet zu bieten.”

Tools zur Fotobearbeitung

Koni Kreis, Mitarbeiter der schweizer ETH-Bibliothek, beschreibt in dem Beitrag “Mein Werkzeugkasten” ein Dutzend Tools, die bei der Arbeit mit Fotos wichtig sind, insbesondere Tools zu Karten und Geolokalisierung.

Algorithmus von LinkedIn

Der Onlineexperte Karl Kratz hat auf LinkedIn 13 Gebote formuliert, mit denen Beiträge in LinkedIn erfolgreich sein können. In einem Interview im Spiegel erläutert er den Hintergrund. “Sichtbarer werden im Karrierenetzwerk. Der Algorithmus von LinkedIn ist hochgradig pubertär. Hunderttausende Likes oder nur elf Leser? Auf LinkedIn lässt sich die eigene Reichweite mit simplen Tricks steigern. Onlinemarketingexperte Karl Kratz hat 13 Tipps gesammelt. Aber er hofft, dass sie niemand befolgt. Ein Interview von Verena Töpper Spiegel Online 05.01.2023” (hinter der Bezahlschranke)
Kratz diagnostiziert einen “pubertären, unausgereiften Algorithmus“, der teilweise der normalen Internetlogik widerspricht. So lassen externe Links und das Teilen von Beiträgen die Reichweite sinken, um die Nutzer möglichst lange auf den eigenen Seiten zu halten. Selfies hingegen, eine bestimmte Textlänge, das Posten in einem bestimmten Rhythmus und zu bestimmten Zeiten erhöht dagegen die Reichweite.

openArtBrowser

Simon Colin: Per Mausklick durch die Kunst- und Museumswelt – Der openArtBrowser zeigt 700.000 frei verfügbare Kunstwerke, IDW Informationsdienst Wissenschaft, Pressemitteilung h_da 28.10.2022
“Heute finden sich dort zirka 700.000 Kunstwerke aus 400 Stilrichtungen, 35.000 Kunst-schaffende, 50.000 Motive sowie 37.000 Museen und Ausstellungsorte. Und es werden wöchentlich mehr. Anhand zahlreicher Filter lässt sich recherchieren von Epoche über Künstlerin oder Motiv bis hin zum Standort oder zu den verwendeten Materialien.
Für den openArtBrowser verwendet das h_da-Team einen OpenSource-Ansatz. Genutzt werden nicht die limitierten, rechtlich geschützten Datensätze eines Museums, sondern frei zugängliche Web-Quellen aus der ganzen Welt: Nämlich die von Wikidata und Wikimedia, Grundlagen des Internetdienstes Wikipedia…Mit einem sogenannten Webcrawler, den Studierende entwickelt haben, werden die Datensätze von Wikidata eingesammelt und an der richtigen Stelle einsortiert.”
Link zum openArtBrowser: https://openartbrowser.org

Youtube Transcript und Summary

Bei den meisten Youtube Videos kann man sich mit dem Menü unten rechts ein Transcript anzeigen lassen. Die Seite http://youtubetranscript.com/ ermöglicht jetzt die Anzeige des Transcripts direkt durch die Eingabe der URL. Das Video kann an die Stelle des Transcripts springen.
Die künstliche Intelligenz von ChatGPT https://chat.openai.com/chat ermöglicht es, eine Zusammenfassung dieses Transcripts zu erstellen. In das Eingabefeld muss Summary und anschließend der Text in Anführungszeichen angegeben werden. Die Zusammenfassung funktioniert auch bei allen anderen Texten sowohl in englisch als auch in deutsch. Die Zusammenfassung wird in englisch ausgegeben.

Reise in die Vergangenheit mit Google Earth

“Google Earth bietet euch seit einiger Zeit die Möglichkeit, historisches Kartenmaterial über den Globus der Gegenwart zu legen und damit einen Vergleich zwischen früher und heute anstellen zu können. Dafür greift der Dienst auf das digitalisierte Archiv der “David Rumsey Map Collection” zurück.” Sören Diedrich: Die Welt von 1587 bei Google zu betrachten ist einfach nur der Wahnsinn. Dank einer gut versteckten Funktion könnt ihr bei Google historisches Kartenmaterial anzeigen lassen. Das Ergebnis ist pure Faszination! GameStarTech 29.12.2022 beschreibt die Nutzung der experimentellen Sonderseite von Google Earth, die es ermöglicht, sich verschiedene Karten nach Zeit (1550-1700, 1700-1750, 1750-1800, 1800-1850, 1850-1900, 1900-1950) und Ort anzeigen zu lassen.
Alexander Köpf: So hätte Google Maps für das Römische Reich ausgesehen, inklusive Routenplaner auf Latein. Das Projekt OmnesViae zeigt nicht nur, wie beeindruckend das Straßennetz der Römer war, es lässt euch sogar eine Route durch das antike Weltreich planen. GameStarTech 03.08.2022 beschreibt die Seite “OmnesViae: Römischer Routenplaner”

Retrieval mit ChatGPT

ChatGPT wird auch die Form des Information Retrieval grundlegend verändern.
Sascha Lobo: Das Ende von Google, wie wir es kannten. Spiegel Online 28.12.2022 sieht z.B. einen grundlegenden Paradigmenwechsel in der Suche, der durch die dialogische Form und eventuelle Rückkopplung bedingt ist:
“Googles Suchmaschine sieht die Welt als Liste an, eine KI in der Bauart von ChatGPT sucht einzelne, gute Antworten. Dieser technokulturelle Unterschied lässt Google als Maschine erscheinen und ChatGPT als digitalen Gesprächspartner. Und wenn etwas die bis dato extrem machtvolle Schlagwortsuche verdrängen könnte, wären es dialogartige Suchformen. Denn es ist für die Nutzenden einfacher, in normaler Alltagssprache ihre gewünschten Informationen zu bekommen.
Vor allem aber ist eine neue Suchintelligenz gefragt, die noch stärker auf die persönlichen Bedürfnisse eingehen kann. Durch die dialogische Art gibt es erstmals einen Feedback-Kanal zur Suchqualität.
Es gibt im Netz verschiedene Artikel, die die Resultate von Google und ChatGPT mit unterschiedlichen Ergebnissen vergleichen. Es gibt jetzt auch AddOns für Chrome und Firefox. Voraussetzung ist, dass man sich bei ChatGPT angemeldet hat. Versieht man die Suchbegriff noch mit einem Fragezeichen, wird parallel zur Google-Suche eine Antwort von ChatGPT ausgegeben. Allerdings fällt diese bei der Erweiterung erheblich knapper aus, als wenn direkt auf der ChatGPT-Seite die Eingabe erfolgt ist.
Ein Problem ist die Evaluation der Suchergebnisse. Ruth Fulterer: Hype um neue künstliche Intelligenz, Neue Zürcher Zeitung 24.12.2022 Papierausgabe:
“Bei einer Recherche ist zudem relevant, woher eine Information kommt. Genau das verschleiert das Sprachmodell. Auch Google filtert mit seinem Such-Algorithmus die Inhalte. Aber zumindest steht dabei, woher sie kommen. Nutzer können selbst entscheiden, welcher Quelle sie vertrauen.”
Die Gefahr besteht, das Ergebnisse von ChatGPT durch die dialogische Form plausibler erscheinen.
Teresa Kubacka, Schweizer Datenwissenschaftlerin, hat experimentell ChatGPT als wissenschaftliche Fake-News-Schleuder entlarvt. Daniel Schurter: Datenwissenschaftlerin aus Zürich warnt vor ChatGPT und den bösen Folgen. Watson.ch 13.12.2022
“«Sie liess ChatGPT einen Essay dazu schreiben und fragte den Chatbot danach mit einem Trick nach den Quellen (dabei musste sie dem Chatbot sagen, er solle so tun, als sei er Wissenschaftler). Die Quellenangaben, die das Programm dann ausspuckte, sah sich Kubacka im Anschluss näher an. Sie musste dabei feststellen, dass die Referenzen offenbar gar nicht existieren.»
Als die Datenwissenschaftlerin die Textausgabe von ChatGPT analysierte, bemerkte sie verschiedene Fälschungen. Einmal existierte zwar tatsächlich der Forschende, der das von der KI zitierte wissenschaftliche «Paper» geschrieben haben soll, doch die wissenschaftliche Arbeit gab es nicht.
Ein anderes Mal gab es zwar einen ähnlichen Forschenden an einer Universität mit ähnlichem Namen, dieser forschte aber in einem völlig anderen Bereich. Und bei weiteren Quellenangaben, die die KI machte, stellte sich heraus, dass es weder die Forschenden gab noch die referenzierte Arbeit.”

Einerseits kann die dialogische Form die Recherche erheblich verbessern, indem Aspekte eines Sachproblems aufgezeigt werden, die ansonsten vielleicht verlässigt worden wären. Bleibt es andererseits bei dem von Kubacka festgestellten Problem, müsste die Evaluation der Rechercheergebnisse bei wissenschaftlichen Themen mit neuen Techniken angegangen werden.

Handelsregister befreit?

Die Pflege amtlicher Daten beinhaltet im digitalen Zeitalter zugleich die Bereitstellung für einen Zugriff über Online-Suche und eine Schnittstelle. Die RICHTLINIE (EU) 2019/1024 DES EUROPÄISCHEN PARLAMENTS UND DES RATES vom 20. Juni 2019 über offene Daten und die Weiterverwendung von Informationen des öffentlichen Sektors sowie das Gesetz für die Nutzung von Daten des öffentlichen Sektors (Datennutzungsgesetz – DNG) vom 16.07.2021 sehen genau dies vor. Seit 01.08.2022 ist ein kostenloser Abruf ohne Registrierung auf der Seite des Handelsregister möglich. Allerdings: eine Datenschnittstelle existiert nicht.

Die Startseite begrüsst mit den Hinweisen:
“Aufgrund diverser Massenabrufer kann es in allen Bundesländern aktuell zu vorübergehenden Abrufproblemen kommen.
Zur Zeit sind keine Abrufen aus Brandenburg möglich.
Der strukturierte Registerinhalt (SI) ist in den Bundesländern Baden-Württemberg, Bayern, Hessen, Nordrhein-Westfalen, Sachsen, Niedersachsen, Sachsen-Anhalt, Mecklenburg-Vorpommern zur Zeit leider nur eingeschränkt abrufbar.
Die Suchfunktion des Registerportal steht momentan nur eingeschränkt zur Verfügung. Gezielte Abfragen sind möglich. Globale, uneingeschränkte Abfragen sollten vermieden werden.
Zurzeit können aktuelle Drucke (AD) und chronologische Drucke (CD) aus dem Berliner Registerdatenbestand nicht mit einer Volltextsuche durchsucht oder Textinhalte aus den PDF kopiert und in andere Dokumente eingezogen werden. Wir bitten diese Einschränkung zu entschuldigen.”

Es werden einfache Suchmasken ohne Indexanzeige, Autovervollständigen usw. angeboten. Trunkierung funktioniert bei Firmenname und Ort, allerdings wird nach 100 Treffern die Suche abgeschnitten, nur 1 Dokument aus der Ergebnisanzeige kann jeweils heruntergeladen werden. Vor allem sind aber übergreifende Suchen zu Besitzverhältnissen einzelner Personen oder Firmenbeteiligungen nicht möglich. Derartige Suchmasken waren vor einem Vierteljahrhundert Jahren Stand der Technik.

Die IT-Sicherheitsexpertin Lilith Wittmann hat aus diesem Grund die Seiten des Handelsregisters gescrapt. In ihrem Blog bund.dev: Wir befreien das Handelsregister! 15.08.2022 und in einem Interview auf golem.de vom 04.08.2022 “Scraping des Handelsregisters: “Wir machen das ja nur aus Notwehr”. Eine ehrenamtliche Gruppe plant, die Daten des Handelsregisters automatisiert in maschinenlesbare Formen zu bringen. Wofür dieser Aufwand? Ein Interview von Lennart Mühlenmeier”

Allerdings zeigt sich hier das Elend der Digitalisierung in Deutschland. Wieso muss eine zivilgesellschaftliche Initiative Aufgaben von Behörden übernehmen, die gesetzlich vorgeschrieben sind? Politik und Öffentlichkeit interessieren sich nicht für konkrete Problemlösungen. Und es ist zu befürchten, dass diese zivilgesellschaftliche Initiative überfordert ist. Gescrapt werden können ja nur die Daten im Ausgabeformat und die einzelnen Dokumente. Daraus im nachhinein ein effektives Datenbankdesign zu entwerfen, dürfte schwierig werden.

https://bund.dev/

Abstieg der Suchmaschine Qwant

Die als europäische Alternative zu Google vielgerühmte französische Suchmaschine Qwant hat ihre Ankündigungen, eigene Suchindizes aufzubauen, nicht eingelöst, sondern sich nach wie vor nur auf die Ergebnisse der Microsoft Suchmaschine Bing gestützt. Sie ist inzwischen in finanzielle Schwierigkeiten geraten, ist mit 47 Millionen Euro verschuldet und hat Hilfe von Huawei erhalten. Der Gründer hat das Unternehmen verlassen und eine private Überwachungs- und Spionageunternehmen mit Anlehnung an Palantir gegründet.

Elisa Braun: France’s Mr. Privacy turns cybersnooper. How the disgraced co-founder of France’s answer to Google moved into the murky world of cybersurveillance. Politico 07.12.2022

Markus Reute: Der Absturz der Suchmaschine Qwant und ihres Gründers. Netzpolitik.Org 08.12.2022

Datenschutz neujustiert

Die Stellungnahme der deutschen Datenschutzbehörden von November 2022, dass der Einsatz von Microsoft 365 rechtswidrig sei, nehmen Kristin Benedikt, Thomas Kranig und Rolf Schwartmann: Microsoft 365 – so sollte Datenschutzaufsicht nicht sein. Deutschlands Datenschutzbehörden tragen eine große Verantwortung für Staat und Gesellschaft. Ihr Umgang mit dem Datenschutz muss grundlegend neu justiert werden. Frankfurter Allgemeine Zeitung 13.12.2022 (hinter der Bezahlschranke) zum Anlass einer grundlegenden Reflexion des Verhältnisses Datenschutz und Datennutzung. Zunächst skizzieren sie das Datenschutzrecht der DSVGO, das neben dem Schutz natürlicher Personen und Firmen bei der Verarbeitung von Daten auch die Abwägung gegen andere Grundrechte vorsieht. Die Datenschutzpraxis am Fall von Microsoft 365 soll demgegenüber in mehreren Punkten problematisch sein: eine umfassende technische Prüfung hat nicht stattgefunden. Die Datenschutzkonferenz (DSK) soll der Zusammenarbeit der Datenschutzbehörden dienen, ist aber im Gegensatz zum Bundesamt für Sicherheit in der Informationstechnik (BSI) nicht institutionalisiert, sodass sie Produktwarnungen herausgeben könnte. Die Verfasser sehen die Notwendigkeit, dass umfassende Prüfungen der europäischen Datenschutzaufsichtsbehörden letzlich vom Europäischen Datenschutzausschuss (EDSA) entschieden werden, um einen einheitlichen europäischen Rechtsrahmen zu gewährleisten. Darüber hinaus ist “ein modernes und konstruktives Selbstverständnis der Behörden gefragt”, ein “Datenkonstruktivismus“. Dieser besteht nicht nur in Sanktionsrechten, sondern in einem Beratungs- und Präventionsauftrag, der zu einer Neujustierung der Arbeitsweise führen sollte: “Der europäische Gesetzgeber strebt mit der digitalen Datenstrategie einen Binnenmarkt an, in dem die oberste Prämisse nicht die Datenminimierung oder Datenvermeidung, sondern die Datennutzung zum Wohle der Allgemeinheit ist.”

Buchseite 11 von 26
1 9 10 11 12 13 26