Algorithmus von LinkedIn

Der Onlineexperte Karl Kratz hat auf LinkedIn 13 Gebote formuliert, mit denen Beiträge in LinkedIn erfolgreich sein können. In einem Interview im Spiegel erläutert er den Hintergrund. “Sichtbarer werden im Karrierenetzwerk. Der Algorithmus von LinkedIn ist hochgradig pubertär. Hunderttausende Likes oder nur elf Leser? Auf LinkedIn lässt sich die eigene Reichweite mit simplen Tricks steigern. Onlinemarketingexperte Karl Kratz hat 13 Tipps gesammelt. Aber er hofft, dass sie niemand befolgt. Ein Interview von Verena Töpper Spiegel Online 05.01.2023” (hinter der Bezahlschranke)
Kratz diagnostiziert einen “pubertären, unausgereiften Algorithmus“, der teilweise der normalen Internetlogik widerspricht. So lassen externe Links und das Teilen von Beiträgen die Reichweite sinken, um die Nutzer möglichst lange auf den eigenen Seiten zu halten. Selfies hingegen, eine bestimmte Textlänge, das Posten in einem bestimmten Rhythmus und zu bestimmten Zeiten erhöht dagegen die Reichweite.

Retrieval mit ChatGPT

ChatGPT wird auch die Form des Information Retrieval grundlegend verändern.
Sascha Lobo: Das Ende von Google, wie wir es kannten. Spiegel Online 28.12.2022 sieht z.B. einen grundlegenden Paradigmenwechsel in der Suche, der durch die dialogische Form und eventuelle Rückkopplung bedingt ist:
“Googles Suchmaschine sieht die Welt als Liste an, eine KI in der Bauart von ChatGPT sucht einzelne, gute Antworten. Dieser technokulturelle Unterschied lässt Google als Maschine erscheinen und ChatGPT als digitalen Gesprächspartner. Und wenn etwas die bis dato extrem machtvolle Schlagwortsuche verdrängen könnte, wären es dialogartige Suchformen. Denn es ist für die Nutzenden einfacher, in normaler Alltagssprache ihre gewünschten Informationen zu bekommen.
Vor allem aber ist eine neue Suchintelligenz gefragt, die noch stärker auf die persönlichen Bedürfnisse eingehen kann. Durch die dialogische Art gibt es erstmals einen Feedback-Kanal zur Suchqualität.
Es gibt im Netz verschiedene Artikel, die die Resultate von Google und ChatGPT mit unterschiedlichen Ergebnissen vergleichen. Es gibt jetzt auch AddOns für Chrome und Firefox. Voraussetzung ist, dass man sich bei ChatGPT angemeldet hat. Versieht man die Suchbegriff noch mit einem Fragezeichen, wird parallel zur Google-Suche eine Antwort von ChatGPT ausgegeben. Allerdings fällt diese bei der Erweiterung erheblich knapper aus, als wenn direkt auf der ChatGPT-Seite die Eingabe erfolgt ist.
Ein Problem ist die Evaluation der Suchergebnisse. Ruth Fulterer: Hype um neue künstliche Intelligenz, Neue Zürcher Zeitung 24.12.2022 Papierausgabe:
“Bei einer Recherche ist zudem relevant, woher eine Information kommt. Genau das verschleiert das Sprachmodell. Auch Google filtert mit seinem Such-Algorithmus die Inhalte. Aber zumindest steht dabei, woher sie kommen. Nutzer können selbst entscheiden, welcher Quelle sie vertrauen.”
Die Gefahr besteht, das Ergebnisse von ChatGPT durch die dialogische Form plausibler erscheinen.
Teresa Kubacka, Schweizer Datenwissenschaftlerin, hat experimentell ChatGPT als wissenschaftliche Fake-News-Schleuder entlarvt. Daniel Schurter: Datenwissenschaftlerin aus Zürich warnt vor ChatGPT und den bösen Folgen. Watson.ch 13.12.2022
“«Sie liess ChatGPT einen Essay dazu schreiben und fragte den Chatbot danach mit einem Trick nach den Quellen (dabei musste sie dem Chatbot sagen, er solle so tun, als sei er Wissenschaftler). Die Quellenangaben, die das Programm dann ausspuckte, sah sich Kubacka im Anschluss näher an. Sie musste dabei feststellen, dass die Referenzen offenbar gar nicht existieren.»
Als die Datenwissenschaftlerin die Textausgabe von ChatGPT analysierte, bemerkte sie verschiedene Fälschungen. Einmal existierte zwar tatsächlich der Forschende, der das von der KI zitierte wissenschaftliche «Paper» geschrieben haben soll, doch die wissenschaftliche Arbeit gab es nicht.
Ein anderes Mal gab es zwar einen ähnlichen Forschenden an einer Universität mit ähnlichem Namen, dieser forschte aber in einem völlig anderen Bereich. Und bei weiteren Quellenangaben, die die KI machte, stellte sich heraus, dass es weder die Forschenden gab noch die referenzierte Arbeit.”

Einerseits kann die dialogische Form die Recherche erheblich verbessern, indem Aspekte eines Sachproblems aufgezeigt werden, die ansonsten vielleicht verlässigt worden wären. Bleibt es andererseits bei dem von Kubacka festgestellten Problem, müsste die Evaluation der Rechercheergebnisse bei wissenschaftlichen Themen mit neuen Techniken angegangen werden.

Handelsregister befreit?

Die Pflege amtlicher Daten beinhaltet im digitalen Zeitalter zugleich die Bereitstellung für einen Zugriff über Online-Suche und eine Schnittstelle. Die RICHTLINIE (EU) 2019/1024 DES EUROPÄISCHEN PARLAMENTS UND DES RATES vom 20. Juni 2019 über offene Daten und die Weiterverwendung von Informationen des öffentlichen Sektors sowie das Gesetz für die Nutzung von Daten des öffentlichen Sektors (Datennutzungsgesetz – DNG) vom 16.07.2021 sehen genau dies vor. Seit 01.08.2022 ist ein kostenloser Abruf ohne Registrierung auf der Seite des Handelsregister möglich. Allerdings: eine Datenschnittstelle existiert nicht.

Die Startseite begrüsst mit den Hinweisen:
“Aufgrund diverser Massenabrufer kann es in allen Bundesländern aktuell zu vorübergehenden Abrufproblemen kommen.
Zur Zeit sind keine Abrufen aus Brandenburg möglich.
Der strukturierte Registerinhalt (SI) ist in den Bundesländern Baden-Württemberg, Bayern, Hessen, Nordrhein-Westfalen, Sachsen, Niedersachsen, Sachsen-Anhalt, Mecklenburg-Vorpommern zur Zeit leider nur eingeschränkt abrufbar.
Die Suchfunktion des Registerportal steht momentan nur eingeschränkt zur Verfügung. Gezielte Abfragen sind möglich. Globale, uneingeschränkte Abfragen sollten vermieden werden.
Zurzeit können aktuelle Drucke (AD) und chronologische Drucke (CD) aus dem Berliner Registerdatenbestand nicht mit einer Volltextsuche durchsucht oder Textinhalte aus den PDF kopiert und in andere Dokumente eingezogen werden. Wir bitten diese Einschränkung zu entschuldigen.”

Es werden einfache Suchmasken ohne Indexanzeige, Autovervollständigen usw. angeboten. Trunkierung funktioniert bei Firmenname und Ort, allerdings wird nach 100 Treffern die Suche abgeschnitten, nur 1 Dokument aus der Ergebnisanzeige kann jeweils heruntergeladen werden. Vor allem sind aber übergreifende Suchen zu Besitzverhältnissen einzelner Personen oder Firmenbeteiligungen nicht möglich. Derartige Suchmasken waren vor einem Vierteljahrhundert Jahren Stand der Technik.

Die IT-Sicherheitsexpertin Lilith Wittmann hat aus diesem Grund die Seiten des Handelsregisters gescrapt. In ihrem Blog bund.dev: Wir befreien das Handelsregister! 15.08.2022 und in einem Interview auf golem.de vom 04.08.2022 “Scraping des Handelsregisters: “Wir machen das ja nur aus Notwehr”. Eine ehrenamtliche Gruppe plant, die Daten des Handelsregisters automatisiert in maschinenlesbare Formen zu bringen. Wofür dieser Aufwand? Ein Interview von Lennart Mühlenmeier”

Allerdings zeigt sich hier das Elend der Digitalisierung in Deutschland. Wieso muss eine zivilgesellschaftliche Initiative Aufgaben von Behörden übernehmen, die gesetzlich vorgeschrieben sind? Politik und Öffentlichkeit interessieren sich nicht für konkrete Problemlösungen. Und es ist zu befürchten, dass diese zivilgesellschaftliche Initiative überfordert ist. Gescrapt werden können ja nur die Daten im Ausgabeformat und die einzelnen Dokumente. Daraus im nachhinein ein effektives Datenbankdesign zu entwerfen, dürfte schwierig werden.

https://bund.dev/

Datenschutz neujustiert

Die Stellungnahme der deutschen Datenschutzbehörden von November 2022, dass der Einsatz von Microsoft 365 rechtswidrig sei, nehmen Kristin Benedikt, Thomas Kranig und Rolf Schwartmann: Microsoft 365 – so sollte Datenschutzaufsicht nicht sein. Deutschlands Datenschutzbehörden tragen eine große Verantwortung für Staat und Gesellschaft. Ihr Umgang mit dem Datenschutz muss grundlegend neu justiert werden. Frankfurter Allgemeine Zeitung 13.12.2022 (hinter der Bezahlschranke) zum Anlass einer grundlegenden Reflexion des Verhältnisses Datenschutz und Datennutzung. Zunächst skizzieren sie das Datenschutzrecht der DSVGO, das neben dem Schutz natürlicher Personen und Firmen bei der Verarbeitung von Daten auch die Abwägung gegen andere Grundrechte vorsieht. Die Datenschutzpraxis am Fall von Microsoft 365 soll demgegenüber in mehreren Punkten problematisch sein: eine umfassende technische Prüfung hat nicht stattgefunden. Die Datenschutzkonferenz (DSK) soll der Zusammenarbeit der Datenschutzbehörden dienen, ist aber im Gegensatz zum Bundesamt für Sicherheit in der Informationstechnik (BSI) nicht institutionalisiert, sodass sie Produktwarnungen herausgeben könnte. Die Verfasser sehen die Notwendigkeit, dass umfassende Prüfungen der europäischen Datenschutzaufsichtsbehörden letzlich vom Europäischen Datenschutzausschuss (EDSA) entschieden werden, um einen einheitlichen europäischen Rechtsrahmen zu gewährleisten. Darüber hinaus ist “ein modernes und konstruktives Selbstverständnis der Behörden gefragt”, ein “Datenkonstruktivismus“. Dieser besteht nicht nur in Sanktionsrechten, sondern in einem Beratungs- und Präventionsauftrag, der zu einer Neujustierung der Arbeitsweise führen sollte: “Der europäische Gesetzgeber strebt mit der digitalen Datenstrategie einen Binnenmarkt an, in dem die oberste Prämisse nicht die Datenminimierung oder Datenvermeidung, sondern die Datennutzung zum Wohle der Allgemeinheit ist.”

Grundlagen der Informationswissenschaft

Grundlagen der Informationswissenschaft, Herausgegeben von: Rainer Kuhlen , Dirk Lewandowski , Wolfgang Semar und Christa Womser-Hacker, 7.Auflage De Gruyter Saur 2023 steht als Open Access zur Lektüre und Download kostenlos zur Verfügung. In 73 Artikeln wird ein umfassender Überblick über alle Aspekte gegeben. Einzelne Kapitel behandeln u.a. Information Retrieval mit den Grundlagen, Recherchestrategien, Audio- und Musik-Retrieval, Cross-Language Information Retrieval, Evaluation, Sprachmodelle und neuronale Netze, Modellierung, Informationsrecherche und Empfehlungssysteme. In einem weiteren Kapitel werden Text Mining und Date Mining behandelt.

Doing Research

Der Sammelband Sandra Hofhues / Konstanze Schütze (Hg.): Doing Research – Wissenschaftspraktiken zwischen Positionierung und Suchanfrage, Transcript-Verlag 2022 steht als Open Access zur Lektüre und Download zur Verfügung.
“Forschung wird zunehmend aus Sicht ihrer Ergebnisse gedacht – nicht zuletzt aufgrund der Umwälzungen im System Wissensschaft. Der Band lenkt den Fokus jedoch auf diejenigen Prozesse, die Forschungsergebnisse erst ermöglichen und Wissenschaft konturieren. Dabei ist der Titel Doing Research als Verweis darauf zu verstehen, dass forschendes Handeln von spezifischen Positionierungen, partiellen Perspektiven und Suchbewegungen geformt ist. So knüpfen alle Beitragenden auf reflexive Weise an ihre jeweiligen Forschungspraktiken an. Ausgangspunkt sind Abkürzungen – die vermeintlich kleinsten Einheiten wissenschaftlicher Aushandlung und Verständigung. Der in den Erziehungs-, Sozial-, Medien- und Kunstwissenschaften verankerte Band zeichnet ein vieldimensionales Bild gegenwärtigen Forschens mit transdisziplinären Anknüpfungspunkten zwischen Digitalität und Bildung.”

Ethik des Metaversums

Christiane Hanna Henkel: Zuckerberg, Facebook und das Metaversum: warum wir Meta auch in der neuen virtuellen Welt nicht vertrauen können. Mark Zuckerberg möchte die kommende Revolution des Internets anführen. Doch für das Metaversum sind weder der Multimilliardär noch sein Konzern Meta Platforms moralisch gerüstet. Neue Zürcher Zeitung 15.11.2022 stellt die Frage, einerseits, ob das Metaversum so realisiert werden kann wie intendiert und andererseits, ob nicht zur Konstruktion einer derartigen virtuellen Welt die ethischen und moralischen Grundlagen fehlen. In der virtuellen Welt sollte man mit anderen Personen und Gegenständen interagieren, mit rasanter Geschwindigkeit neue Erfahrungen und Wissen generieren und gefahrlos ausprobieren. Allerdings: “Eine der wichtigsten Voraussetzungen dafür, dass wir uns in das Metaversum als Individuum in digitalisierter Form begeben, ist Vertrauen. Vertrauen, dass unser digitales Ich nicht ausspioniert, manipuliert oder anderweitig missbraucht wird. Genau das aber ist auch Teil der DNA von Meta Platforms.” Nicht nur die nahezu schrankenlose Aquisition von Daten und ihre Umsetzung in ein Werbekonzept, sondern auch die hässliche Seite des Geschäftsmodells – Verbreitung von Hass und Hetze – stellen das grundsätzliche Konstrukt und die Vertrauensbasis eines Metaversums in Frage: “Für das virtuelle Metaversum sind weder der Multimilliardär noch sein Konzern moralisch gerüstet.”

Technofeudalismus

Michael Moorstedt: Auf dem Weg zum Techno-Feudalismus. Absolute Herrscher, die ihre Launen ausleben und den “Zehnten” kassieren: Plattformunternehmen wie Twitter untergraben die Gesetze des Kapitalismus, Süddeutsche Zeitung 06.11.2022 stellt die Frage, ob sich nicht strukturell etwas geändert hat, was man mit dem “Gedankenbild des Feudalismus” bezeichnen könnte: Statt Kapitalakkumulation durch Produktion zu betreiben, saugen die Plattformen wie Uber, Airbnb und Doordash die zugrundeliegende Ökonomie parasitär aus: “Durch Plattformunternehmen unterwerfen sich Handwerker, Putzfrauen, Hundespaziergänger, Reinigungskräfte einem neuen Mittelsmann, der Kundenbeziehung und Marktzugang kontrolliert. Und während diese Arbeiter früher einen eigenen Verdienst hatten, zieht nun der eigentlich überflüssige Vermittler eine neue Gebühr ein.”
Durch die sozialen Plattformen wie Facebook, Twitter und Youtube sollte der soziale Zusammenhalt durch Austausch verbessert werden. Stattdessen stellen wir Informationen zur Verfügung, die Mehrwert für Plattformen schaffen. Der Zugang zu den so entstandenen Informationen wird uns nur noch selektiv gewährt. Eine neue Kaste ist entstanden. “Diejenigen, die noch über genügend Kapital verfügen, können sich den Zugang zu einem höheren Stand erkaufen. Das Fußvolk dagegen wird in einen überfüllten und schlecht moderierten Inhalte-Slum gepackt, der von den Lehnsherren mit Werbung und Mikrotransaktionen gepflastert wird.”

Russisches Desinformationsökosystem

In einem Interview von Sven Scharf mit dem Kommunikationsexperten Lutz Güllner: Russische Desinformationskampagnen “In den sozialen Medien sehen wir verdeckte Geheimdienstoperationen” Spiegel 27.10.2022 (hinter der Bezahlschranke) wird beschrieben, wie russische Desinformation mit unterschiedlichen Instrumenten und Gruppen arbeitet, die nicht alle zentralisiert und gesteuert sind. Dieses “Desinformationsökosystem” fügt einerseits willkürliches Bildmaterial mit konstruierten Erzählungen zusammen, die leicht im Internet als Fake entlarvt werden können. Dem gegenüber stehen hochprofessionelle Kampagnen, z.B. das zahlreiche Klonen von Presse-Webseiten. Ziel sind zwei Dinge: “Erstens: Personen zu überzeugen oder zumindest zu verunsichern. Und zweitens: Manchmal geht es gar nicht darum, die Leute direkt von der russischen Sichtweise zu überzeugen, sondern einfach nur darum, Verwirrung zu stiften.” Die Entwicklung zahlreicher Narrative oder die Kombination von Informationen mit falschen Kontexten soll zur Desorientung der Empfänger führen. Offizielle Verlautbarungen, staatliche Medien, Internetportale ergänzen einander. “In den sozialen Medien sehen wir geradezu verdeckte Geheimdienstoperationen: mit falschen Identitäten, mit Verstärkungen oder mit Strategien, um die Inhalte stärker zu verbreiten zu verstärken.”

Buchseite 7 von 16
1 5 6 7 8 9 16