Test der LLMs (ChatGPT, Claude, Deepseek, Mistral, Gemini, Perplexity)

Daniel Koller: Ausprobiert: Wie nützlich sind ChatGPT, Deepseek und Co wirklich? Wie unterscheiden sich die unterschiedlichen LLMs eigentlich voneinander? Eine Übersicht mit Kurztest. Der Standard 23.02.2025
Es werden untersucht: ChatGPT, Claude, Deepseek, Mistral AI, Gemini, Perplexity.ai
„Wie eingangs erwähnt sind die Unterschiede zwischen den verfügbaren LLMs für den Standardnutzer kaum ersichtlich. Die verschiedenen Plattformen weisen geringe Differenzen auf und haben allesamt ihre Stärken und Schwächen. Das Potenzial, die heutige Arbeitswelt auf den Kopf zu stellen, ist durch ChatGPT und Co aber durchaus gegeben. Die LLMs sind allesamt praktische Helferlein, die als nützliche Werkzeuge bei verschiedensten Tätigkeiten eingestuft werden sollten. Sich gänzlich auf die Tools zu verlassen ist aber alles andere als ratsam. Noch machen die LLMs einfach zu viele Fehler und brauchen einen menschlichen Kontrolleur, der da und dort nachschärft und ausbessert. Noch.“

Covid19 Datenanalyse

Auf der Basis der Daten (Quellcodes für die Modellrechnungen die das RKI für die eigene Studie „StopptCovid“ verwendet hat), die das Robert-Koch Institut (RKI) Ende März 2024 auf Drängen des FDP-Vize Wolfgang Kubicki freigegeben hat, hat ein achtköpfiges Forscherteam eine erneute Datenanalyse durchgeführt. Sie liegt jetzt in einem Preprint vor:
Bernhard Müller, Inken Padberg, Michael Lorke, Ralph Brinks, Sally Cripps, Gabriela M. Gomes, Daniel Haake, John P. A. Ioannidis: Uncertainty and Inconsistency of COVID-19 Non-Pharmaceutical Intervention Effects with Multiple Competitive Statistical Models, Preprint medRxiv 25.01.2025
Abstract: „Die Quantifizierung der Wirkung von nicht-pharmazeutischen Interventionen (NPIs) ist für die Formulierung von Lehren aus der COVID-19-Pandemie von entscheidender Bedeutung. Um eine zuverlässigere und strengere Bewertung von NPIs auf der Grundlage von Zeitreihendaten zu ermöglichen, analysieren wir die Daten für die ursprüngliche offizielle Bewertung von NPIs in Deutschland neu, indem wir ein Ensemble von 9 konkurrierenden statistischen Methoden zur Schätzung der Auswirkungen von NPIs und anderen Determinanten der Krankheitsausbreitung auf die effektive Reproduktionszahl ℛ(t) und die zugehörigen Fehlerbalken verwenden. Eine ordnungsgemäße Fehleranalyse für Zeitreihendaten führt zu deutlich breiteren Konfidenzintervallen als die offizielle Bewertung. Neben der Impfung und der Saisonalität können nur wenige NPIs – wie Einschränkungen im öffentlichen Raum – mit Sicherheit mit Variationen von ℛ(t) in Verbindung gebracht werden, aber selbst dann sind die Effektgrößen mit großen Unsicherheiten behaftet. Darüber hinaus ist es aufgrund der Multikollinearität in den NPI-Aktivierungsmustern schwierig, potenzielle Auswirkungen von NPIs im öffentlichen Raum von anderen Interventionen zu unterscheiden, die früh in Kraft getreten sind, wie z. B. körperliche Distanzierung. In Zukunft sollten NPIs sorgfältiger konzipiert und von Plänen für Datenerhebungen begleitet werden, um eine rechtzeitige Bewertung von Nutzen und Schaden als Grundlage für eine wirksame und verhältnismäßige Reaktion zu ermöglichen.“

Siehe dazu auch den Artikel Elke Bodderas: Kritik an „StopptCovid“-Studie. „Für keine der Maßnahmen ergeben sich belastbare Effekte“ Welt 31.01.2015

Robert Koch Institut: ABSCHLUSSBERICHT. Wirksamkeit und Wirkung von anti-epidemischen Maßnahmen auf die COVID-19-Pandemie in Deutschland (StopptCOVID-Studie) 20.07.2023

siehe dazu schon die kritischen Analysen aus 2023:

Thomas Wieland, Johannes Merkl: Was die „StopptCOVID“-Studie des RKI sagt – und was nicht. Mit dem Forschungsprojekt „StopptCOVID“ untersuchte das Robert-Koch-Institut die Wirksamkeit der Maßnahmen zur Eindämmung des Corona-Virus. Doch die Studie enttäuscht, da sie aufgrund massiver methodischer Mängel keine belastbaren Aussagen liefert. Cicero 06.08.2023

Werner Baumgarten, Oliver Beige, Daniel Haake, Johannes Merkl und Thomas Wieland: Evaluation der Wirksamkeit von Corona-Maßnahmen in Deutschland: Was der RKI-Abschlussbericht sagt – und was er nicht sagt, Technischer Report 02.09.2023

Automatisierte Texterstellung

Jan Siebert: Automatisierte Texterstellung – Die besten Anbieter im Vergleich inkl. Praxistest, digital-affin 07.06.2024
Zusammenfassung: ChatGPT hat in Sachen Texterstellung alles verändert. Aber ChatGPT ist nicht unbedingt das beste Tool zur automatisierten Texterstellung. Speziell für den deutschen Markt gibt es neuroflash, und International auch noch andere, die stärker auf Funktionalitäten setzen, die das Prompting vereinfachen. Bei den meisten hast du kostenlose Kontingente, so dass du dich selbst überzeugen kannst. KI Texterstellung klappt für alle möglichen Arten von Texten. Setze es aber mit Bedacht ein und vertraue der KI nicht blind! Überzeug dich von den Tools selbst.“

Untersuchung zu Bluesky

Leonhard Balduf, Saidu Sokoto, Onur Ascigil, Gareth Tyson, Björn Scheuermann, Maciej Korczyński, Ignacio Castro, Michaŀ Król: Looking AT the Blue Skies of Bluesky. IMC ’24: Proceedings of the 2024 ACM on Internet Measurement Conference Pages 76 – 91
Abstract: „Die Fallstricke zentralisierter sozialer Netzwerke, wie Facebook und Twitter/X, haben zu Bedenken hinsichtlich Kontrolle, Transparenz und Verantwortlichkeit geführt. Infolgedessen sind dezentralisierte soziale Netzwerke mit dem Ziel entstanden, den Nutzern mehr Möglichkeiten zu geben. Diese dezentralen Ansätze bringen ihre eigenen Kompromisse mit sich, und daher gibt es mehrere Architekturen. In diesem Beitrag führen wir die erste groß angelegte Analyse von Bluesky durch, einer bekannten dezentralen Microblogging-Plattform. Im Gegensatz zu alternativen Ansätzen (z.B. Mastodon) zerlegt und öffnet Bluesky die Schlüsselfunktionen der Plattform in Teilkomponenten, die von Drittanbietern bereitgestellt werden können. Wir sammeln einen umfassenden Datensatz, der alle Schlüsselelemente von Bluesky abdeckt, untersuchen die Nutzeraktivität und bewerten die Vielfalt der Anbieter für jede Teilkomponente.“
Die Ergebnisse laut Presseerklärung der TU Darmstadt:
„Die partizipative Plattform beruhe auf fundamental anderen Prinzipien und Architekturen. Zu den größten Vorteilen gegenüber zentralisierten Netzwerken wie Facebook oder X gehörten Offenheit, Transparenz, Partizipation und eine gleichmäßigere Machtverteilung. So haben Bluesky-User deutlich mehr Kontrolle sowohl über ihre eigenen Daten und ihre eigene Identität als auch über die ihnen angezeigten Inhalte…
Neben den großen Pluspunkten ist die dezentralisierte Plattform laut Studie jedoch auch mit Nachteilen verbunden. So werde unter anderem verstärkt darüber diskutiert, wer die Rechte an den Inhalten habe und wie der offene Datenzugang vor Missbrauch geschützt werden könne, erklärt Balduf. Auch habe sich gezeigt, dass das System unter Umständen mit dem großen Wachstum überfordert sein könnte und die künftige Finanzierung des derzeit werbefreien Dienstes eine offene Frage darstelle. Seit Öffnung der relativ jungen Plattform für die Allgemeinheit im Februar 2024 verzehnfachte sich die Zahl der Nutzerinnen und Nutzer von etwa 2,5 Millionen auf heute rund 28 Millionen.“

Fake News und Faktenchecker

Morten Freidel: Wie Faktenchecker die Unwahrheit verbreiten und die Debatte vergiften. Immer wieder heisst es, das Ende der Faktenprüfer gefährde die öffentliche Diskussion bei Facebook und anderswo. Doch wer genau hinsieht, erkennt: Es ist genau andersherum. Neue Zürcher Zeitung 18.01.2025
„Verbreitet sich ohne Faktenprüfer, die Inhalte auf den digitalen Plattformen durchleuchten, die Lüge? Andersherum gefragt: Verhelfen Faktenprüfer der Wahrheit zum Durchbruch? Eine genaue Bestandsaufnahme der NZZ ergibt ein anderes Bild. Sie zeigt, dass Faktenprüfer in Deutschland häufig gar keine Tatsachen prüfen, sondern Meinungen bewerten. Sie belegt, dass selbst umstrittene Einschätzungen solcher Prüfer prominent auf Facebook oder Instagram platziert wurden und so die Diskussion verzerrten. Und dass Gerichte Facebook bereits in mehreren Fällen untersagt haben, sie weiterzuverbreiten.“

Edda Grabar, Holger Kreitling: „Experten für Misinformation stehen deutlich links der Mitte“. Die Aufregung um Desinformation und Fake News in sozialen Medien ist groß. Hohe Gefahr wird beschworen. Der Kommunikationswissenschaftler Christian Hoffmann hat einen nüchternen Blick auf die Themen – und kennt die wahre Datenlage. Welt 20.02.2025 (hinter der Bezahlschranke)
Hoffmann geht davon aus, dass die Dezentralisierung von Information Vor- und Nachteile mit sich bringt. „Sie bringt Lebendigkeit in den Diskurs und kann eine Demokratie anpassungsfähiger und flexibler machen.“ Nur wenige Menschen würdenFake News sehen. Selbst in den USA sei „der Anteil von Misinformationen im einstelligen Prozentbereich.“ Algorithmen würden nicht so lenkend eingreifen wie befürchtet. „Nach meiner Lesart der Daten ist die Evidenz für Filterblasen in den vergangenen vier bis fünf Jahren immer schlechter geworden.“ Die Effekte von Faktenchecks seien sehr klein, würden im übrigen eher Meinungen bewerten.

Friederike Morat: Überschätzte Desinformation, unterschätzte Datenmacht: Sind soziale Medien die größte Gefahr für die Demokratie? Eine internationale Metastudie zeigt: Der Einfluss von Desinformation auf Wahlen und Demokratie ist überraschend gering – das Problem liegt ganz woanders. Tagesspiegel 17.01.2025 (hinter der Bezahlschranke) „Die Studien, die wir durchgesehen haben, haben gezeigt, dass es keine empirischen Nachweise dafür gibt, das Desinformation irgendetwas groß beeinflußt hat.“

Mansell, R., Durach, F., Kettemann, M., Lenoir, T., Procter, R., Tripathi, G., and Tucker, E. (2025): Information Ecosystems and Troubled Democracy: A Global Synthesis of the State of Knowledge on New Media, AI and Data Governance. International Observatory on Information and Democracy. Paris.

Technische Universität München in Kooperation mit HateAid: Angegriffen und Alleingelassen. Wie sich digitale Gewalt auf politisches Engagement auswirkt. Ein Lagebild.

Information Retrieval Vorlesung

Ghislain Fourny, senior scientist in the Department of Computer Science at ETH Zurich, hat Folge von 30 Vorlesungen zu Information Retrieval gehalten: Ghislain Fourny’s lectures:
Introduction (1/2) – Information Retrieval – ETH Zurich – Spring 2024
Introduction (2/2) – Information Retrieval – ETH Zurich – Spring 2024
Boolean retrieval (1/2) – Information Retrieval – ETH Zurich – Spring 2024
Boolean retrieval (2/2) – Information Retrieval – ETH Zurich – Spring 2024
Term vocabulary (1/3) – Information Retrieval – ETH Zurich – Spring 2024
Term vocabulary (2/3) – Information Retrieval – ETH Zurich – Spring 2024
Term vocabulary (3/3) – Information Retrieval – ETH Zurich – Spring 2024
Tolerant retrieval (1/4) – Information Retrieval – ETH Zurich – Spring 2024
Tolerant retrieval (2/4) – Information Retrieval – ETH Zurich – Spring 2024
Tolerant retrieval (3/4) – Information Retrieval – ETH Zurich – Spring 2024
Tolerant retrieval (4/4) – Information Retrieval – ETH Zurich – Spring 2024
Index construction (1/3) – Information Retrieval – ETH Zurich – Spring 2024
Index construction (2/3) – Information Retrieval – ETH Zurich – Spring 2024
Index construction (3/3) – Information Retrieval – ETH Zurich – Spring 2024
Index compression (1/3) – Information Retrieval – ETH Zurich – Spring 2024
Index compression (2/3) – Information Retrieval – ETH Zurich – Spring 2024
Index compression (3/3) – Information Retrieval – ETH Zurich – Spring 2024
Vector space model (1/2) – Information Retrieval – ETH Zurich – Spring 2024
Vector space model (2/2) – Information Retrieval – ETH Zurich – Spring 2024
Vector databases (1/1) – Information Retrieval – ETH Zurich – Spring 2024
Evaluation (1/1) – Information Retrieval – ETH Zurich – Spring 2024
Probabilistic information retrieval (1/4) – Information Retrieval – ETH Zurich – Spring 2024
Probabilistic information retrieval (2/4) – Information Retrieval – ETH Zurich – Spring 2024
Probabilistic information retrieval (3/4) – Information Retrieval – ETH Zurich – Spring 2024
Probabilistic information retrieval (4/4) – Information Retrieval – ETH Zurich – Spring 2024
Language models (1/3) – Information Retrieval – ETH Zurich – Spring 2024
Language models (2/3) – Information Retrieval – ETH Zurich – Spring 2024
Language models (3/3) – Information Retrieval – ETH Zurich – Spring 2024
Wrap up (1/2) – Information Retrieval – ETH Zurich – Spring 2024
Wrap up (2/2) – Information Retrieval – ETH Zurich – Spring 2024

Zeitschrifteninhaltssuche

Jürgen Plieninger (19. Januar 2025). Zeitschriftenartikelinhaltssuche JURN ist gewandert. netbib. Abgerufen am 20. Januar 2025 von https://netbib.hypotheses.org/78644844
„Wenn man im Inhalt von Zeitschriftenartikeln suchen will, kann man DOAJ verwenden, das allerdings einen Schwerpunkt auf englischsprachigen Open Access-Journals setzt. Möglich ist auch die Suche in Google, wenn man ein spezifisches Journal durchsuchen will, indem man mit site: dessen URL angibt und dann die Suchwörter anschließt. Wenn man frei zugängliche Journals im Netz suchen will, gibt es noch JURN, dessen URL wieder geändert wurde. – Alles drei probate Mittel, wenn man an keine Uni angeschlossen ist und keine lizenzierten Datenbanken zur Hand hat.“

Buchseite 9 von 44
1 7 8 9 10 11 44