Test von Chatsbots

Computerwissenschaftler der Universität Berkeley haben eine Testanwendung für Chatbots entwickelt und im Anschluß die Firma LMArena gegründet. Inzwischen können über 400, auch teils normalerweise kostenpflichtige Chatbots parallel getestet werden.
Und so funktioniert es:
„Eine Frage stellen: Geben Sie Ihre Anregung oder Frage in die offene Arena ein. Die Daten werden erhoben, um faire, öffentliche Bewertungen zu ermöglichen.
Antworten vergleichen: Ihnen werden zwei anonyme Modelle angezeigt. Sehen Sie sich die Antworten genauer an und entscheiden Sie, welche Antwort am besten zu Ihren Anforderungen passt.
Wählen Sie die Besten: Wählen Sie Ihre bevorzugte Antwort. Ihre Stimme trägt zur Gestaltung der öffentlichen KI-Bestenlisten bei.
Entdecken und wiederholen: Nach der Abstimmung werden die Modellidentitäten bekannt gegeben. Erkunden Sie weiter und tragen Sie zur Verbesserung der KI in diesem offenen, von der Community betriebenen Raum bei.“

Marie-Astrid Langer: Ein Boxring für Chatbots: In der LM-Arena treten KI-Modelle gegeneinander an. Gemini, Claude, GPT – woher weiss man, welches KI-Modell das beste ist? Forscher der Universität Berkeley lassen Chatbots gegeneinander antreten. Selbst den Erfolg von Deepseek hatten sie so kommen sehen. Neue Zürcher Zeitung 28.06.2025 (hinter der Bezahlschranke)
„KI-Firmen begannen, den Wissenschftlern Prototypen neuer Modelle zuzusenden, und verbesserten mit den in der Arena gewonnenen Erkenntnissen ihre Algorithmen. Denn die erhobenen Daten bieten wertvolle Informationen dazu, wie Nutzer mit den Chatbots interagieren. Die Plattform teilt diese mit den KI-Firmen, zumindest teilweise. Rund 20 Prozent aller erhobenen Daten leite man weiter, sagen die Gründer: genug, dass die Informationen nützlich für leichte Verbesserungen seien, aber zu wenig, als dass die Firman das Tanking-System austricksen können.“

KI in Bibliotheken

Carina Pizzini: Einsatzgebiete von Künstlicher Intelligenz in wissenschaftlichen Bibliotheken – Praxis und Perspektiven. Bachelorarbeit 2025
Abstract: „Künstliche Intelligenz ist ein aktuelles Thema und aus vielen Bereichen des Lebens nicht mehr wegzudenken. Da KI mittlerweile neben vielen anderen Disziplinen auch die Wissenschaft und den Hochschulalltag beeinflusst, setzen sich auch wissenschaftliche Bibliotheken zunehmend mit der Thematik auseinander. Um Forschende, Studierende und Lehrende hinsichtlich dieser Entwicklung zu unterstützen, müssen sich Bibliotheken an den Wandel anpassen und Angebote schaffen, um ihnen die nötigen Informationen zum Umgang und Einsatz KI-gestützter Werkzeuge in Forschung und Lehre zu vermitteln. Und auch im bibliothekarischen Alltag bieten KI-Tools das Potential, Prozesse und Dienstleistungen zu optimieren. In dieser Arbeit wird exemplarisch aufgezeigt, inwiefern wissenschaftliche Bibliotheken Künstliche Intelligenz bereits in ihren Arbeitsalltag integriert haben und nutzen, ob sie eigene Forschung zu dem Thema betreiben und welche Angebote sie zur Informationsvermittlung entwickelt haben. Dies geschieht anhand einer Literaturanalyse, in der fünf wissenschaftliche Bibliotheken basierend auf festgelegten Kriterien hinsichtlich ihres Engagements bezüglich KI untersucht werden. Ergänzend werden im Anschluss Chancen und Herausforderungen rund um den Einsatz von KI-Technologien in wissenschaftlichen Bibliotheken herausgearbeitet und die Auswirkungen auf die Rolle von Bibliothekar*innen erläutert. Abschließend werden die Ergebnisse zusammengefasst und ein Ausblick auf die mögliche zukünftige Entwicklung gegeben.“

KI-Modelle anonym

Der freie Browser DuckDuckGo hat mit duck.ai ein Angebot, mit dem man verschiedene KI-Modelle kostenlos und annoym benutzen kann. Angeboten werden jeweils in den kostenlosen Grundversionen
GPT-4o mini (OpenAI) – eine Variante von ChatGPT
GPT o4-mini (OpenAI) – eine Variante von ChatGPT
Llama 3.3 (Meta) – Open Source
Mistral Small 3 (Mistral AI) – französische Entwicklung, europäische KI
Claude 3 Haiku (Anthropic) – einer der großen Platzhirsche neben ChatGPT

Test der LLMs (ChatGPT, Claude, Deepseek, Mistral, Gemini, Perplexity)

Daniel Koller: Ausprobiert: Wie nützlich sind ChatGPT, Deepseek und Co wirklich? Wie unterscheiden sich die unterschiedlichen LLMs eigentlich voneinander? Eine Übersicht mit Kurztest. Der Standard 23.02.2025
Es werden untersucht: ChatGPT, Claude, Deepseek, Mistral AI, Gemini, Perplexity.ai
„Wie eingangs erwähnt sind die Unterschiede zwischen den verfügbaren LLMs für den Standardnutzer kaum ersichtlich. Die verschiedenen Plattformen weisen geringe Differenzen auf und haben allesamt ihre Stärken und Schwächen. Das Potenzial, die heutige Arbeitswelt auf den Kopf zu stellen, ist durch ChatGPT und Co aber durchaus gegeben. Die LLMs sind allesamt praktische Helferlein, die als nützliche Werkzeuge bei verschiedensten Tätigkeiten eingestuft werden sollten. Sich gänzlich auf die Tools zu verlassen ist aber alles andere als ratsam. Noch machen die LLMs einfach zu viele Fehler und brauchen einen menschlichen Kontrolleur, der da und dort nachschärft und ausbessert. Noch.“

KI und Hochschulbibliotheken

Caroline Welte, Cornelia Künzle, Eva-Christina Edinger, Christine Bärtsch: Generative Künstliche Intelligenz trifft Informationskompetenz: Strategien an der ETH-Bibliothek, Schweizer Beiträge zur 112. BiblioCon 2024 05.09.2024
„Die ETH-Bibliothek begreift das Thema generative künstliche Intelligenz (KI) als Chance, um sich innerhalb der ETH Zürich bei der Vermittlung von Informationskompetenzen (IK) verstärkt als Kompetenzzentrum zu positionieren. Das Thema generative KI soll mit verschiedenen Themenbereichen der IK verzahnt und vermittelt werden. Um dies zu erreichen, geht sie das Thema auf drei Ebenen an: Zum einen in der Organisationsentwicklung und Personalentwicklung, zum anderen mit Vernetzung, Kollaborationen und Projekten innerhalb der Hochschule sowie zum dritten mit der Weiterentwicklung des Angebotsportfolios und der Bereitstellung von zusätzlichen Informationen für ihre Zielgruppen.“

KI in Geschichtswissenschaften

Mareike König: ChatGPT und Co. in den Geschichtswissenschaften – Grundlagen, Prompts und Praxisbeispiele. Digital Humanities am DHIP 21.08.2024
„Dies ist ein pragmatischer und praxisorientierter Beitrag zum Einsatz von KI-Tools wie ChatGPT und Co. in den Geschichtswissenschaften. Als begleitende Assistenten können sie für Historiker:innen bei einer Vielzahl von Aufgaben produktiv von Nutzen sein. Doch für welche konkret? Was muss man beachten? Und wie formuliert man gute Prompts? Der Beitrag behandelt technische Grundlagen, Möglichkeiten und Grenzen der Technologie, rechtlich-ethische Aspekte, KI-Tools für die Wissenschaft und potenzielle Einsatzbereiche in der Geschichtswissenschaft (inklusive Prompt-Beispiele). Weder soll damit der KI-Hype noch die KI-Skepsis befeuert, sondern ein Beitrag zur Vermittlung von KI-Kompetenz und damit zu einer verantwortungsvollen Nutzung von KI-Chatbots geleistet werden, über alle Karrierestufen hinweg.“

Vergleich der KI-Sprachmodelle

Katharina: Sprachmodell Marketing Olympiade 2024: ChatGPT-4o vs. Claude 3.5 vs. Gemini 1.5 vs. LLama 3 vs. Deutschland GPT vs. Microsoft Copilot, KI Marketing Bootcamp 12.07.2024
1. Welches ist das beste Sprachmodell 2024?
2. Leistungsvergleich der besten KI-Sprachmodelle im Marketing 2024
3. 1. Sprintdisziplin: Beste KI-Sprachmodelle für Social-Media-Posts 2024
4. 2. Marathondisziplin: Beste KI-Sprachmodelle für lange Blogartikel
5. 3. SEO-Hürdenlauf: Leistungsfähigkeit von KI-Sprachmodellen 2024
6. 4. Hochsprung: Kreative Marketingkampagnen mit KI-Sprachmodellen
7. 5. Staffellauf: Beste KI-Sprachmodelle für E-Mail-Marketing
8. 6. Wellenreiten: KI im visuellen Storytelling 2024
9. Gesamtanalyse: Vergleich der besten KI-Sprachmodelle 2024
10. Fazit der Marketing Olympiade: KI-Sprachmodelle im Überblick
11. Test-Settings: So wurden die KI-Sprachmodelle bewertet
12. KI im Marketing: Entscheidungsbaum für Sprachmodelle
13. Die Zukunft des KI-Marketings gestalten – mit dir!

Buchseite 1 von 4
1 2 3 4