Suchmaschinentest 2021 mit Known Item Search

Veröffentlicht am

Es gibt zahlreiche Suchmaschinentests, die sich häufig abstrakter Kriterien wie Datenschutz (oft nur anhand der Geschäftsbedingungen geprüft) bedienen oder aber eine Skalierung der Suchergebnisse behaupten, ohne die Suchen und Suchstrategien offenzulegen.
Der Historiker und Archivar Klaus Graf hat in seinem Blog Archivalia einen aktuellen Suchmaschinentest durchgeführt: „Großer Suchmaschinentest 2021: Alternativen zu Google?“ 
Durchgeführt wurden 18 Suchaufgaben aus dem Bereich Geschichte, davon 3 aus dem eigenen Blog Archivalia und 3 Digitalisate. Die meisten können als Known Item Search eingeordnet werden, wobei er die beste Suchmaschine auch als „Bookmarkersatz“ nutzt. Als Treffer wertet er teilweise nur, was auf Platz 1 der Trefferliste steht oder unter den ersten 5 Treffern erscheint. Graf kommt nach der Auswertung zu folgendem Ergebnis.
Google 180
Etools 180
Lukol 155
Startpage 125
Metager 90
Swisscows 90
Searchencrypt 80
Qwant 75
Bing 70
Duckduckgo 50
Erstaunlich ist vor allem das gute Abschneiden der Schweizer Suchmaschine Etools, Lukol und Startpage zehren von der Übernahme der Google Ergebnisse.
Eine Suchmaschine soll die fachlichen Bedürfnisse des Benutzers abdecken. Dass Graf diese operationalisiert und die Ergebnisse offenlegt, ist ein wichtiger Beitrag zur Evaluation von Suchmaschinen. Da es sich um Known Item Searches handelt und die fachliche Ausrichtung sehr speziell ist, kann dieses Ergebnis als wichtige Anregung, aber nicht als repräsentativ betrachtet werden. Evaluation von Suchmaschinen anhand von zusätzlichen Themen- , Fakten- und Produktrecherchen unter Einbeziehung von Recherchestrategien sind allerdings sehr schwierig durchzuführen.

Europäischer Suchindex

Veröffentlicht am

Nick Schilken: Europäischer Suchindex – nachhaltig zur Google-Alternative, digitalcourage 16.03.2021 beschreibt die Notwendigkeit eines Europäischen Suchindex.
„1. Europa wäre nicht mehr darauf angewiesen, auf Indizes aus USA, Russland und China zuzugreifen – somit wird die Souveränität gestärkt.
2. Europäische Gesetze und Werte bilden den Rahmen für den Suchindex und somit auch für Suchmaschinen und andere Produkte, die auf ihm aufbauen. Eine Vielfalt an Suchmaschinen ist förderlich für die Demokratie weltweit.
3. Es gibt die Möglichkeit für neue Geschäftsmodelle von Suchmaschinen, die nicht „pseudo-gratis im Tausch gegen Nutzerdaten“ sind. Nutzer.innen könnten zum Beispiel Suchmaschinen ihrer Wahl – per Abo, als Genossenschaft oder durch Spenden – finanzieren.
4. Die EU kann sicherstellen, dass der Index zu fairen Konditionen nutzbar ist und dass ein gesunder Wettbewerb stattfindet.
5. Wir verlassen uns momentan auf einzelne Suchmaschinen, die uns keinen Einblick in den Aufbau ihrer Suchalgorithmen und Datensammlungen erlauben. Dadurch wird Manipulation und Missbrauch ermöglicht.
6. Der Zugang zu Daten, Informationen und Wissen kann momentan gemäß wirtschaftlichen oder politischen Interessen des jeweiligen Anbieters eingeschränkt werden.“

Der Index sollte möglichst alle Inhalte des Web umfassen und allen Zugriff ermöglichen. Des Weiteren sollte er am besten durch die EU finanziert, jedoch staatsfern und unabhängig organisiert werden, um einseitige politische Einflussnahme zu vermeiden. Dementsprechend sollten auch die AGB gestaltet werden. Der Aufbau eines offenen Suchindex stellt demnach eine Infrastrukturaufgabe dar, die für die Trennung von öffentlich finanzierter Infrastruktur und privatwirtschaftlich betriebenen Diensten sorgt. Diese Infrastruktur lässt sich vergleichen mit Stromnetzen oder Straßen, die grundsätzlich zu Privatzwecken, aber auch zu unternehmerischen Zwecken genutzt werden dürfen. Die Verantwortung, einen sicheren und fairen Zugang zu schaffen, bleibt jedoch Aufgabe des Staates beziehungsweise der europäischen Staaten.“

Weiterführende Links und Quellen werden im Anhang aufgeführt.

Paradise lost

Veröffentlicht am

Die Vertreibung aus dem digitalen Paradies

Digitale Teilhabe bedeutet, dass man die Dienstleistungen verschiedener Anbieter im digitalen Raum in Anspruch nehmen kann. Google, Facebook, Microsoft, Apple stehen hier exemplarisch für Dienstleister, mit denen ein privatrechtlicher Vertrag geschlossen wird, in dem  deren Teilnahmebedingungen anerkannt werden müssen. Dabei ist oft unklar, ob die dort gespeicherten Daten den Diensten übertragen wurden, also mit den zur Verfügung gestellten Diensten verknüpft sind, oder ob sie noch dem Urheber gehören. Diese Frage stellt sich unabhängig davon, ob dem Benutzer ein Export seiner Daten mit den Mitteln der Software des Dienstes gestattet wird. Auch eine teilweise und zeitweise Lizenzierung, wie Facebook es fordert („Du gibst uns eine nicht-exklusive, übertragbare, unterlizenzierbare, unentgeltliche, weltweite Lizenz für die Nutzung jeglicher IP-Inhalte, die du auf oder im Zusammenhang mit Facebook postest („IP-Lizenz“). Diese IP-Lizenz endet, wenn du deine IP-Inhalte oder dein Konto löscht, außer deine Inhalte wurden mit anderen Nutzern geteilt und diese haben sie nicht gelöscht.“)  ist nur Teil des Problems. Was ist, wenn die Mails, Daten und Multimediadaten nur dort gesichert sind, weil man sie dort – etwa in der Cloud – sicher wähnte oder von verschiedenen Endgeräten nutzen wollte.

Inzwischen häufen sich Fälle, in denen Benutzer aus teilweise nicht ersichtlichen Kriterien von den Diensten ausgeschlossen werden. Dabei ist der Zugriff nicht nur auf die Dienste, sondern auch auf die persönlichen gespeicherten Daten (Mails, Dokumente, Bilder usw.) gesperrt. Im schlimmsten Fall droht ein Verlust der kompletten digitalen Identität mit allen Folgen in der analogen Welt. Gesperrt wird augenscheinlich durch Bots, gegen deren Entscheidung kaum Gegenwehr möglich ist. „Die mächtigsten und reichsten Kommunikationsplattformen der Welt bieten kaum Kommunikationskanäle für Menschen, denen der Zugang zu dieser Infrastruktur verwehrt wird.“ 
Die Folgerung kann nur sein, dass man alle wichtigen Mails und Dokumente zusätzlich zur Speicherung in der Cloud lokal sichert.

Simon Hurtz: Und plötzlich ist das Online-Konto weg. Millionen Menschen legen ihr digitales Leben in die Hände von Facebook oder Google. Wenn die Plattformen den Zugriff sperren, beginnt für viele Betroffene ein Albtraum. Süddeutsche Zeitung 24.03.2921

Jens Berger: Ausgeschlossen aus der schönen neuen Welt Nachdenkseiten 19.03.2021

Günter Born: Digitale Amnesie durch willkürliche Kontensperrungen. Viele Microsoft-Dienste lassen sich nur mit einem Microsoft-Konto verwenden. Sperrt Microsoft ein Konto, wird die digitale Identität, die daran hängt, ausradiert. Für die Betroffenen gibt es keine Möglichkeit, dagegen vorzugehen. Golem 18.08.2020

Jens Herforth: Google Account wurde deaktiviert – In diesem Fall zu Unrecht geschehen Giga 21.03.2013

Rolf Schwartmann: Titanic-Magazin nicht mehr im Play-Store: Von der Google-Knute befreit. web.de 17.02.2021

TITANIC verlässt den Google-„Play Store“ Pressemitteilung 15.02.2021

Das Dilemma der Algorithmen und Daten

Veröffentlicht am

Kai Burkhardt, Kamala Harris. Die Frau, die Google und Facebook zerschlagen kann – wenn sie will, Die Welt 14.12. (hinter der Bezahlschranke) beschreibt, dass Harris aufgrund ihrer Kenntnisse der Tech-Firmen in Kalifornien in der Lage sein könnte, die Internetkonzerne zu deregulieren.

Zunächst geht er davon aus, dass die gesellschaftlichen Schäden, die insbesondere Social Media durch die Methoden der Nutzerführung und Manipulation erzeugt haben, „nicht mehr ohne Weiteres zu reparieren“ sind. „Die politischen Identitäten, die sich in den Resonanzräumen der Internetkonzerne gebildet haben, werden auch nicht einfach in den politischen Mainstream zurückkehren.“
Wer aber könnte die technischen und finanziellen Mittel verfügen, um diesen Prozess zu korrigieren, wenn nicht die Verursacher, die Internetkonzerne selbst? Die verschiedenen Aspekte dieses Dilemmas werden analysiert.
Programmierer zeichnen sich aufgrund ihrer Biographie in der Regel nicht durch gesellschaftliche Empathie aus. Ihre Produkte, die „Algorithmen sind nichts anders als die Verallgemeinerung von Hypothesen und Vorurteilen in den Köpfen von Programmieren.“ Der Programmcode zeigt sich letztlich an den Ergebnissen, der Code selbst aber kann kaum ohne Hilfe künstlicher Intelligenz darauf geprüft werden, was er nicht oder zur Zeit nicht liefert und was er in anderen Konstellationen liefern könnte. „Künstliche Intelligenz kann aufgrund ihrer schieren Komplexität also wiederum nur von einer anderen Künstlichen Intelligenz untersucht werden und da beißt sich nun die Katze in den Schwanz, denn das Ergebnis einer Simulation kann nicht simuliert werden.“ Aber selbst wenn dies gelänge, wären Algorithmen ohne Daten wertlos. Jenseits der von den Internetfirmen selbst erhobenen Daten gerät der Umgang mit Daten durch die Datamining-Firmen, die jegliche Arten von Daten zu Profilen verknüpfen, in eine neue Dimension. Burkhardt sieht eine Chance in einem zentralen „Open-Source-Katasteramt“, „das Datensätze nicht nur verwaltet, sondern auch erforscht und beschreibt, bevor sie an Dritte weitergegeben werden.“ Es wäre möglich, dass sich die Internetkonzerne unter dem politischen Druck einer Zerschlagung ihrer Konzernstrukturen in die Richtung eines anderen Umgangs mit Daten bewegen.

Huawei entwickelt neuartige Suchmaschine

Veröffentlicht am

Huawei hat mit mehreren Forschungsstellen in Amsterdam ein vierjähriges Projekt mit 10 Forscherstellen (Dreams Lab) vereinbart. Es handelt sich um Grundlagenforschung zur Entwicklung einer Suchmaschine der nächsten Generation.
„The DREAMS Lab (Dialogues, REAsoning and Multi-linguality for Search) is a collaboration between the Knowledge Representation and Reasoning group (KRR, Prof. dr. Frank van Harmelen) and the Computational Lexicology & Terminology Lab (CLTL, Prof. dr. Piek Vossen), both at VU Amsterdam; the Information and Language Processing Systems at the UVA (Prof. dr. Maarten de Rijke) and the Huawei Consumer Business Group, a world leading provider of cloud services for customers.“
Huawei erweitert sein Amsterdamer Team außerdem auf bis zu 100 Mitarbeiter.

„The mission of the lab is to ensure that the next generation of search technology should be ubiquitousaccurate, flexiblerelevant, intelligenthumane and safe.

  • Ubiquitous– ambient, anytime and anywhere
  • Accurate– maximally correct & complete
  • Flexible– take more than one type of modality as a query to retrieve relevant data in any type of modality
  • Relevant – provide the most relevant information to the user, learn to adapt to user behavior, to understand the user search intents
  • Intelligent– generate well-formed and meaningful responses based on retrieved information and context
  • Humane– leverage human-curated knowledge bases, present human-readable results, adopt linguistically and culturally appropriate dialogue patterns
  • Safe –preserve privacy, prevent undesirable or harmful content“

Stephan Finsterbusch, Klaus Max Smolka und Hendrik Ankenbrand: Huawei entwickelt eine eigene Suchmaschine FAZ vom 28.8.2020 (hinter der Bezahlschranke) schildern den Hintergrund des Projekt (Konflikt mit USA, eventuelle Sicherheitsbedenken) und bringen es auf den Punkt:
„Auf dieser Agenda stehen Amsterdam und die Entwicklung eigener Suchmaschinen-Techniken nun ganz weit oben. Könnte es doch über kurz oder lang nicht nur die Karten auf dem knapp 125 Milliarden Dollar großen Markt für die Internetwerbung neu mischen. Es könnte auch das Kräfteverhältnis in einer der Schlüsselbranchen der modernen Wirtschaft neu austarieren“.

Suchmaschinen spielen in der europäischen und deutschen Digitalpolitik keine Rolle. Die Subventionsruine Quaero hatte mit Suchmaschinen nichts tun. Auch die Open Search Foundation, die auf die Erstellung eines gemeinfreien Index abzielt, in dem die Inhalte keinen ökonomischen Zwängen unterworfen werden und besonders auch europäische Inhalte nicht untergehen, wird von europäischer und deutscher Politik bislang nicht unterstützt.

Wie singt so schön Herbert Grönemeyer:
„Wir feiern hier ’ne Party
Und du bist nicht dabei“

Google: Die nationale Informationsblase verlassen

Veröffentlicht am

Recherchemeisterin weist in ihrem Blog „Profi-Wissen“ auf ein Problem bei der Google-Suche hin. Will man sich aus der nationalen Informationsblase befreien und thematisch in anderen Ländern und Sprachen suchen, so ist dies nicht mehr so einfach möglich.
„Die Bearbeitung des Standorts durch die Eingabe einer Stadt oder Postleitzahl ist nicht mehr möglich. Google ermittelt den Standort nun von alleine zuverlässig“, schreibt Google.
Selbst wenn ich also in der Adressleiste google.fr eingebe, verbleibe ich im deutschen Index- und Werbebereich. Das frühere Kommando ncr (no country redirect – z.B. google.fr/ncr) existiert außerdem nicht mehr. Aber auch das von ihr dargestellte Möglichkeit, „google France“ zu suchen und das Ergebnis zu übernehmen, funktioniert nicht mehr. Es verbleibt nur eine Möglichkeit:
– Suchbegriff eingeben
– Unter Einstellungen -> Sucheinstellungen „Regionseinstellungen“ das Land auswählen. Jetzt erscheint als Standort „France Position inconnue“. Aber erst wenn noch unter „Sprachen“ francais ausgewählt wird, erscheinen keine deutschsprachigen Ergebnisse mehr und wir verlassen die deutschsprachige Werbewolke.

Voreingestellte Suchmaschinen in Android. Google als Gatekeeper

Veröffentlicht am

Deutlicher könnte Google seine Funktion als Gatekeeper, der entscheidet, was sichtbar ist und was nicht, klarmachen: Die EU hat Google verpflichtet, zu ermöglichen, dass andere Suchmaschinen als Standard voreingestellt werden. Google löst dies, indem es sich die Voreinstellung bezahlen lässt. Alle vier Monate wird eine Auktion durchgeführt, welche drei andere Suchmaschinen außer Google bei der Einrichtung des Adroid-System voreingestellt werden können. Die gebotenen Summen sind nicht bekannt. Die Liste der Gewinner für den Zeitraum März bis Juni 2020 zeigt, dass vor allem DuckDuck Go, Info.Com und GMX auftauchen, die alle auf den Google-Index zugreifen. Eine echte Alternative ist damit nicht möglich. Larissa Holzki: Konkurrenten verärgert über Google. Android-Nutzer sollen nach einer EU-Entscheidung künftig zwischen Standard-Suchmaschinen wählen können. Doch Google lässt der Konkurrenz nur vermeintlich eine Chance., in: Handelsblatt 12.01.2020 schildert die Kritik an dieser Vorgehensweise und zieht eine Bilanz. „Die EU-Kommission könnte die Reaktion auf ihre Entscheidung im vergangenen Jahr als unzureichend ahnden. „Qwant und andere haben bereits auf die Ineffektivität des Mechanismus hingewiesen und werden nun weitere Belege dafür bringen“, sagte Thomas Höppner dem Handelsblatt.“

Würde Platon googeln?

Veröffentlicht am

Adrian Lobe: Würde Platon googeln?, In: Neue Zürcher Zeitung 16.6.2017 reflektiert unter Bezug auf das Buch von Rebecca Newberger Goldstein „Plato at the Googleplex“ , in dem Platon ein Gespräch mit einem Google-Programmierer führt, das Verhältnis verschiedener Auffassungen von Wahrheit, ihrer Voraussetzung und Reflektion.

Ist Wahrheit die Sammlung, Indexierung und Verknüpfung von „genügend“ Daten, so dass der Kern der Wahrheit sich aus dem Maß der Daten herausschält? Die Maschine trifft hier bestimmte Vorannahmen, die wiederum von den Programmierern bestimmt werden. „Der Ausschluss von Experten würde in einer Philosophenherrschaft münden: Die Programmierer avancierten zu Philosophenkönigen.“ Oder zielt Wahrheit auf Reflektion, die bloße Wirklichkeit transzendiert, ein Bewusstsein hat, woher, wie und mit welchen Schranken wir wissen. „Nach Platon korrumpiert nichts die Suche nach Wahrheit so sehr wie die Gewissheit, dass man bereits in ihrem Besitz ist. Genau das suggeriert der algorithmische Absolutionsanspruch nämlich – den Trugschluss, Daten hätten eine Eigenevidenz.“

Filterblase bei Google?

Veröffentlicht am

Die Personalisierung von Suchergebnissen der Suchmaschinen und die Vernetzung der sozialen Netzwerke hat Vor- und Nachteile. Wenn ich mich für Golf als Sport interessiere und Treffer, die sich mit dem Auto oder dem Golfstrom befassen, nicht anklicke, zeigen die Algorithmen mir in Zukunft  ähnliche Treffer und die dazugehörige Werbung an. Je häufiger ich bestimmte Seiten anklicke, desto häufiger werden sie angezeigt. Im Extremfall wird mir die eigene Webseite an einer der ersten Stelle der Suchergebnisse angezeigt, weil sie ständig kontrolliert und aufgerufen wird, während sie für alle anderen Nutzer fast unsichtbar ist. Auch das Gerät, PC, Tablet, Handy mit Betriebssystem und Browser werden ausgelesen. Bei der gleichen Suchfrage erhält man mit unterschiedlichen Geräten unterschiedliche Suchergebnisse und teilweise auch unterschiedliche Preise in Internetshops und bei der Buchung von Reisen.
Ob daraus eine Filterblase entsteht, ist umstritten. Siehe z.B. Sebastian Meinek: Deshalb ist „Filterblase“ die blödeste Metapher des Internets, motherboard 9.3.2018 
Auf jeden Fall kann ich dem als Benutzer aktiv entgegentreten, indem ich Suchverlauf und Cookies regelmäßig lösche, den Browser durch ergänzende Tools wie Ghostery absichere oder noch besser, von vornherein in einer virtuellen Umgebung unterwegs bin. Außerdem bin ich als Benutzer aktiv gefordert und nicht willenloses Objekt der Suchmaschine: Fuck the Bubble: So bringst du deine Filterblase zum Platzen

Konkrete Untersuchungen zu den Auswirkungen der Personalisierung sind leider bislang nicht überzeugend. Das
Forschungsprojekt „#Datenspende: Google und die Bundestagswahl 2017“  hat sich jetzt dieser Problematik gewidmet. Die Untersuchung beruht auf der Suche nach 9 Politikern und Parteien, die in regelmäßigen Abständen wiederholt wurden. Als Ergebnis stellte sich heraus, dass die Suchergebnisse nur unwesentlich voneinander abweichen.
Die Problematik bei dieser Studie liegt bei der Art der Suchfragen. Sie beschränken sich auf das, was man im Retrieval Known-Item-Search bezeichnet, die Suche nach Fakten, die man schon vorher kennt. Die Aussagekraft ist also sehr begrenzt. Welche Folgen Personalisierung unter welchen Umständen auf die Informationsversorgung haben kann, ist damit nicht geklärt.

Page 1 of 2
1 2