Startpage als alternative Suchmaschine

Simon Hurtz hat ein Interview mit Startpage-Chef Robert E.G. Beens durchgeführt. Süddeutsche Zeitung 29.06.20121 (hinter der Bezahlschranke)
Startpage als alternative Suchmaschine soll sich danach besonders durch den Datenschutz von anderen Suchmaschinen abheben. Die Suchergebnisse selbst werden von Google übernommen. “Google liefert uns nur die Ergebnisse, wir bezahlen sie dafür. Es fließen keine anderen Daten, wir tracken nicht, legen keine Profile an, speichern nichts.” Im Unterschied zu Google schaltet Startpage keine verhaltensbasierte, sondern nur kontextbezogene Werbung, d.h. es werden Anzeigen angezeigt, die sich direkt auf die Suchfrage beziehen.
Beens betont die Wichtigkeit des Datenschutzes für Suchmaschinen, aber  auch allgemein im Internet, wenn Datenpunkte gespeichert und zu Persönlichkeitsprofilen verknüpft werden. Die Nutzung alternativer Suchmaschinen oder Messenger sieht er als wichtigen Schritt an, um Firmen zu einem anderen Geschäftsmodell zu zwingen. 
– 
Startpage hat allerdings weder in dem Zugriff auf die Daten von Google noch in Sachen Datenschutz ein Alleinstellungsmerkmal. Die Evaluation von Suchmaschinen für die unterschiedlichen Bedürfnisse und Zwecke bleibt nach wie vor eine wichtige Aufgabe.

Suchmaschinentest 2021 mit Known Item Search

Es gibt zahlreiche Suchmaschinentests, die sich häufig abstrakter Kriterien wie Datenschutz (oft nur anhand der Geschäftsbedingungen geprüft) bedienen oder aber eine Skalierung der Suchergebnisse behaupten, ohne die Suchen und Suchstrategien offenzulegen.
Der Historiker und Archivar Klaus Graf hat in seinem Blog Archivalia einen aktuellen Suchmaschinentest durchgeführt: “Großer Suchmaschinentest 2021: Alternativen zu Google?” 
Durchgeführt wurden 18 Suchaufgaben aus dem Bereich Geschichte, davon 3 aus dem eigenen Blog Archivalia und 3 Digitalisate. Die meisten können als Known Item Search eingeordnet werden, wobei er die beste Suchmaschine auch als “Bookmarkersatz” nutzt. Als Treffer wertet er teilweise nur, was auf Platz 1 der Trefferliste steht oder unter den ersten 5 Treffern erscheint. Graf kommt nach der Auswertung zu folgendem Ergebnis.
Google 180
Etools 180
Lukol 155
Startpage 125
Metager 90
Swisscows 90
Searchencrypt 80
Qwant 75
Bing 70
Duckduckgo 50
Erstaunlich ist vor allem das gute Abschneiden der Schweizer Suchmaschine Etools, Lukol und Startpage zehren von der Übernahme der Google Ergebnisse.
Eine Suchmaschine soll die fachlichen Bedürfnisse des Benutzers abdecken. Dass Graf diese operationalisiert und die Ergebnisse offenlegt, ist ein wichtiger Beitrag zur Evaluation von Suchmaschinen. Da es sich um Known Item Searches handelt und die fachliche Ausrichtung sehr speziell ist, kann dieses Ergebnis als wichtige Anregung, aber nicht als repräsentativ betrachtet werden. Evaluation von Suchmaschinen anhand von zusätzlichen Themen- , Fakten- und Produktrecherchen unter Einbeziehung von Recherchestrategien sind allerdings sehr schwierig durchzuführen.

Huawei entwickelt neuartige Suchmaschine

Huawei hat mit mehreren Forschungsstellen in Amsterdam ein vierjähriges Projekt mit 10 Forscherstellen (Dreams Lab) vereinbart. Es handelt sich um Grundlagenforschung zur Entwicklung einer Suchmaschine der nächsten Generation.
„The DREAMS Lab (Dialogues, REAsoning and Multi-linguality for Search) is a collaboration between the Knowledge Representation and Reasoning group (KRR, Prof. dr. Frank van Harmelen) and the Computational Lexicology & Terminology Lab (CLTL, Prof. dr. Piek Vossen), both at VU Amsterdam; the Information and Language Processing Systems at the UVA (Prof. dr. Maarten de Rijke) and the Huawei Consumer Business Group, a world leading provider of cloud services for customers.”
Huawei erweitert sein Amsterdamer Team außerdem auf bis zu 100 Mitarbeiter.

“The mission of the lab is to ensure that the next generation of search technology should be ubiquitousaccurate, flexiblerelevant, intelligenthumane and safe.

  • Ubiquitous– ambient, anytime and anywhere
  • Accurate– maximally correct & complete
  • Flexible– take more than one type of modality as a query to retrieve relevant data in any type of modality
  • Relevant – provide the most relevant information to the user, learn to adapt to user behavior, to understand the user search intents
  • Intelligent– generate well-formed and meaningful responses based on retrieved information and context
  • Humane– leverage human-curated knowledge bases, present human-readable results, adopt linguistically and culturally appropriate dialogue patterns
  • Safe –preserve privacy, prevent undesirable or harmful content”

Stephan Finsterbusch, Klaus Max Smolka und Hendrik Ankenbrand: Huawei entwickelt eine eigene Suchmaschine FAZ vom 28.8.2020 (hinter der Bezahlschranke) schildern den Hintergrund des Projekt (Konflikt mit USA, eventuelle Sicherheitsbedenken) und bringen es auf den Punkt:
„Auf dieser Agenda stehen Amsterdam und die Entwicklung eigener Suchmaschinen-Techniken nun ganz weit oben. Könnte es doch über kurz oder lang nicht nur die Karten auf dem knapp 125 Milliarden Dollar großen Markt für die Internetwerbung neu mischen. Es könnte auch das Kräfteverhältnis in einer der Schlüsselbranchen der modernen Wirtschaft neu austarieren“.

Suchmaschinen spielen in der europäischen und deutschen Digitalpolitik keine Rolle. Die Subventionsruine Quaero hatte mit Suchmaschinen nichts tun. Auch die Open Search Foundation, die auf die Erstellung eines gemeinfreien Index abzielt, in dem die Inhalte keinen ökonomischen Zwängen unterworfen werden und besonders auch europäische Inhalte nicht untergehen, wird von europäischer und deutscher Politik bislang nicht unterstützt.

Wie singt so schön Herbert Grönemeyer:
„Wir feiern hier ‘ne Party
Und du bist nicht dabei”

Symposium Open Search

Die Open Search Fundation lädt ein zum Second International Symposium on Open Search Technology :

“Dear Experts, Supporters and Friends of Open Internet Search,
We are pleased to announce the 2nd international Open Search Symposium (OSSYM) to be held at CERN, Geneva, May 25-27, 2020.
Building on the networks and cooperation initiated among research groups and experts in the context of Open Search in the past years, we will reconvene for the Open Search Symposium 2020, at the cradle of the web, at CERN Geneva in this coming May. The OSSYM 2020 will provide space for networking within research communities but also connect across domains and disciplines for establishing future cooperation, partnerships and projects .
The development of an European open Internet search community and infrastructure requires know-how and contributions from many scientific and technical fields. It requires profound understanding of internet search technologies and new thinking for services and innovative applications, to be built on an open and distributed Internet search infrastructure in and for Europe.
We are calling for your active participation in the Open Search Symposium 2020 in various formats: with scientific papers, sharing of practical experiences or by introducing concepts and positions during presentations and in the different interactive sessions.”

Die Beiträge des Symposiums 2019 stehen auf Zenodo zur Verfügung:
Jens Gäbeler: Entwicklung einer Steuerungskomponente zur Priorisierung von Aufträgen für verteilte Webcrawls
Anna Gröhn: Explizite und implizite Theorien von Schülerinnen und Schülern über die algorithmischen Sortierprozesse von Informationsintermediären
Stephan Hachinger; Jan Martinovic; Olivier Terzo; Cédric Koch-Hofer; Martin Golasowski; Mohamad Hayek; Marc Levrier; Alberto Scionti; Donato Magarielli; Thierry Goubier; Antonio Parodi; Sean Murphy; Florin-Ionut Apopei; Carmine D’Amico; Simone Ciccia; Massimo Sardo; Danijel Schorlemmer: The LEXIS approach to Searching and Managing FAIR Research Data in Converged HPC-Cloud-Big Data Architectures
Hans Hehl: Das Multisuchsystem E-Connect – Suchsystem für elektronische Zeitschriften und Literaturverwaltung
Phil Höfer: Websuche als Zero-Knowledge-Dienst
Pablo Panero; Ismael Posada Trobo; Carina Rafaela de Oliveira Antunes; Andreas Wagner; Citadel Search: Open Source Enterprise Search

Voreingestellte Suchmaschinen in Android. Google als Gatekeeper

Deutlicher könnte Google seine Funktion als Gatekeeper, der entscheidet, was sichtbar ist und was nicht, klarmachen: Die EU hat Google verpflichtet, zu ermöglichen, dass andere Suchmaschinen als Standard voreingestellt werden. Google löst dies, indem es sich die Voreinstellung bezahlen lässt. Alle vier Monate wird eine Auktion durchgeführt, welche drei andere Suchmaschinen außer Google bei der Einrichtung des Adroid-System voreingestellt werden können. Die gebotenen Summen sind nicht bekannt. Die Liste der Gewinner für den Zeitraum März bis Juni 2020 zeigt, dass vor allem DuckDuck Go, Info.Com und GMX auftauchen, die alle auf den Google-Index zugreifen. Eine echte Alternative ist damit nicht möglich. Larissa Holzki: Konkurrenten verärgert über Google. Android-Nutzer sollen nach einer EU-Entscheidung künftig zwischen Standard-Suchmaschinen wählen können. Doch Google lässt der Konkurrenz nur vermeintlich eine Chance., in: Handelsblatt 12.01.2020 schildert die Kritik an dieser Vorgehensweise und zieht eine Bilanz. “Die EU-Kommission könnte die Reaktion auf ihre Entscheidung im vergangenen Jahr als unzureichend ahnden. “Qwant und andere haben bereits auf die Ineffektivität des Mechanismus hingewiesen und werden nun weitere Belege dafür bringen”, sagte Thomas Höppner dem Handelsblatt.”

Alternative Suchmaschinen, ein Überblick von Digitalcourage

Digitalcourage e.V., ein Verein, der sich für Grundrechte und Datenschutz einsetzt, stellt auf ihrer Webseite Suchmaschinen vor, die eine Alternative zu Google sein können: “Es geht auch ohne Google – Alternative Suchmaschinen”. Bewertet werden MetaGer , DuckDuckGo , eTools.ch, Qwant , Searx , Startpage , YaCy. Beschrieben werden Datenschutz, die Personalisierung von Daten, aber auch, wie die Indizes aufgebaut sind und wie die Suchergebnisse ausfallen. Empfohlen wird die Suchmaschine Metager, die mit einer Suche in  Startpage durch ein einfaches Kommando kombiniert werden kann.

Millionshort

Die Suchmaschine mit Filter

Million Short ist eine in Kanada seit 2012 entwickelt Suchmaschine, die dem Benutzer gerade die nicht am häufigsten angezeigten oder mit Suchmaschinenoptimierung präparierten Webseiten erschließen will.
Das “Mission Statment”: “Million Short’s mission is to guide people on the road less traveled by providing alternate methods of organizing, accessing, and discovering the vast web of information that is the Internet.”
Million Short benutzt dafür die API von Bing und ermittelt mit eigenen Crawlern die auszuschließenden Seiten. Filter können außerdem nach E-Commerce, Live-Chat, Datum und Land gesetzt werden.

 

Qwant: Interview zum Geschäftsmodell

In der Frankfurter Rundschau ist ein Interview mit Eric Léandri, 14.04.2018 Chef der europäischen Suchmaschine Qwant, erschienen. Er stellt sein Geschäftsmodell vor. Besonders wird betont, dass Qwant kein Benutzer-Tracking macht und Resultate neutral darstellt.

Unklar bleibt, auf welcher Datenbasis Qwant arbeitet: “Wir arbeiten gerade mit Hochdruck daran, einen eigenen kompletten Index mit allen Seiten, die bei Suchen durchforstet werden, aufzubauen, um eine echte eigene Suchmaschine für Europa zu bieten. “Wahrscheinlich werden allerdings hauptsächlich Daten von der Schnittstelle von Bing übernommen, obwohl offiziell behauptet wird, dass eine formale Kooperation zwischen Qwant und Bing nicht besteht: “Die allgemeine “Netz”-Spalte in Deutschland sei statt dessen eine bunte Mischung aus verschiedenen öffentlich zugänglichen Netzquellen, wie das auch die Meta-Suchmaschine Duckduckgo macht. ” (Qwant zeigt Google die Zähne, DW 12.04.2014)

Die Suchergebnisse werden mit eigener Gewichtung angezeigt: “Wir wollen nicht Google sein, und wir wollen Google nicht kopieren. Wir arbeiten längst mit unserem eigenen Algorithmus bei der Auflistung der Suchergebnisse, der mehrere Jahre getestet wurde.”

Das entscheidende – und daher auch geheimgehaltene  -Kriterium ist aber, ob zeitnah Inhalte durchsucht und ein umfassender Index aufgebaut werden kann. Wir erinnern uns an eine Suchmaschine Cuil, die von ehemaligen Google Mitarbeitern gegründet wurde.  Sie behauptete, einen drei Mal größeren Index als Google zu haben und ebenfalls Nutzerdaten nicht zu tracken. Cuil wurde nach zwei Jahren abgeschaltet, nachdem das Risikokapital aufgebraucht war.

Quaero: Der Mythos von der europäischen Suchmaschine

Quaero (lateinisch: “Ich suche”) war ein französisch-deutsches Konsortialprojekt, an der über 30 Organisationen beteiligt und mehrere hundert Millionen Euro als Subvention verteilt wurden. Es wäre eine wichtige wissenschaftliche Arbeit, dies aufzuarbeiten. Wir müssen uns aus Zeitmangel mit drei Wikipedia-Eintragungen

https://fr.wikipedia.org/wiki/Quaero
https://de.wikipedia.org/wiki/Quaero
https://en.wikipedia.org/wiki/Quaero

und mit zwei kleinen Anfragen und zwei mündlichen Fragen des Bundestags bescheiden.

http://dip21.bundestag.de/dip21/btd/16/024/1602492.pdf#page=7 ,
http://dip21.bundestag.de/dip21/btd/16/035/1603565.pdf “Deutsch-Französisches Innovationsprojekt einer europäischen Suchmaschine Quaero”, http://dipbt.bundestag.de/doc/btd/16/041/1604102.pdf#page=12 , http://dip21.bundestag.de/dip21/btd/16/046/1604671.pdf
Aktuelle Entwicklungen des Suchmaschinenprojektes Theseus – ehemals Quaero
https://de.wikipedia.org/wiki/Theseus_(Forschungsprogramm)

(mehr …)

Alternative Suchmaschinen 2: Indizes

Ob man durch Anklicken von Werbeeinschaltungen Bäume in Afrika pflanzen kann https://www.ecosia.org/ mit Happiness Officer als Personal oder aber eine ernsthafte Alternative versucht wie metager – www.metager.de. Das Problem bleibt: Wo kommen die Daten, die Suchindizes her? Fast alle übernehmen ihre Daten von den Programmierschnittstellen (API) von Google und Bing/ Yahoo. Dafür muss entweder bezahlt werden, die Schaltung von Anzeigen oder die Übertragung von Nutzerdaten akzeptiert werden. Einige der alternativen Suchmaschinen lassen noch zusätzliche Crawler laufen über einige spezielle Gebiete. Aber sie sind nicht Herr der Daten. Wenn Google und Bing/Yahoo ihre API einstellen, sind sämtliche dieser Geschäftsmodelle zerstört, denn mit einem Crawler über Wikipedia und Chefkoch lässt sich keine überzeugende Suchmaschine erstellen.

Das Interesse von Google ist klar: Google hat das Monopol, und wenn man dieses angreifen und den Konzern zerschlagen sollte, ist diese API eine Argumentation, dass man der Konkurrenz selbst sogar Daten anbietet. Es ist im Grunde ein Baustein zur Aufrechterhaltung des Monopols.

Wo kommen die Daten her?

www.startpage.com Google
www.metager.de Yahoo (sowie eine Reihe von weiteren Suchmaschinen und Seiten, mit Klick auf dem + über der Suchleiste anzusehen)
www.qwant.com Bing sowie “eine bunte Mischung aus verschiedenen öffentlich zugänglichen Netzquellen” Qwant zeigt Google die Zähne, DW 12.04.2014
https://duckduckgo.com/ Yahoo, Yummly (Rezepte), Wikipedia

Dass Erstaunliche ist, dass diese Überblicke behaupten, die Suchergebnisse seien so gut wie die Suche mit Google – was meinen Erfahrungen eindeutig widerspricht.

Völlig ausgeblendet bleiben Baidu und Yandex , die nach Meinung von Suchmaschinenexperten jeweils selbständig einen Index aufbauen.

Buchseite 2 von 3
1 2 3