Huawei entwickelt neuartige Suchmaschine

Veröffentlicht am

Huawei hat mit mehreren Forschungsstellen in Amsterdam ein vierjähriges Projekt mit 10 Forscherstellen (Dreams Lab) vereinbart. Es handelt sich um Grundlagenforschung zur Entwicklung einer Suchmaschine der nächsten Generation.
„The DREAMS Lab (Dialogues, REAsoning and Multi-linguality for Search) is a collaboration between the Knowledge Representation and Reasoning group (KRR, Prof. dr. Frank van Harmelen) and the Computational Lexicology & Terminology Lab (CLTL, Prof. dr. Piek Vossen), both at VU Amsterdam; the Information and Language Processing Systems at the UVA (Prof. dr. Maarten de Rijke) and the Huawei Consumer Business Group, a world leading provider of cloud services for customers.“
Huawei erweitert sein Amsterdamer Team außerdem auf bis zu 100 Mitarbeiter.

„The mission of the lab is to ensure that the next generation of search technology should be ubiquitousaccurate, flexiblerelevant, intelligenthumane and safe.

  • Ubiquitous– ambient, anytime and anywhere
  • Accurate– maximally correct & complete
  • Flexible– take more than one type of modality as a query to retrieve relevant data in any type of modality
  • Relevant – provide the most relevant information to the user, learn to adapt to user behavior, to understand the user search intents
  • Intelligent– generate well-formed and meaningful responses based on retrieved information and context
  • Humane– leverage human-curated knowledge bases, present human-readable results, adopt linguistically and culturally appropriate dialogue patterns
  • Safe –preserve privacy, prevent undesirable or harmful content“

Stephan Finsterbusch, Klaus Max Smolka und Hendrik Ankenbrand: Huawei entwickelt eine eigene Suchmaschine FAZ vom 28.8.2020 (hinter der Bezahlschranke) schildern den Hintergrund des Projekt (Konflikt mit USA, eventuelle Sicherheitsbedenken) und bringen es auf den Punkt:
„Auf dieser Agenda stehen Amsterdam und die Entwicklung eigener Suchmaschinen-Techniken nun ganz weit oben. Könnte es doch über kurz oder lang nicht nur die Karten auf dem knapp 125 Milliarden Dollar großen Markt für die Internetwerbung neu mischen. Es könnte auch das Kräfteverhältnis in einer der Schlüsselbranchen der modernen Wirtschaft neu austarieren“.

Suchmaschinen spielen in der europäischen und deutschen Digitalpolitik keine Rolle. Die Subventionsruine Quaero hatte mit Suchmaschinen nichts tun. Auch die Open Search Foundation, die auf die Erstellung eines gemeinfreien Index abzielt, in dem die Inhalte keinen ökonomischen Zwängen unterworfen werden und besonders auch europäische Inhalte nicht untergehen, wird von europäischer und deutscher Politik bislang nicht unterstützt.

Wie singt so schön Herbert Grönemeyer:
„Wir feiern hier ’ne Party
Und du bist nicht dabei“

Google: Die nationale Informationsblase verlassen

Veröffentlicht am

Recherchemeisterin weist in ihrem Blog „Profi-Wissen“ auf ein Problem bei der Google-Suche hin. Will man sich aus der nationalen Informationsblase befreien und thematisch in anderen Ländern und Sprachen suchen, so ist dies nicht mehr so einfach möglich.
„Die Bearbeitung des Standorts durch die Eingabe einer Stadt oder Postleitzahl ist nicht mehr möglich. Google ermittelt den Standort nun von alleine zuverlässig“, schreibt Google.
Selbst wenn ich also in der Adressleiste google.fr eingebe, verbleibe ich im deutschen Index- und Werbebereich. Das frühere Kommando ncr (no country redirect – z.B. google.fr/ncr) existiert außerdem nicht mehr. Aber auch das von ihr dargestellte Möglichkeit, „google France“ zu suchen und das Ergebnis zu übernehmen, funktioniert nicht mehr. Es verbleibt nur eine Möglichkeit:
– Suchbegriff eingeben
– Unter Einstellungen -> Sucheinstellungen „Regionseinstellungen“ das Land auswählen. Jetzt erscheint als Standort „France Position inconnue“. Aber erst wenn noch unter „Sprachen“ francais ausgewählt wird, erscheinen keine deutschsprachigen Ergebnisse mehr und wir verlassen die deutschsprachige Werbewolke.

Symposium Open Search

Veröffentlicht am

Die Open Search Fundation lädt ein zum Second International Symposium on Open Search Technology :

„Dear Experts, Supporters and Friends of Open Internet Search,
We are pleased to announce the 2nd international Open Search Symposium (OSSYM) to be held at CERN, Geneva, May 25-27, 2020.
Building on the networks and cooperation initiated among research groups and experts in the context of Open Search in the past years, we will reconvene for the Open Search Symposium 2020, at the cradle of the web, at CERN Geneva in this coming May. The OSSYM 2020 will provide space for networking within research communities but also connect across domains and disciplines for establishing future cooperation, partnerships and projects .
The development of an European open Internet search community and infrastructure requires know-how and contributions from many scientific and technical fields. It requires profound understanding of internet search technologies and new thinking for services and innovative applications, to be built on an open and distributed Internet search infrastructure in and for Europe.
We are calling for your active participation in the Open Search Symposium 2020 in various formats: with scientific papers, sharing of practical experiences or by introducing concepts and positions during presentations and in the different interactive sessions.“

Die Beiträge des Symposiums 2019 stehen auf Zenodo zur Verfügung:
Jens Gäbeler: Entwicklung einer Steuerungskomponente zur Priorisierung von Aufträgen für verteilte Webcrawls
Anna Gröhn: Explizite und implizite Theorien von Schülerinnen und Schülern über die algorithmischen Sortierprozesse von Informationsintermediären
Stephan Hachinger; Jan Martinovic; Olivier Terzo; Cédric Koch-Hofer; Martin Golasowski; Mohamad Hayek; Marc Levrier; Alberto Scionti; Donato Magarielli; Thierry Goubier; Antonio Parodi; Sean Murphy; Florin-Ionut Apopei; Carmine D’Amico; Simone Ciccia; Massimo Sardo; Danijel Schorlemmer: The LEXIS approach to Searching and Managing FAIR Research Data in Converged HPC-Cloud-Big Data Architectures
Hans Hehl: Das Multisuchsystem E-Connect – Suchsystem für elektronische Zeitschriften und Literaturverwaltung
Phil Höfer: Websuche als Zero-Knowledge-Dienst
Pablo Panero; Ismael Posada Trobo; Carina Rafaela de Oliveira Antunes; Andreas Wagner; Citadel Search: Open Source Enterprise Search

Voreingestellte Suchmaschinen in Android. Google als Gatekeeper

Veröffentlicht am

Deutlicher könnte Google seine Funktion als Gatekeeper, der entscheidet, was sichtbar ist und was nicht, klarmachen: Die EU hat Google verpflichtet, zu ermöglichen, dass andere Suchmaschinen als Standard voreingestellt werden. Google löst dies, indem es sich die Voreinstellung bezahlen lässt. Alle vier Monate wird eine Auktion durchgeführt, welche drei andere Suchmaschinen außer Google bei der Einrichtung des Adroid-System voreingestellt werden können. Die gebotenen Summen sind nicht bekannt. Die Liste der Gewinner für den Zeitraum März bis Juni 2020 zeigt, dass vor allem DuckDuck Go, Info.Com und GMX auftauchen, die alle auf den Google-Index zugreifen. Eine echte Alternative ist damit nicht möglich. Larissa Holzki: Konkurrenten verärgert über Google. Android-Nutzer sollen nach einer EU-Entscheidung künftig zwischen Standard-Suchmaschinen wählen können. Doch Google lässt der Konkurrenz nur vermeintlich eine Chance., in: Handelsblatt 12.01.2020 schildert die Kritik an dieser Vorgehensweise und zieht eine Bilanz. „Die EU-Kommission könnte die Reaktion auf ihre Entscheidung im vergangenen Jahr als unzureichend ahnden. „Qwant und andere haben bereits auf die Ineffektivität des Mechanismus hingewiesen und werden nun weitere Belege dafür bringen“, sagte Thomas Höppner dem Handelsblatt.“

Alternative Suchmaschinen, ein Überblick von Digitalcourage

Veröffentlicht am

Digitalcourage e.V., ein Verein, der sich für Grundrechte und Datenschutz einsetzt, stellt auf ihrer Webseite Suchmaschinen vor, die eine Alternative zu Google sein können: „Es geht auch ohne Google – Alternative Suchmaschinen“. Bewertet werden MetaGer , DuckDuckGo , eTools.ch, Qwant , Searx , Startpage , YaCy. Beschrieben werden Datenschutz, die Personalisierung von Daten, aber auch, wie die Indizes aufgebaut sind und wie die Suchergebnisse ausfallen. Empfohlen wird die Suchmaschine Metager, die mit einer Suche in  Startpage durch ein einfaches Kommando kombiniert werden kann.

Podcasts suchen

Veröffentlicht am

Podcasts kann man beim IPhone über iTunes suchen, bei Android Geräten im Google Play Store mit dem Stichwort Podcast. Über die interne Suche in den Apps hinaus ermöglichen spezielle Webseiten das Hören und Aufnehmen von Podcast. Im Deutschen https://www.phonostar.de/, im englischsprachigen Bereich http://www.podcasts.com/,  https://www.mixcloud.com/, https://audioboom.com/, https://www.acast.com .

Spezielle Suchmaschinen ermöglichen die Suche in den Inhalten selbst, indem die gesprochene Sprache in Text umgewandelt wird: https://www.listennotes.com/, https://fluiddata.com , https://www.spaactor.com/ (deutsch)

oder aber die Metadaten ausgelesen werden (alles deutsche Suchmaschinen):

https://fyyd.de/, https://panoptikum.io/, https://wissenschaftspodcasts.de/, https://www.podcast.de

Filterblase bei Google?

Veröffentlicht am

Die Personalisierung von Suchergebnissen der Suchmaschinen und die Vernetzung der sozialen Netzwerke hat Vor- und Nachteile. Wenn ich mich für Golf als Sport interessiere und Treffer, die sich mit dem Auto oder dem Golfstrom befassen, nicht anklicke, zeigen die Algorithmen mir in Zukunft  ähnliche Treffer und die dazugehörige Werbung an. Je häufiger ich bestimmte Seiten anklicke, desto häufiger werden sie angezeigt. Im Extremfall wird mir die eigene Webseite an einer der ersten Stelle der Suchergebnisse angezeigt, weil sie ständig kontrolliert und aufgerufen wird, während sie für alle anderen Nutzer fast unsichtbar ist. Auch das Gerät, PC, Tablet, Handy mit Betriebssystem und Browser werden ausgelesen. Bei der gleichen Suchfrage erhält man mit unterschiedlichen Geräten unterschiedliche Suchergebnisse und teilweise auch unterschiedliche Preise in Internetshops und bei der Buchung von Reisen.
Ob daraus eine Filterblase entsteht, ist umstritten. Siehe z.B. Sebastian Meinek: Deshalb ist „Filterblase“ die blödeste Metapher des Internets, motherboard 9.3.2018 
Auf jeden Fall kann ich dem als Benutzer aktiv entgegentreten, indem ich Suchverlauf und Cookies regelmäßig lösche, den Browser durch ergänzende Tools wie Ghostery absichere oder noch besser, von vornherein in einer virtuellen Umgebung unterwegs bin. Außerdem bin ich als Benutzer aktiv gefordert und nicht willenloses Objekt der Suchmaschine: Fuck the Bubble: So bringst du deine Filterblase zum Platzen

Konkrete Untersuchungen zu den Auswirkungen der Personalisierung sind leider bislang nicht überzeugend. Das
Forschungsprojekt „#Datenspende: Google und die Bundestagswahl 2017“  hat sich jetzt dieser Problematik gewidmet. Die Untersuchung beruht auf der Suche nach 9 Politikern und Parteien, die in regelmäßigen Abständen wiederholt wurden. Als Ergebnis stellte sich heraus, dass die Suchergebnisse nur unwesentlich voneinander abweichen.
Die Problematik bei dieser Studie liegt bei der Art der Suchfragen. Sie beschränken sich auf das, was man im Retrieval Known-Item-Search bezeichnet, die Suche nach Fakten, die man schon vorher kennt. Die Aussagekraft ist also sehr begrenzt. Welche Folgen Personalisierung unter welchen Umständen auf die Informationsversorgung haben kann, ist damit nicht geklärt.

Millionshort

Veröffentlicht am

Die Suchmaschine mit Filter

Million Short ist eine in Kanada seit 2012 entwickelt Suchmaschine, die dem Benutzer gerade die nicht am häufigsten angezeigten oder mit Suchmaschinenoptimierung präparierten Webseiten erschließen will.
Das „Mission Statment“: „Million Short’s mission is to guide people on the road less traveled by providing alternate methods of organizing, accessing, and discovering the vast web of information that is the Internet.“
Million Short benutzt dafür die API von Bing und ermittelt mit eigenen Crawlern die auszuschließenden Seiten. Filter können außerdem nach E-Commerce, Live-Chat, Datum und Land gesetzt werden.

 

Qwant: Interview zum Geschäftsmodell

Veröffentlicht am

In der Frankfurter Rundschau ist ein Interview mit Eric Léandri, 14.04.2018 Chef der europäischen Suchmaschine Qwant, erschienen. Er stellt sein Geschäftsmodell vor. Besonders wird betont, dass Qwant kein Benutzer-Tracking macht und Resultate neutral darstellt.

Unklar bleibt, auf welcher Datenbasis Qwant arbeitet: „Wir arbeiten gerade mit Hochdruck daran, einen eigenen kompletten Index mit allen Seiten, die bei Suchen durchforstet werden, aufzubauen, um eine echte eigene Suchmaschine für Europa zu bieten. „Wahrscheinlich werden allerdings hauptsächlich Daten von der Schnittstelle von Bing übernommen, obwohl offiziell behauptet wird, dass eine formale Kooperation zwischen Qwant und Bing nicht besteht: „Die allgemeine „Netz“-Spalte in Deutschland sei statt dessen eine bunte Mischung aus verschiedenen öffentlich zugänglichen Netzquellen, wie das auch die Meta-Suchmaschine Duckduckgo macht. “ (Qwant zeigt Google die Zähne, DW 12.04.2014)

Die Suchergebnisse werden mit eigener Gewichtung angezeigt: „Wir wollen nicht Google sein, und wir wollen Google nicht kopieren. Wir arbeiten längst mit unserem eigenen Algorithmus bei der Auflistung der Suchergebnisse, der mehrere Jahre getestet wurde.“

Das entscheidende – und daher auch geheimgehaltene  -Kriterium ist aber, ob zeitnah Inhalte durchsucht und ein umfassender Index aufgebaut werden kann. Wir erinnern uns an eine Suchmaschine Cuil, die von ehemaligen Google Mitarbeitern gegründet wurde.  Sie behauptete, einen drei Mal größeren Index als Google zu haben und ebenfalls Nutzerdaten nicht zu tracken. Cuil wurde nach zwei Jahren abgeschaltet, nachdem das Risikokapital aufgebraucht war.

Page 1 of 2
1 2