Grundlagen der Informationswissenschaft

Grundlagen der Informationswissenschaft, Herausgegeben von: Rainer Kuhlen , Dirk Lewandowski , Wolfgang Semar und Christa Womser-Hacker, 7.Auflage De Gruyter Saur 2023 steht als Open Access zur Lektüre und Download kostenlos zur Verfügung. In 73 Artikeln wird ein umfassender Überblick über alle Aspekte gegeben. Einzelne Kapitel behandeln u.a. Information Retrieval mit den Grundlagen, Recherchestrategien, Audio- und Musik-Retrieval, Cross-Language Information Retrieval, Evaluation, Sprachmodelle und neuronale Netze, Modellierung, Informationsrecherche und Empfehlungssysteme. In einem weiteren Kapitel werden Text Mining und Date Mining behandelt.

Doing Research

Der Sammelband Sandra Hofhues / Konstanze Schütze (Hg.): Doing Research – Wissenschaftspraktiken zwischen Positionierung und Suchanfrage, Transcript-Verlag 2022 steht als Open Access zur Lektüre und Download zur Verfügung.
“Forschung wird zunehmend aus Sicht ihrer Ergebnisse gedacht – nicht zuletzt aufgrund der Umwälzungen im System Wissensschaft. Der Band lenkt den Fokus jedoch auf diejenigen Prozesse, die Forschungsergebnisse erst ermöglichen und Wissenschaft konturieren. Dabei ist der Titel Doing Research als Verweis darauf zu verstehen, dass forschendes Handeln von spezifischen Positionierungen, partiellen Perspektiven und Suchbewegungen geformt ist. So knüpfen alle Beitragenden auf reflexive Weise an ihre jeweiligen Forschungspraktiken an. Ausgangspunkt sind Abkürzungen – die vermeintlich kleinsten Einheiten wissenschaftlicher Aushandlung und Verständigung. Der in den Erziehungs-, Sozial-, Medien- und Kunstwissenschaften verankerte Band zeichnet ein vieldimensionales Bild gegenwärtigen Forschens mit transdisziplinären Anknüpfungspunkten zwischen Digitalität und Bildung.”

Ältere Webseiten finden

Drei Möglichkeiten, um ältere oder gelöschte Webseiten aufzufinden:
1. Temporäre Zwischenspeicherung im Google-Cache
– In der Trefferliste von Google steht neben jedem Eintrag ein kleines Dreieck. Klickt man darauf, kann man wählen zwischen “Im Cache” und “Ähnliche Seiten”
– Direkte Eingabe einer URL unter: http://webcache.googleusercontent.com/search?q=cache:URL
– Google-Suche unter: cache:Suchbegriff
– Direkte Suche im Google Cache unter https://cachedview.com/

2. Mit der Browser-Erweiterung Web Archives für Firefox oder Chrome kann der Cache von 8 Suchmaschinen (Wayback Machine, Google, Bing, Yandex, Archive.is, Baidu, Yahoo, 360 Search) durchsucht werden

3. In der Waybackmachine des Internet Archive  https://archive.org/web/ können verschiedene Versionen einer Webseite, die zu verschiedenen Zeitpunkten langfristig archiviert worden sind, aufgerufen werden.

Mit Wikipedia zur Religion der Mandarine

Hierzulande wagt man es noch nicht so offen auszusprechen, wie z.B. der amerikanische Politikwissenschaftler und Philosoph Jason Brennan (Buch: “Gegen Demokratie”) es tut, der für eine Epistokratie, eine sogenannte Philosophenherrschaft eintritt, in der nur noch gebildete, politisch informierte Bürger wählen dürfen: Die Leute sind einfach zu blöde für die Demokratie. Brennan muss allerdings offen lassen, wie die Epistokraten auserwählt werden sollen.
Thomas Grundmann: Mit Wikipedia durch die Corona-Kontroversen. Wem glauben, wenn die Wissenschaft vielstimmig auftritt? Eine Checkliste, in: FAZ 09.10.2020 versucht dies geschickter anzugehen, indem er die Grundlagen für eine neue Religion der Mandarine legt. Eine moderne, eine säkulare Religion, weil “geglaubt” werden soll, die Frage ist nur, an wen?
Zunächst stellt er fest, dass der Coronavirus die Gesellschaft “massives Erkenntnisproblem” stellt. Wir brauchen “eindeutige” Stellungnahmen, bekommen aber unterschiedliche Einschätzungen von Experten. “Öffentlichkeit und Politik könnten versucht sein, diejenigen Antworten auszuwählen, die ihnen am plausibelsten erscheinen. Doch das würde auf eine unverantwortliche Selbstüberschätzung hinauslaufen. Warum sollte jemand, der selbst kein Experte für Virologie, Epidemiologie oder Immunologie ist, beurteilen können, welche Expertenmeinung wahr ist?” Ganz einfach: die “Laiin” macht einen Schnellcheck bei Wikipedia, dem man “in der Regel trauen” kann. Grundmann entwirft sein Idealbild eines idealen Experten, der einschlägig, spezialisiert, kompetent , nicht befangen, ohne handwerkliche Fehler ist, aktiv forscht und in anerkannten Fachzeitschriften regelmäßig veröffentlicht und – dies ist der wichtigste Punkt – dabei immer die Mehrheitsmeinung vertritt.
Zunächst ist festzuhalten:  Für die Recherche nach Informationen und ihre Evaluation sind Techniken und Strategien der Informationswiedergewinnung (Information Retrieval) entwickelt worden, die zu den Kulturtechniken des digitalen Zeitalters gehören. Sie auf die Abfrage von Wikipedia zu reduzieren, ist gefährlich und fahrlässig. So wertvoll im Alltag ein erster Blick auf Wikipedia ist, ist es als kollaboratives Werkzeug nicht nur vom Bearbeitungsprozess, sondern gerade bei kontroversen Themen von Problemen der internen Abstimmung und der Fähigkeit, Manipulationen abzuwehren, abhängig. Hinzu kommen interessengesteuerte externe Eingriffe in Wikipedia. Hier ist nicht der Platz, detailliert darauf einzugehen. Für die USA verweise ich auf die investigative Bloggerin Helen Buyniski, die derartige Fälle  dokumentiert hat und sich sogar 2018 zu einem emphatischen „J’accuse“ hinreißen ließ. Wikipedia Inhalte können heuristisch verarbeitet, müssen aber bei kontroversen Themen extern verifiziert werden.
Der Kern aber ist: mit dem Versuch, mediale Hegemonie durch Glauben an die  Experten der Mehrheitsmeinung zu sichern, ist die Religion der Mandarine entworfen.
Zur Erinnerung Immanuel Kant: Was ist Aufklärung
„Aufklärung ist der Ausgang des Menschen aus seiner selbstverschuldeten Unmündigkeit. Unmündigkeit ist das Unvermögen, sich seines Verstandes ohne Leitung eines anderen zu bedienen. Selbstverschuldet ist diese Unmündigkeit, wenn die Ursache derselben nicht am Mangel des Verstandes, sondern der Entschließung und des Mutes liegt, sich seiner ohne Leitung eines anderen zu bedienen. Sapere aude! Habe Mut, dich deines eigenen Verstandes zu bedienen! ist also der Wahlspruch der Aufklärung.
Faulheit und Feigheit sind die Ursachen, warum ein so großer Teil der Menschen, nachdem sie die Natur längst von fremder Leitung freigesprochen (naturaliter majorennes), dennoch gerne zeitlebens unmündig bleiben; und warum es anderen so leicht wird, sich zu deren Vormündern aufzuwerfen. Es ist so bequem, unmündig zu sein. Habe ich ein Buch, das für mich Verstand hat, einen Seelsorger, der für mich Gewissen hat, einen Arzt, der für mich die Diät beurteilt u.s.w., so brauche ich mich ja nicht selbst zu bemühen.”

Zur Psychopathologie des logischen UND

Seit Sigmund Freuds Psychopathologie des Alltagslebens sind alltägliche Fehlhandlungen Gegenstand wissenschaftlicher Beobachtungen geworden. Machen sich in diesen Fehlhandlungen – wie er meinte – psychische Symptome des Unbewussten geltend oder handelt es sich um kognitive Störungen von Parallelhandlungen und -gedanken oder um linguistische Montagefehler im Zustand bestimmter Affektzustände? Trifft eine der letzteren Erklärungen zu, können wir Psychopathologie in diesem Zusammenhang nur als Metapher, nicht als klinische Diagnostik gebrauchen. Aber als zugespitzte Metapher kann sie durchaus hilfreich sein, wie auch in dem klassischen Design-Buch von Don Norman “The design of everyday things” . In dem einleitenden Kapitel “The psychopathology of everyday things” beschreibt er, wie Gegenstände sich durch mangelhaftes Design ihrer Nutzung zu entziehen drohen.

“Die Konjunktion „und“ wurde kaum denkpsychologisch untersucht”, betont Markus Knauff in seinem Beitrag “Deduktion, logisches Denken” von 2005. Schon in der normalen Sprache zeigen sich Unterschiede zwischen der logischen Bedeutung und dem wahrgenommenen Bedeutungsgehalt einer Konjunktion. “So sind beispielsweise die beiden folgenden Sätze logisch äquivalent: Das Kind fiel vom Fahrrad und die Mutter schrie. Die Mutter schrie und das Kind fiel vom Fahrrad. Auch im alltäglichen Gebrauch sind diese konditionalen Aussagen nur wahr, wenn beide atomaren Aussagen wahr sind. Gleichwohl wird das „und“ in beiden Sätzen vollkommen anders gelesen. Oft impliziert es ein „deshalb“ „dann“ usw. ohne das dies in der logischen Form vorgesehen ist.”

Noch komplexer ist es in der Welt des Information Retrieval: Die logischen Operatoren UND und ODER haben den gleichen Wortlaut wie die natürlichsprachlichen Konjunktionen, aber die entgegengesetzte Bedeutung. Das NICHT hat den gleichen Wortlaut und die gleiche Bedeutung wie der natürlichsprachliche Negationspartikel, wie dies auch gute Einführungen in das Information Retrieval erläutern.

Das Nichts nichtet. Ein Glück, dass die meisten Suchenden davon gar nichts ahnen. Diese unsympathische Eigenschaft des Nichts führt dazu, dass wir uns auch bei der Recherche vom NICHT-Operator fernhalten. Darüber hinaus der Denkweise des Retrieval: Könnte in der ausgeschlossenen Exklusionsmenge nicht doch der versteckte Diamant lauern?

Die Synomyme der Suchmaschinen ermöglichen uns einen – wenn auch nur bescheidenen und unsystematischen – Einblick in das Feld der verfügbaren Wortungetüme. Auf dieses eingegrenzte Füllhorn der geODERten Vereinigungsmenge ruhen Gewissheit und Hoffnung.

Dann werden in den Suchschlitz mehrere Wörter eingegeben. Ein Ergebnis erscheint, vielleicht auf der ersten Seite, dann mit Freude wahrgenommen, vielleicht auf eine der hinteren Seiten, dann schon nicht mehr existent.

Das Ergebnis zeigt die Fähigkeit des Suchenden. Dass die Person “googeln” kann, dass sie nicht eine Recherchestrategie entwickeln muss oder sich gar nicht weitere Fähigkeiten der Recherche aneignen muss oder von Experten helfen lassen sollte, scheint klar. Die Person ruht in ihrem Ergebnis und ihren Fähigkeiten. Dass die Suchergebnisse mittels Suchhistorie, Cookies auf sie personalisiert worden ist, ist ihr nicht bekannt. Sie reflektiert nicht die Genese und die Beschränkungen der Ergebnisse, die erst schrittweise zu optimieren wäre. Es scheint allein ihre Kompetenz zu sein.

Durch mangelhaftes Design entziehen sich Gegenstände ihrer Nutzung. Durch kognitive Verzerrung, dass das Resultat allein der Fähigkeit der suchenden Person eignet,  entzieht sich die Suche einem professionellen Information Retrieval, das der Manipulation der Suchmaschinen standhalten könnte.