Suchmaschinen durch SEO-Spam überflutet

Janek Bevendorff, Matti Wiegmann, Martin Potthast, Benno Stein: Is Google Getting Worse? A Longitudinal Investigation of SEO Spam in Search Engines. Leipzig March 2024 untersuchen, wie sich die Qualität der Suchergebnisse durch SEO-Spam verschlechtert hat. “We monitored Google, Bing and DuckDuckGo for a year on 7,392 product review queries. Our findings suggest that all search engines have significant problems with highly optimized (affiliate) content—more than is representative for the entire web according to a baseline retrieval system on the ClueWeb22. Focussing on the product review genre, we find that only a small portion of product reviews on the web uses affiliate marketing, but the majority of all search results do. Of all affiliate networks, Amazon Associates is by far the most popular. We further observe an inverse relationship between affiliate marketing use and content complexity, and that all search engines fall victim to large-scale affiliate link spam campaigns. However, we also notice that the line between benign content and spam in the form of content and link farms becomes increasingly blurry—a situation that will surely worsen in the wake of generative AI. We conclude that dynamic adversarial spam in the form of low-quality, mass-produced commercial content deserves more attention.”

Regierung bezahlt Ranking bei Google

In drei Bundestagsdrucksachen wurde die Frage der Verhältnismäßigkeit für die Ausgaben für die Öffentlichkeitsarbeit der Bundesregierung gestellt:
Drucksache 20/9951 enthält die auf die Kleine Anfrage der Abgeordneten Heidi Reichinnek, Jan Korte, Susanne Ferschl, weiterer Abgeordneter und der Fraktion DIE LINKE. – Drucksache 20/9630 – “Selbstdarstellung der Bundesregierung” 02.01.2024
Darin geht es insgesamt um die Kosten bei der Erstellung von Podcasts, Social Media Beiträge usw.
U.a. werden die Kosten für die Höherplatzierung im Ranking oder für Werbebeiträge in Suchmaschinen aufgeführt:

Ministerium

Ausgaben 2021 (Euro) (ab Stichtag 26.10.21)

Ausgaben 2022 (Euro)

Ausgaben 2023 (Euro)

BMWK

10.800,00

120.600,00

395.600,00

BMF

0,00

2.200,00

31.000,00

BMI

0,00

0,00

0,00

AA

0,00

0,00

0,00

BMJ

0,00

0,00

0,00

BMAS

6.800,00

43.600,00

35.300,00

BMVg

0,00

0,00

0,00

BMEL

0,00

4.600,00

27.600,00

BMFSFJ

43.000,00

76.100,00

113.200,00

BMG

74.500,00

189.000,00

29.500,00

BMDV

6.300,00

24.300,00

97.700,00

BMUV

0,00

0,00

25.000,00

BMBF

492.800,00

114.800,00

90.400,00

BMZ

0,00

25.000,00

38.800,00

BMWSB

0,00

0,00

0,00

Schriftliche Frage der Abgeordneten Joana Cotar (fraktionslos) Drucksache 20/10565 Nr. 3 “Wieviel Geld hat die Bundesregierung von 2013 bis 2023 für die Verbesserung von Google-Rankings insgesamt ausgegeben (bitte die Höhe der Mittel nach Jahren aufschlüsseln)” 07.03.2024
“Die Bundesregierung hat im Jahr 2021 (größtenteils ab Stichtag 26. Oktober 2021) Kosten in Höhe von rund 634 000 Euro, im Jahr 2022 rund 600 000 Euro und im Jahr 2023 rund 884 000 Euro für Maßnahmen im Sinne der Fragestellung verwendet.”

Antwort der Bundesregierung auf die Kleine Anfrage der Abgeordneten Barbara Benkstein, Eugen Schmidt, Steffen Janich, weiterer Abgeordneter und der Fraktion der AfD – Drucksache 20/10920 –
Zum Ranking der Ergebnisse einer Google-Suche und seiner Beeinflussung durch die Bundesregierung 19.04.2024 Drucksache 20/11115

MinisteriumAusgaben 2021 (Euro) (ab Stichtag 26.10.21)Ausgaben 2022 (Euro)Ausgaben 2023 (Euro)
BMWK10.800,00120.600,00395.600,00
BMF0,002.200,0031.000,00
BMI0,000,000,00
AA0,000,000,00
BMJ0,000,000,00
BMAS6.800,0043.600,0035.300,00
BMVg0,000,000,00
BMEL0,004.600,0027.600,00
BMFSFJ43.000,0076.100,00113.200,00
BMG74.500,00189.000,0029.500,00
BMDV6.300,0024.300,0097.700,00
BMUV0,000,0025.000,00
BMBF492.800,00114.800,0090.400,00
BMZ0,0025.000,0038.800,00
BMWSB0,000,000,00

Gesamtsumme seit 2021: 2.118.500 Euro

Betrug bei Google Scholar

Hazem Ibrahim, Fengyuan Liu, Yasir Zaki1, Talal Rahwan: Google Scholar is manipulatable, Studie auf arxiv.org 07.02.2024 zeigen auf: Fake Artikel können bei Google Scholar gelistet werden und Fake-Zitierungen können bei Firmen bestellt werden. “Citations are widely considered in scientists’ evaluation. As such, scientists may be incentivized to inflate their citation counts. While previous literature has examined self-citations and citation cartels, it remains unclear whether scientists can purchase citations. Here, we compile a dataset of ∼1.6 million profiles on Google Scholar to examine instances of citation fraud on the platform. We survey faculty at highly-ranked universities, and confirm that Google Scholar is widely used when evaluating scientists. Intrigued by a citation-boosting service that we unravelled during our investigation, we contacted the service while undercover as a fictional author, and managed to purchase 50 citations. These findings provide conclusive evidence that citations can be bought in bulk, and highlight the need to look beyond citation counts.”

Digitaler Neustart

Martin Andree, Karl-Nikolaus Peifer: Befreit das Netz. Eine Handvoll Tech-Konzerne beherrscht das Internet – dabei könnten wir das leicht ändern und obendrein noch unsere Demokratie retten., Süddeutsche Zeitung 08.02.2024 (hinter der Bezahlschranke)
Ausgehend von den Symptomen im digitalen Raum (Desinformation, Radikalisierung, Onlinemobbing, Polarisierung) analysieren die Autoren “das Problem der digitalen Monopolbildung, das die grundlegenden Strukturen unserer pluralistisch-freiheitlichen Ordnung aus den Angeln hebt”. Da die drei größten Internetkonzerne 80 bis 90 Prozent der digitalen Werbeinnahmen auf sich ziehen, bleiben für den Rest kaum auskömmliche Finanzen übrig. Ursache ist eine fehlende Regulierung des Marktes und der Inhalte. Die Autoren fordern einen “digitalen Neustart”: Öffnung der Plattformen, offene Standards, Trennung von Übertragungswegen und Inhalten, Bündelung der kontrollierenden Instanzen an einer zentralen Stelle.

Google Kritik

The State of Google Critique and Intervention, Big Data & Society, March 2023
“This special issue focuses on Google as an object of critical study and European interventions that increasingly strive to counteract its dominance. Grounded in empirical case studies, it traces the politics of search engines to its very beginning by revisiting Brin’s and Page’s “mixed motives” of the PageRank algorithm and how they contributed to surveillance capitalism. It analyses search engine bias and discrimination by focusing on “data voids” and how they may potentially be filled with extreme right-wing sources, as well as the patching of “offensive results”, both past and present. It poses the question of how Google’s ubiquity is complicit in the creation of ignorance in the context of the climate crisis. Beyond the critique, it finally investigates how providers of alternative search engines counter-imagine hegemonic search and what interventions may help these projects to grow out of their niches, especially in Europe where social values and fundamental rights are strongly upheld in policy rhetoric. The special issue closes with two commentaries embedding “the State of Google Critique and Intervention” in larger discussions on the ethical dimensions of Google Autocomplete and the political economy of technical systems.”

KI killt das Internet

Unter bezug auf den Essay von James Vincent in “The Verge” reflektiert Adrian Lobe: Google war einmal, was kommt als Nächstes? – Die KI killt das alte Internet, vor unseren Augen entsteht gerade ein neues Web, Neue Zürcher Zeitung 04.12.2023 über den Strukturwandel des Internet. “KI könnte die Art, wie in der Wissenschaftsgesellschaft Informationen produziert und rezipiert werden, radikal verändern. Die Idee der KI-Vordenker ist es grob gesagt, das Internet in eine Box zu packen und einen neuen Hypertext zu weben. Statt Websites zu indexieren und nach Relevanz zu sortieren, wie es Google tut, werden die Texte von Wikipedia, Reddit und anderen Quellen, mit denen KI-Systeme wie Chat-GPT trainiert werden, nach einem Wahrscheinlichkeitsmodell neu arrangiert.” Damit gehen drei Prozesse einher: Die Inhalte des Internet werden von der KI verdaut, es bleibt nur noch die technische Verbindung des Netzwerks. Indem hochwertige urheberrechtlich geschützte Inhalte sich vor automatisierten Zugriff der KI abschotten, bleibt nur der Rest, bis zuletzt KI-Systeme mit KI-Inhalten gefüttert werden. Die Such- und Filterfunktionen der Suchmaschinen werden überfordert.

Google und die Zukunft der Suche

Oliver Voß, Tanja Kunesch: Suchmaschinen-Experte Dirk Lewandowski: „Der größte Fehler ist, Google blind zu vertrauen“, Tagesspiegel 04.09.2023 (hinter der Bezahlschranke) In dem Interview skizziert Lewandowski den Aufstieg von Google durch den Page-Rank-Algorithmus und linkbasierte Verfahren. Das Problem, das durch die Monopolstellung von Google entsteht, ist, dass dadurch bestimmt wird, was wir sehen. “Wir wissen gar nicht, was uns entgeht.” Durch die Anzeige von werbebasierten Suchergebnissen an den ersten Trefferpositionen wird das Suchergebnis verzerrt, insbesondere, da viele Nutzer zwischen Werbung und anderen Suchergebnissen nicht zu unterscheiden wissen. ChatGPT ist eine Suche mit textbasierten Antworten, die den Erwartungen der Benutzer nach einer direkten Antwort entgegenkommt. Allerdings wird das bisherige Geschäftsmodell total verändert. “Wenn eine KI einfach die Inhalte nimmt und verwurstet, klickt niemand mehr auf die ursprünglichen Seiten.” Eine zukünftige Lösung sieht er einmal in speziellen Suchmaschinen, die nur bestimmte Quellen abdecken. Zum anderen aber wüäre es sinnvoll, “einen öffentlich finazierten Index des Web zu erstellen, einen Open Web Index”. Darauf könnten verschiedene Suchmaschinen aufbauen.

Stirbt Google?

Wie verändert die Künstliche Intelligenz Suchen und Suchmaschinen?) Titus Blome: Google stirbt. Künstliche Intelligenz soll künftig in die Suchmaschine integriert werden. Das zwingt uns alle zu einer großen Umstellung, in: Süddeutsche Zeitung 07.08.2023 (hinter der Bezahlschranke) beschäftigt sich mit geplanten Einsatz von KI bei Google. Wird bei einer Suchanfrage nicht mehr eine Liste von Links erstellt, sondern eine Zusammenfassung des Inhalts, so entfällt auch die Weiterleitung der Suchenden auf diese Webseiten. Fehlen aber dort die Besucherzahlen, können sich die Angebote nicht mehr durch Werbung finanzieren. Er sieht eine Zweiteilung des Internets: Geschlossene, durch Bezahlschranken geschützte Anwendung, die sich selbst finanzieren müssen auf der einen Seite. Auf der anderen Seite ein noch offenes Internet, das über durch massenhaft generierte minderwertige Inhalte überflutet wird. Die Zukunft der Suchmaschinen wird darin liegen, diese Inhalte auszuschließen und zuverlässige Informationen zu sichern. “Der Wert der alten Suchmaschinen liegt darin, wie viel sie einbeziehen. Der Wert der neuen Suchmaschinen wird darin liegen, was sie ausschließen.”

Buchseite 1 von 3
1 2 3