
Wenn die KI Ihre deutsche Marke nicht kennt: Der English-Bias der LLMs
- Stefan Bach

- 29. Mai
- 3 Min. Lesezeit
Aktualisiert: vor 4 Tagen
TL;DR: Wenn ein KI-Modell eine deutsche Frage beantwortet, denkt es oft auf Englisch. Es übersetzt die Anfrage intern, sucht in englischsprachigen Quellen — allen voran der englischen Wikipedia — und übersetzt die Antwort zurück. Für deutsche Hidden Champions heißt das: Wer in der englischen Quellenwelt nicht existiert, ist für die KI faktisch unsichtbar, egal wie stark die deutsche Marktposition ist.
Ein Maschinenbauer aus Ostwestfalen ist Weltmarktführer in seiner Nische. Deutsche Fachpresse, ein gepflegter deutscher Wikipedia-Eintrag, saubere Website. Trotzdem taucht das Unternehmen in ChatGPT-Antworten kaum auf, während ein kleinerer US-Wettbewerber regelmäßig genannt wird. Das ist kein Zufall und kein Ranking-Problem im klassischen Sinn. Es ist ein struktureller Effekt, wie große Sprachmodelle mit nicht-englischen Anfragen umgehen.
Wie ein LLM eine deutsche Frage tatsächlich verarbeitet
Große Sprachmodelle sind überwiegend auf englischsprachigen Daten trainiert. Schätzungen zum Trainingskorpus von GPT-Modellen gehen von deutlich über 90 Prozent englischem Anteil aus; Deutsch liegt im niedrigen einstelligen Prozentbereich. Das hat eine Konsequenz, die viele unterschätzen: Das Modell „denkt" in einem Raum, dessen Wissen ganz überwiegend aus englischen Quellen stammt.
Wenn ein Modell mit angeschlossener Websuche — ChatGPT Search, Perplexity, Google AI Overviews — eine deutsche Frage bekommt, passiert im Hintergrund regelmäßig Folgendes: Die Anfrage wird intern in eine oder mehrere Suchanfragen übersetzt, oft ins Englische. Das Modell ruft Quellen ab, gewichtet sie, formuliert eine Antwort und übersetzt sie zurück ins Deutsche. Der entscheidende Schritt ist der mittlere: Welche Quellen das Modell überhaupt heranzieht, entscheidet sich häufig im englischen Sprachraum.
Markus Hövener hat diesen Effekt in seinem Search-Camp-Podcast dokumentiert: LLMs leiten aus deutschen Prompts häufig englische Such-Queries ab und übersetzen die Antwort zurück. Eine Schweizer Untersuchung zur LLM-Reputation im Pharma- und MedTech-Sektor kommt zum selben Befund — die Modelle ziehen für deutschsprachige Antworten bevorzugt die englische Wikipedia heran, nicht die deutsche.
Warum die englische Wikipedia zum Nadelöhr wird
Wikipedia ist die mit Abstand wichtigste Einzelquelle für KI-Antworten. Auswertungen von Hunderten Millionen Citations zeigen, dass Wikipedia bei ChatGPT regelmäßig die meistzitierte Domain ist — teils mit Anteilen um die 48 Prozent. Und die Wikimedia Foundation hat 2025 Enterprise-Lizenzverträge mit OpenAI, Microsoft, Meta und Perplexity geschlossen. Wikipedia ist damit nicht irgendeine Quelle, sondern eine privilegierte.
Hier schließt sich die Falle: Wenn das Modell für eine deutsche Frage intern englisch sucht, landet es auf der englischen Wikipedia. Ein deutscher Hidden Champion, der nur einen deutschen Wikipedia-Eintrag hat — oder gar keinen — existiert in dieser Quellenwelt schlicht nicht. Der US-Wettbewerber mit englischem Eintrag hingegen schon. Nicht, weil er besser ist, sondern weil er in der Sprache dokumentiert ist, in der das Modell sucht.
Das Muster verstärkt sich über die gesamte englische Quellenlandschaft: englische Fachartikel, Reddit-Diskussionen, LinkedIn-Beiträge, Branchenverzeichnisse, Review-Plattformen wie G2. Wer dort nicht vorkommt, fehlt im Quellenpool, aus dem die KI ihre Antwort baut.
Eine deutsche Marktführerschaft ist kein KI-Sichtbarkeitsschutz
Das ist die unbequeme Erkenntnis für viele Mittelständler: Die Stärke im deutschen Markt — Marktanteil, Reputation bei Fachkunden, Präsenz in der deutschen Fachpresse — übersetzt sich nicht automatisch in KI-Sichtbarkeit. Die Signale, die ein Unternehmen im deutschen Geschäft groß gemacht haben, liegen oft genau außerhalb des Quellenraums, den die KI bevorzugt abruft.
Verschärfend kommt hinzu, dass laut Bitkom inzwischen rund die Hälfte der deutschen Internetnutzer KI-Chats zumindest gelegentlich statt klassischer Suche verwenden, bei den Jüngeren mit klar steigender Tendenz. Die Recherche von Einkäufern, Bewerbern und Partnern verlagert sich also messbar dorthin, wo der deutsche Hidden Champion am schwächsten dokumentiert ist.
Wichtig zur Einordnung: Das ist kein Argument gegen deutschsprachige Inhalte und kein Aufruf, das eigene Geschäft zu anglisieren. Es ist eine nüchterne Beschreibung, wie die Abrufmechanik funktioniert — und damit die Grundlage, um gezielt gegenzusteuern, statt im Blindflug zu optimieren.
Was das praktisch bedeutet
Der erste Schritt ist nicht Aktionismus, sondern eine ehrliche Bestandsaufnahme: Existiert das Unternehmen in der englischen Quellenwelt überhaupt? Gibt es einen englischen Wikipedia- oder zumindest Wikidata-Eintrag? Sind die Kernbegriffe des Geschäfts auf Englisch irgendwo sauber dokumentiert, auf die eine KI zugreifen kann? Bei den meisten deutschen Mittelständlern lautet die Antwort: nur lückenhaft oder gar nicht.
Genau hier liegt die Chance. Die English-Bias-Lücke ist ein blinder Fleck, den fast niemand im Mittelstand adressiert — und der sich mit überschaubarem Aufwand schließen lässt. Wie ein solches englischsprachiges Fundament konkret aussieht, von Wikidata über Entity-Konsistenz bis zu englischen Pendant-Inhalten, ist Thema eines eigenen Beitrags. Der erste und wichtigste Schritt ist, das Problem überhaupt zu sehen.
Sie wollen wissen, ob Ihr Unternehmen in der englischen Quellenwelt der KI überhaupt vorkommt? Ich prüfe das im Rahmen eines KI-Sichtbarkeits-Checks — nüchtern, datenbasiert und mit konkreten nächsten Schritten. Schreiben Sie mir.
Quellen
Search Camp Podcast (Markus Hövener, Bloofusion) zur English-Bias-Beobachtung bei LLMs; swissreputation.group, LLM-Reputationsstudie Pharma/MedTech 2026 zur Bevorzugung der englischen Wikipedia; Profound, Auswertung von Citation-Quellen in ChatGPT; Wikimedia Foundation zu Enterprise-Lizenzverträgen mit OpenAI, Microsoft, Meta und Perplexity (2025); Bitkom, Studie zur KI-Nutzung in Deutschland (November 2025).



Kommentare