# taz.de -- Aus Le Monde diplomatique: Es wird Hunde und Katzen regnen

	# taz.de -- Aus Le Monde diplomatique: Es wird Hunde und Katzen regnen

	> Der Übersetzungsdienst von Google liefert komplett sinnfreie Sätze. Er
	> legt einen Zwischenschritt über das Englische ein.

	Bild: In Tokio: Ob der Übersetzer für Katzensprache bessere Ergebnisse liefer…

	Wenn man vor einigen Wochen im Online-Übersetzungsservice von Google die
	italienische Entsprechung für den französischen Satz „Cette fille est
	jolie“ (Dieses Mädchen ist schön) gesucht hat, bekam man den Vorschlag:
	Questa ragazza è abbastanza (Dieses Mädchen ist ziemlich).

	Wie kann eine der leistungsstärksten Übersetzungsmaschinen der Welt, deren
	Sprachkapital aus Milliarden von Sätzen besteht, ein solch grober Fehler
	unterlaufen? Die Antwort ist einfach: Die Übersetzung nimmt den
	Zwischenschritt über das Englische. „Jolie“ heißt auf Englisch „pretty�…
	und „pretty“ wird hier in der Bedeutung von „ziemlich“ mit „abbastanz…
	übersetzt.

	Oder aus „Je pense que vous avez un président magnifique“ (Ich denke, Sie
	haben einen großartigen Präsidenten) wird Penso che tu abbia una bella
	sedia (Ich denke, Sie haben einen schönen Stuhl), weil „président“ nicht
	mit „Präsident“, sondern mit „chair“ übersetzt wurde, was sowohl Prä…
	als auch Stuhl bedeuten kann.

	Neben komplett sinnfreien oder unfreiwillig komischen Wendungen wie dieser
	kann auch das Gegenteil herauskommen: Hai fatto un compito terrificante (Du
	hast eine schrecklich schlechte Arbeit gemacht) übersetzt Google mit „Tu as
	fait un travail formidable“ (Du hast eine hervorragende Arbeit gemacht),
	weil das Englische „terrific“ je nach Kontext mit „fürchterlich“ oder
	„hervorragend“ übersetzt werden kann.

	## Die Referenz ist Englisch

	Oder die idiomatische Wendung „Il pleut des cordes“ (Es regnet Bindfäden)
	verwandelt sich in ein pseudopoetisches Piove cani e gatti (Es regnet Hunde
	und Katzen) – nur ist diese wörtliche Übersetzung von „It rains cats and
	dogs“ nicht nur dem italienischen Muttersprachler fremd.

	Um eine Übersetzungsmaschine zu entwickeln, benötigt man umfangreiche
	Korpora an identischen, in verschiedene Sprache übersetzten Texten. Der
	US-Konzern Google hat sein Übersetzungsprogramm auf Textpaaren aufgebaut,
	die fast immer Englisch als Referenzsprache benutzen. Dabei kommt es jedoch
	zu einer sprachlichen Verzerrung.

	Während sich das Französische und Italienische ähnlich sind, funktioniert
	Englisch deutlich anders; die Sprache ist ausgesprochen vieldeutig und
	reich an idiomatischen Wendungen. Ohne den Kontext zu kennen, muss eine
	automatisierte Übersetzung aus dem Englischen fehlschlagen.

	Andererseits verraten uns die Fehler der Maschine auch einiges über die
	Spezifika der jeweiligen Sprachen. Früher oder später werden die
	Übersetzungsmaschinen durch die Entwicklung zweisprachiger Korpora, die
	ohne die Vermittlung des Englischen auskommen, und durch die Korrekturen,
	die die User selbst eingeben, zuverlässigere Ergebnisse liefern.

	## „Wir gehen drücken“

	Vielleicht werden die oben zitierten Fehler schon korrigiert sein, wenn wir
	diese Ausgabe von Le Monde diplomatique in Druck geben oder, wie es im
	Französischen heißt, „mettons sous presse“, was Google im Spanischen mit
	Vamos a presionar (Wir gehen drücken) übersetzt.

	Um die Konsequenzen zu ermessen, die sich aus der Verwendung des Englischen
	als Brückensprache ergeben, muss man die automatische Übersetzung in den
	Kontext von Texten stellen, die auf Algorithmen basieren. Diese
	Computerprogramme bringen im Rahmen vollautomatischer Übersetzungen nicht
	nur sprachliche Neuerungen hervor.

	Sie werden zum Beispiel auch eingesetzt für automatisch generierte
	Presseberichte, für die syntaktische und semantische Korrektur von
	Wikipedia-Einträgen, für Werbespots oder die Verschlagwortung einer
	Website, um diese suchmaschinengerecht zu optimieren.

	Wie lassen sich nun aber primäre, von Menschen ohne Hilfe von Algorithmen
	erzeugte Sprachressourcen (verschriftlichte Gespräche, Inhalte von
	digitalisierten Büchern et cetera) von sekundären Sprachressourcen
	unterscheiden, die aus algorithmischen Transformationen hervorgegangen
	sind? Durch die Autocomplete-Funktion, die mittlerweile beinahe alle
	Eingabeoberflächen besitzen – man tippt den Anfang eines Wortes und ein
	Programm vervollständigt die sprachliche Äußerung –, sind Algorithmen, wenn
	wir online schreiben, zu unseren ständigen Vermittlern geworden.

	## Der Suchbaum der Ausdrücke

	In vielen Fällen verfassen wir unsere Texte nicht mehr Buchstabe für
	Buchstabe oder Wort für Wort, sondern begnügen uns damit, zwischen mehreren
	möglichen von Algorithmen vorgeschlagenen Ergänzungen auszuwählen. Diese
	Form des Schreibens verbindet Schnelligkeit mit Effizienz, gerade wenn man
	die reduzierte Tastatur eines Handys benutzt. In diesem neuen Rahmen
	besteht Schreiben nur noch darin, sich für einen Weg im Suchbaum der
	vorhersagbaren Ausdrücke zu entscheiden. In einigen Jahren wird es
	schwierig sein, eine Benutzeroberfläche zu finden, die diese Technologie
	nicht verwendet.

	Wie alle sekundären Ressourcen sind auch die durch Übersetzungsmaschinen
	algorithmisch erzeugten Texte nicht unbedingt als solche gekennzeichnet.
	Sie präsentieren sich häufig als primäre, natürliche Spracherzeugnisse, die
	den Lesern als Modell dienen können. Ein Internetnutzer, dessen
	Muttersprache nicht Italienisch ist, hat keinen Grund, die Wendung Piove
	cani e gatti für falsch zu halten.

	Dies gilt erst recht für Algorithmen, die mit dem Ziel, künstlich neue
	Texte zu erzeugen, die Sprachstrukturen durchforsten. Ein Algorithmus, der
	eine primäre Quelle sucht, um seine Übersetzungsfähigkeiten zu optimieren,
	kann versehentlich einen durch einen anderen Algorithmus erstellten Text
	verwenden, der einen falschen Sinn enthält.

	Die Verbreitung von durch die Arbeit von Algorithmen „verschmutzten“
	Ressourcen im Netz bedroht ein technologisches Gebäude, dem es vor allem um
	Datenmengen und weniger um deren systematische Qualitätskontrolle geht.
	Zahllose Beispiele von seltsamen sprachlichen Wendungen kursieren im
	Internet.

	Im App Store, der Onlineboutique, in der Apple seine Software verkauft,
	sind etwa Kommentare zu einer App zu lesen, mit der man im Gehen
	Nachrichten tippen kann: „Intuitiv zu gebrauchen, schöne Ergebnisse und
	wieder gut gelaunt. Danke, der die gemacht hat! Das ist echt cool und
	empfehle.“ Oder: „Es hilft mir, den Text horizontal und vertikal
	einzugeben, SMS zu schicken, E-Mail zu schicken, Nachrichten auf Twitter
	und Facebook zu schicken … sehr lustig, ich danke Ihnen!“

	## Niemals gesprochene Sätze

	Solcherlei bizarre, algorithmisch erzeugte Wendungen können in einem
	zweiten Schritt Textvermittlungsdiensten als Modell dienen, die Vorschläge
	zur Vervollständigung des Textes machen, den Sie gerade tippen. Es ist also
	denkbar, dass irgendwann einem Italiener, der einen Satz mit Piove beginnt,
	der Vorschlag Piove cani e gatti angezeigt wird, der wahrscheinlich in der
	gesamten Geschichte der italienischen Sprache noch niemals gesprochen oder
	geschrieben wurde.

	Die Referenzsprache Englisch wirkt damit potenziell an einem
	Kreolisierungsprozess mit: der Bildung einer neuen Sprache auf der
	Grundlage von Transformationen älterer Sprachen – ein Phänomen, das
	Linguisten wohlbekannt ist. Die gegenwärtigen, durch die Algorithmen
	verursachten Veränderungen haben eine Art Mischsprache, eine potenziell
	kurzlebige Kontaktsprache zwischen zwei Sprachsystemen entstehen lassen.

	Da eine junge Generation von Sprachbenutzern mit diesen gewandelten
	Ausdrucksformen selbstverständlich umgeht, könnte sie sich zu einer
	kohärenten und eigenständigen Sprache, einem Kreol, entwickeln. Dies könnte
	durch die Vermittlung der neuen Eingabeoberflächen beschleunigt werden, die
	als quasi vertraute Sprachprothesen die zukünftigen Ausdrucksformen prägen.

	Der Sprachimperialismus des Englischen hat daher viel subtilere
	Auswirkungen, als es die auf den „Krieg der Sprachen“ gerichtete Kritik
	vermuten lässt. Dient ein einziges Idiom als Referenzsprache, führt das
	dazu, dass dessen Logik und Eigenheiten auf andere Sprachen abfärben und
	damit auch unmerklich auf die spezifische Art, in der in einer Sprache
	gedacht wird. Diese Entwicklung könnte auch an einer globalen
	Sprachveränderung mitwirken, bei der den Algorithmen eine Schlüsselrolle
	zukommt.

	Wie Englisch für die europäischen Sprachen als Brückensprache fungiert, so
	übernehmen in anderen Sprachgebieten andere Sprachen diese Position. Damit
	etabliert sich ein weltweites Übersetzungsnetzwerk, das über mehrere
	Vermittlungsidiome funktioniert. Wer wird in fünf Jahren noch Texte ohne
	das Zutun von Algorithmen schreiben? Wie viel Zeit wird vergehen, bis die
	ersten durch Algorithmen entstandenen Sprachprodukte als natürliche Formen
	wahrgenommen werden? Diese hybriden Schrifterzeugnisse erfordern ein
	aufmerksames Studium sowie eine neue Linguistik, die selbst mit Algorithmen
	arbeitet, um deren Auswirkungen besser verstehen und kontrollieren zu
	können.

	25 Jan 2015

	## AUTOREN

	Frédéric Kaplan
	Dana Kianfar

	## TAGS

	Algorithmen
	Sprache
	Übersetzer
	Google
	Datenbrille
	Google
	Roboter

	## ARTIKEL ZUM THEMA

	Google Glass wird nicht mehr verkauft: Zurück ins Labor

	Die Computerbrille Google Glass ist seit 2012 nie über den Status eines
	umstrittenen Pilotprojekts hinausgekommen. Jetzt wird die erste Version
	nicht mehr verbreitet.

	Alternativen für die Suche im Internet: Es geht auch ohne Google

	Viele fluchen über die „Datenkrake“, googlen sich dann aber trotzdem weiter
	durchs Web. Das muss nicht sein: Es gibt andere Suchmöglichkeiten.

	Autonome Roboter im Straßenverkehr: Der Fahrer in der Maschine

	Bald könnten selbststeuernde Fahrzeuge auf Straßen unterwegs sein. Doch
	dürfen sie in Unfallsituationen entscheiden, wer lebt und wer stirbt?