Introduction
Introduction Statistics Contact Development Disclaimer Help
# taz.de -- Aus Le Monde diplomatique: Es wird Hunde und Katzen regnen
> Der Übersetzungsdienst von Google liefert komplett sinnfreie Sätze. Er
> legt einen Zwischenschritt über das Englische ein.
Bild: In Tokio: Ob der Übersetzer für Katzensprache bessere Ergebnisse liefer…
Wenn man vor einigen Wochen im Online-Übersetzungsservice von Google die
italienische Entsprechung für den französischen Satz „Cette fille est
jolie“ (Dieses Mädchen ist schön) gesucht hat, bekam man den Vorschlag:
Questa ragazza è abbastanza (Dieses Mädchen ist ziemlich).
Wie kann eine der leistungsstärksten Übersetzungsmaschinen der Welt, deren
Sprachkapital aus Milliarden von Sätzen besteht, ein solch grober Fehler
unterlaufen? Die Antwort ist einfach: Die Übersetzung nimmt den
Zwischenschritt über das Englische. „Jolie“ heißt auf Englisch „pretty�…
und „pretty“ wird hier in der Bedeutung von „ziemlich“ mit „abbastanz…
übersetzt.
Oder aus „Je pense que vous avez un président magnifique“ (Ich denke, Sie
haben einen großartigen Präsidenten) wird Penso che tu abbia una bella
sedia (Ich denke, Sie haben einen schönen Stuhl), weil „président“ nicht
mit „Präsident“, sondern mit „chair“ übersetzt wurde, was sowohl Prä…
als auch Stuhl bedeuten kann.
Neben komplett sinnfreien oder unfreiwillig komischen Wendungen wie dieser
kann auch das Gegenteil herauskommen: Hai fatto un compito terrificante (Du
hast eine schrecklich schlechte Arbeit gemacht) übersetzt Google mit „Tu as
fait un travail formidable“ (Du hast eine hervorragende Arbeit gemacht),
weil das Englische „terrific“ je nach Kontext mit „fürchterlich“ oder
„hervorragend“ übersetzt werden kann.
## Die Referenz ist Englisch
Oder die idiomatische Wendung „Il pleut des cordes“ (Es regnet Bindfäden)
verwandelt sich in ein pseudopoetisches Piove cani e gatti (Es regnet Hunde
und Katzen) – nur ist diese wörtliche Übersetzung von „It rains cats and
dogs“ nicht nur dem italienischen Muttersprachler fremd.
Um eine Übersetzungsmaschine zu entwickeln, benötigt man umfangreiche
Korpora an identischen, in verschiedene Sprache übersetzten Texten. Der
US-Konzern Google hat sein Übersetzungsprogramm auf Textpaaren aufgebaut,
die fast immer Englisch als Referenzsprache benutzen. Dabei kommt es jedoch
zu einer sprachlichen Verzerrung.
Während sich das Französische und Italienische ähnlich sind, funktioniert
Englisch deutlich anders; die Sprache ist ausgesprochen vieldeutig und
reich an idiomatischen Wendungen. Ohne den Kontext zu kennen, muss eine
automatisierte Übersetzung aus dem Englischen fehlschlagen.
Andererseits verraten uns die Fehler der Maschine auch einiges über die
Spezifika der jeweiligen Sprachen. Früher oder später werden die
Übersetzungsmaschinen durch die Entwicklung zweisprachiger Korpora, die
ohne die Vermittlung des Englischen auskommen, und durch die Korrekturen,
die die User selbst eingeben, zuverlässigere Ergebnisse liefern.
## „Wir gehen drücken“
Vielleicht werden die oben zitierten Fehler schon korrigiert sein, wenn wir
diese Ausgabe von Le Monde diplomatique in Druck geben oder, wie es im
Französischen heißt, „mettons sous presse“, was Google im Spanischen mit
Vamos a presionar (Wir gehen drücken) übersetzt.
Um die Konsequenzen zu ermessen, die sich aus der Verwendung des Englischen
als Brückensprache ergeben, muss man die automatische Übersetzung in den
Kontext von Texten stellen, die auf Algorithmen basieren. Diese
Computerprogramme bringen im Rahmen vollautomatischer Übersetzungen nicht
nur sprachliche Neuerungen hervor.
Sie werden zum Beispiel auch eingesetzt für automatisch generierte
Presseberichte, für die syntaktische und semantische Korrektur von
Wikipedia-Einträgen, für Werbespots oder die Verschlagwortung einer
Website, um diese suchmaschinengerecht zu optimieren.
Wie lassen sich nun aber primäre, von Menschen ohne Hilfe von Algorithmen
erzeugte Sprachressourcen (verschriftlichte Gespräche, Inhalte von
digitalisierten Büchern et cetera) von sekundären Sprachressourcen
unterscheiden, die aus algorithmischen Transformationen hervorgegangen
sind? Durch die Autocomplete-Funktion, die mittlerweile beinahe alle
Eingabeoberflächen besitzen – man tippt den Anfang eines Wortes und ein
Programm vervollständigt die sprachliche Äußerung –, sind Algorithmen, wenn
wir online schreiben, zu unseren ständigen Vermittlern geworden.
## Der Suchbaum der Ausdrücke
In vielen Fällen verfassen wir unsere Texte nicht mehr Buchstabe für
Buchstabe oder Wort für Wort, sondern begnügen uns damit, zwischen mehreren
möglichen von Algorithmen vorgeschlagenen Ergänzungen auszuwählen. Diese
Form des Schreibens verbindet Schnelligkeit mit Effizienz, gerade wenn man
die reduzierte Tastatur eines Handys benutzt. In diesem neuen Rahmen
besteht Schreiben nur noch darin, sich für einen Weg im Suchbaum der
vorhersagbaren Ausdrücke zu entscheiden. In einigen Jahren wird es
schwierig sein, eine Benutzeroberfläche zu finden, die diese Technologie
nicht verwendet.
Wie alle sekundären Ressourcen sind auch die durch Übersetzungsmaschinen
algorithmisch erzeugten Texte nicht unbedingt als solche gekennzeichnet.
Sie präsentieren sich häufig als primäre, natürliche Spracherzeugnisse, die
den Lesern als Modell dienen können. Ein Internetnutzer, dessen
Muttersprache nicht Italienisch ist, hat keinen Grund, die Wendung Piove
cani e gatti für falsch zu halten.
Dies gilt erst recht für Algorithmen, die mit dem Ziel, künstlich neue
Texte zu erzeugen, die Sprachstrukturen durchforsten. Ein Algorithmus, der
eine primäre Quelle sucht, um seine Übersetzungsfähigkeiten zu optimieren,
kann versehentlich einen durch einen anderen Algorithmus erstellten Text
verwenden, der einen falschen Sinn enthält.
Die Verbreitung von durch die Arbeit von Algorithmen „verschmutzten“
Ressourcen im Netz bedroht ein technologisches Gebäude, dem es vor allem um
Datenmengen und weniger um deren systematische Qualitätskontrolle geht.
Zahllose Beispiele von seltsamen sprachlichen Wendungen kursieren im
Internet.
Im App Store, der Onlineboutique, in der Apple seine Software verkauft,
sind etwa Kommentare zu einer App zu lesen, mit der man im Gehen
Nachrichten tippen kann: „Intuitiv zu gebrauchen, schöne Ergebnisse und
wieder gut gelaunt. Danke, der die gemacht hat! Das ist echt cool und
empfehle.“ Oder: „Es hilft mir, den Text horizontal und vertikal
einzugeben, SMS zu schicken, E-Mail zu schicken, Nachrichten auf Twitter
und Facebook zu schicken … sehr lustig, ich danke Ihnen!“
## Niemals gesprochene Sätze
Solcherlei bizarre, algorithmisch erzeugte Wendungen können in einem
zweiten Schritt Textvermittlungsdiensten als Modell dienen, die Vorschläge
zur Vervollständigung des Textes machen, den Sie gerade tippen. Es ist also
denkbar, dass irgendwann einem Italiener, der einen Satz mit Piove beginnt,
der Vorschlag Piove cani e gatti angezeigt wird, der wahrscheinlich in der
gesamten Geschichte der italienischen Sprache noch niemals gesprochen oder
geschrieben wurde.
Die Referenzsprache Englisch wirkt damit potenziell an einem
Kreolisierungsprozess mit: der Bildung einer neuen Sprache auf der
Grundlage von Transformationen älterer Sprachen – ein Phänomen, das
Linguisten wohlbekannt ist. Die gegenwärtigen, durch die Algorithmen
verursachten Veränderungen haben eine Art Mischsprache, eine potenziell
kurzlebige Kontaktsprache zwischen zwei Sprachsystemen entstehen lassen.
Da eine junge Generation von Sprachbenutzern mit diesen gewandelten
Ausdrucksformen selbstverständlich umgeht, könnte sie sich zu einer
kohärenten und eigenständigen Sprache, einem Kreol, entwickeln. Dies könnte
durch die Vermittlung der neuen Eingabeoberflächen beschleunigt werden, die
als quasi vertraute Sprachprothesen die zukünftigen Ausdrucksformen prägen.
Der Sprachimperialismus des Englischen hat daher viel subtilere
Auswirkungen, als es die auf den „Krieg der Sprachen“ gerichtete Kritik
vermuten lässt. Dient ein einziges Idiom als Referenzsprache, führt das
dazu, dass dessen Logik und Eigenheiten auf andere Sprachen abfärben und
damit auch unmerklich auf die spezifische Art, in der in einer Sprache
gedacht wird. Diese Entwicklung könnte auch an einer globalen
Sprachveränderung mitwirken, bei der den Algorithmen eine Schlüsselrolle
zukommt.
Wie Englisch für die europäischen Sprachen als Brückensprache fungiert, so
übernehmen in anderen Sprachgebieten andere Sprachen diese Position. Damit
etabliert sich ein weltweites Übersetzungsnetzwerk, das über mehrere
Vermittlungsidiome funktioniert. Wer wird in fünf Jahren noch Texte ohne
das Zutun von Algorithmen schreiben? Wie viel Zeit wird vergehen, bis die
ersten durch Algorithmen entstandenen Sprachprodukte als natürliche Formen
wahrgenommen werden? Diese hybriden Schrifterzeugnisse erfordern ein
aufmerksames Studium sowie eine neue Linguistik, die selbst mit Algorithmen
arbeitet, um deren Auswirkungen besser verstehen und kontrollieren zu
können.
25 Jan 2015
## AUTOREN
Frédéric Kaplan
Dana Kianfar
## TAGS
Algorithmen
Sprache
Übersetzer
Google
Datenbrille
Google
Roboter
## ARTIKEL ZUM THEMA
Google Glass wird nicht mehr verkauft: Zurück ins Labor
Die Computerbrille Google Glass ist seit 2012 nie über den Status eines
umstrittenen Pilotprojekts hinausgekommen. Jetzt wird die erste Version
nicht mehr verbreitet.
Alternativen für die Suche im Internet: Es geht auch ohne Google
Viele fluchen über die „Datenkrake“, googlen sich dann aber trotzdem weiter
durchs Web. Das muss nicht sein: Es gibt andere Suchmöglichkeiten.
Autonome Roboter im Straßenverkehr: Der Fahrer in der Maschine
Bald könnten selbststeuernde Fahrzeuge auf Straßen unterwegs sein. Doch
dürfen sie in Unfallsituationen entscheiden, wer lebt und wer stirbt?
You are viewing proxied material from taz.de. The copyright of proxied material belongs to its original authors. Any comments or complaints in relation to proxied material should be directed to the original authors of the content concerned. Please see the disclaimer for more details.