Ein Artikel aus dem Hochschulmagazin

Kontakt

Prof. Dr. Klaus-Dirk Schmitz

Informations- und Kommunikationswissenschaften

  • Telefon+49 221-8275-3272

Wie gut ist Google Translate?

Porträt von Prof. Dr. Klaus-Dirk Schmitz (Bild: Costa Belibasakis/FH Köln)

Google Translate verunstaltet sogar Weihnachtslieder. „Macht hoch die Tür, die Tor' macht weit“ ins Englische übersetzt, wird zu „Power up the door, the door does not make much“. Prof. Dr. Klaus-Dirk Schmitz vom Institut für Translation und Mehrsprachige Kommunikation erklärt im Inside-out-Interview, warum Übersetzungsprogramme nie so gut sein können wie der Mensch.

Wie funktionieren maschinelle Übersetzungsprogramme?
Klaus-Dirk Schmitz:
Grundsätzlich unterscheidet man bei der maschinellen Übersetzung zwei Ansätze. Zum einen gibt es sogenannte regelbasierte Verfahren. Diese analysieren zunächst den zu übersetzenden Satz und identifizieren einzelne Wörter, Wortgruppen, Nebensätze und Sätze. Wenn diese Struktur erkannt ist, übertragen sie die einzelnen Wörter in die Zielsprache und bauen die Struktur wieder auf. Es gibt also Wörterbücher für die Ausgangssprache, für die Zielsprache und ein Übersetzungswörterbuch. Google Translate funktioniert ganz anders. Hinter dem Programm steht ein statistisches System mit einer riesengroßen Datenmenge von bereits übersetzten Texten. Das System versucht aus diesen Daten Schlüsse zu ziehen, wie Sätze aussehen und Übersetzungen zu finden. Das hat einen großen Vorteil: Ich kann dieses System auf jede Sprache anwenden, für die ich eine bestimmte Datenmenge besitze. Darum gibt es Google Translate auch in sehr vielen verschiedenen Sprachen. Bei regelbasierten Verfahren muss man für jede neue Sprache auch neue Wörterbücher aufbauen und Regeln definieren. Darum gibt es diese Systeme für die großen, aber nicht für „exotische“ Sprachen.

Warum funktionieren die maschinellen Übersetzungen nicht so gut?
Klaus-Dirk Schmitz: Das Problem jeder Übersetzung sind Mehrdeutigkeiten. Der Mensch bemerkt die Mehrdeutigkeiten nicht, denn er erkennt den Sinn meistens über den Inhalt. Im Englischen zum Beispiel ist oft nicht klar, ob kleingeschriebene Wörter Substantive oder Verben sind. Der Mensch erkennt das meist sofort, der Computer nicht. Dieses Problem kann auch nicht durch mehr Datenmaterial gelöst werden. In einer Studie wurde Google Translate in den Jahren 2010, 2011, 2012 und 2013 mit dem gleichen Text getestet. 2010 war die Übersetzung schlecht, 2011 wurde sie besser, 2012 wurde sie noch besser und 2013 wurde sie wieder schlechter. Man braucht riesige statistische Datenmengen um Schlüsse zu ziehen, wie ein Wort übersetzt wird. Aber je größer die Datenmenge, umso mehr Mehrdeutigkeiten tauchen auf und die Ergebnisse werden wieder schlechter.

Wie werden die Systeme heute eingesetzt?
Klaus-Dirk Schmitz:
Google Translate wird häufig verwendet, um eine Idee davon zu bekommen, was in einem Text steht. Sie bekommen etwa einen Patentantrag auf Japanisch und mit Google Translate bekommen sie einen Eindruck, worum es gehen könnte. Diese Vorgehensweise heißt Informativübersetzung. Aber es gibt kein maschinelles Übersetzungssystem, das anspruchsvolle Texte wie Bedienungsanleitungen so gut übersetzt wie ein Mensch. Maschinelle Systeme können aber unterstützen. Es kann zum Beispiel effizienter sein, einen Text in Google Translate einzugeben und dann das Ergebnis zu korrigieren, als den kompletten Text selbst zu übersetzen. Eine andere maschinelle Unterstützung sind Translation Memories. Grundlage ist eine Datenbank mit vielen Sätzen, die schon einmal von der Ausgangssprache in die Zielsprache übersetzt wurden. Wenn ein neuer Text zu übersetzen ist, überprüft das Programm, ob ein gleicher oder ein sehr ähnlicher Satz schon in der Datenbank vorhanden ist. Das System bietet dann diese Übersetzung an. Und ich kann entscheiden, ob der Vorschlag passt oder ob ich kleine Änderungen vornehmen muss. Das ist heute Praxis in vielen Bereichen.

Interview: Christian Sander

April 2015

Studiengänge des Instituts für Translation und Mehrsprachige Kommunikation

  • Ein Artikel aus dem Hochschulmagazin

    Kontakt

    Prof. Dr. Klaus-Dirk Schmitz

    Informations- und Kommunikationswissenschaften

    • Telefon+49 221-8275-3272


    M
    M