Wie in zahlreichen anderen Berufsfeldern kann künstliche Intelligenz die Produktivität der Dolmetscher und Übersetzer steigern. Ersetzen kann sie uns derzeit nicht.
Der folgende Text wurde von einem Menschen geschrieben.
Das Hype-Thema künstliche Intelligenz ist in aller Munde. Als Dolmetscher bekommen wir häufig die Frage zu hören, ob wir denn nicht demnächst arbeitslos seien. Ich persönlich denke nicht, dass das mittelfristig der Fall sein wird. Dazu werde ich einen praktischen Anwendungsfall beschreiben, in dem unsere Arbeit zwar durch künstliche Intelligenz erleichtert wird, unser Eingreifen aber notwendig ist.
Ausgangssituation: Der Kunde hat eine Aufnahme von einer einstündigen, öffentlichen Podiumsdiskussion angefertigt, welche auf Deutsch gehalten wurde.
Auftrag: Das Video soll, für das nicht-deutschsprachige Publikum, eine zusätzliche englische Tonspur zur Veröffentlichung im Internet erhalten.
Mögliche Lösungen ohne künstliche Intelligenz:
- Im Tonstudio könnte der Dolmetscher, nachdem er sich das Video im Vorfeld sorgfältig angesehen und ggf. Notizen als Gedächtnisstütze gemacht hat, spontan das Gehörte verdolmetschen. Das Ergebnis wäre eine hochqualitative mündliche Verdolmetschung, der aber selbstverständlich etwas mehr Spontaneität anhaftet. Das macht sie weniger perfekt als ein vollständiges Skript, welches in diesem Fall überhaupt nicht erstellt wird.
- Vor der Aufnahme der englischen Tonspur könnte der Dolmetscher als ersten Schritt ein vollständiges Skript des Originals erstellen und es im zweiten Schritt schriftlich übersetzen. Und zwar manuell, versteht sich. Dazu müsste er sich das Video Minute für Minute anhören und alles Gesagte mitschreiben.
Man rechnet bei einem Ausgangsmaterial von einer Stunde Länge mit einer Transkriptionszeit von fünf bis zehn Stunden – nur für den deutschen Text. Nachdem das Skript erstellt ist, muss es aber noch ins Englische übersetzt werden.
In diesem konkreten Fall wurden über die Dauer des Videos ca. 9.000 Wörter gesprochen. Erfahrungsgemäß übersetzt ein Übersetzer Texte mit einer Geschwindigkeit von etwa 2.500 Wörtern pro Arbeitstag. Es können aber auch mehr oder weniger sein, je nach Schwierigkeitsgrad des Ausgangstexts und in Abhängigkeit weiterer Faktoren.
Für Schritt 1 und 2, also Transkription und Übersetzung des Skripts fielen also ungefähr vier Arbeitstage an. Das resultierende übersetzte Skript wäre dann zwar perfekt, die aufgewandte Arbeitszeit von vier Tagen steht allerdings in keinem Verhältnis zum Ertrag.
Lösungen mit Einsatz von künstlicher Intelligenz:
- Im Prinzip folgt der Dolmetscher den Arbeitsschritten des zweiten Lösungsansatzes, lässt sich aber von je einer KI pro Arbeitsschritt unter die Arme greifen, um seine Produktivität zu steigern.
Um das Video zu transkribieren und ein Skript auf Deutsch zu erhalten, wurde der Dienst von happyscribe.com verwendet. (Dies soll keine Werbung für ein bestimmtes Tool darstellen, die Konkurrenz bietet gleichwertige Lösungen an.) Das Transkript war innerhalb weniger Minuten fertig.
Das Ergebnis war trotz teils starker Regiolekte der Sprecher als Grundlage zum weiteren Bearbeiten durchaus brauchbar. Es gab viele Stellen, an denen der menschliche Bearbeiter eingreifen musste. Manchmal wurden zwei Wörter als eines erkannt, etwas grundsätzlich missverstanden oder mehrere Eigennamen nicht erkannt. Die händische Bearbeitung des KI-Skripts hat eine Stunde in Anspruch genommen, war aber unerlässlich, um mit der Übersetzung fortfahren zu können.
Im zweiten Schritt wurde das fertige und manuell bereinigte Skript auf Deutsch maschinell ins Englische übersetzt. Auch dieser Vorgang war innerhalb weniger Minuten abgeschlossen und hat eine nützliche Grundlage zur menschlichen Weiterverarbeitung geschaffen. Diese war nach zwei Stunden abgeschlossen.
Es ist eindeutig, dass die rein maschinelle Übersetzung zur späteren Aufnahme der Tonspur nicht geeignet gewesen wäre. Ein menschlicher Übersetzer und Dolmetscher weiß, dass nicht jedes gesprochene Wort direkt übertragen werden muss, denn nicht jedes „So,“ „gut“ „ähm“ trägt zur interkulturellen Verständigung bei. Die Übersetzung wäre an vielen Stellen nicht nur viel zu wörtlich gewesen, sondern auch irreführend, da ein und dasselbe Wort mehrere Bedeutungen haben kann.
Und der Sarkasmus-Detektor, z.B. bei politischen Anspielungen, muss für KIs erst noch erfunden werden.