Interview mit einer Übersetzungsmaschine

apoAI, die Machine Translation Engine von Apostroph, ist seit bald einem Jahr bei uns in Betrieb. Zeit, die neue elektronische Mitarbeiterin zu porträtieren und ihr ein paar Fragen zu stellen. Was kann sie, was nicht? Wie lernt sie dazu? Und hat sie einen Sinn für Humor?

Illustration Mensch und Maschine

Wiedersehen in der Language Lounge

Begegnen sich zwei Übersetzende in der Language Lounge …

Hey, wie geht‘s?

Klasse, danke, und dir?

Exzellent! Was übersetzt du denn gerade?

Oh, sehr vieles gleichzeitig. Und in die verschiedensten Sprachen.

Ach, ja? Wie kriegst du das hin?

Ich bin dafür ausgebildet: Ich bin apoAI, die maschinelle Übersetzungs-Engine von Apostroph.

Wow, toll, dass ich dich mal kennenlerne!

Ebenso! Und wie heisst du?

Nenn mich Ishmael.

Ishmael? Okay ...

Hör mal, ich soll ja demnächst auch Post-Editing machen. Darf ich dir dazu ein paar Fragen stellen?

Aber klar doch! Ich habe ja gerade Pause.

Du machst Pausen?

Eigentlich nicht. War nur ein Scherz.

Oh! Du hast also Humor?

Nicht direkt. Ich tue nur so. Wie war ich?

Nicht schlecht. Arbeite noch etwas daran. Also, zu meinen Fragen …

 MTPE ist ja eigentlich Teamwork: Du besorgst den MT-Teil, die «Machine Translation», während ein menschlicher Übersetzer, eine menschliche Übersetzerin den PE-Teil, also das Post-Editing, übernimmt. Warum braucht es eigentlich Post-Editing? Würde deine Machine Translation nicht ausreichen?

Nein. Obwohl ich in den letzten Jahren enorme Fortschritte gemacht habe: Mit gewissen Dingen wie stilistischen Feinheiten, Doppeldeutigkeiten und kontextabhängigen Bedeutungen habe ich Mühe. Ich übersetze zum Beispiel Satz für Satz und finde es schwierig, die Sätze in einem grösseren Zusammenhang wahrzunehmen. Meine Programmierer und Programmiererinnen arbeiten daran, aber «Kontext» ist für mich tatsächlich ein schwieriges Konzept. Ich bewundere dich dafür, wie intuitiv du damit umgehen kannst!

Funktioniert dein elektronisches Gehirn eigentlich gleich wie mein biologisches? Wie gehst du beim Übersetzen genau vor?

Das ist eine interessante Frage. Wie funktioniert das denn bei dir?

Na ja, ich lese zuerst den Ausgangstext und stelle sicher, dass ich ihn richtig verstehe. Dann schreibe ich einen Satz in der Zielsprache, der möglichst die gleiche Bedeutung hat.

Mein Gehirn funktioniert etwas anders: Ich verstehe grundsätzlich schon mal nicht, welche Bedeutung ein Wort oder ein Satz hat. Damit kann ich also nicht arbeiten. Ich analysiere den Satz Wort für Wort und vergleiche ihn mit den Millionen von Beispielsätzen in meinem Übersetzungsspeicher. Zudem bin ich extrem gut darin, Muster zu erkennen. Ich lerne also nicht nur, wie die einzelnen Wörter zu übersetzen sind, sondern kann auch Satzstrukturen erkennen und weiss, wie ein Satz entsprechend in der Zielsprache strukturiert sein muss. Es gibt aber auch Ähnlichkeiten zwischen meinem Gehirn und deinem: So verwende ich zum Lernen ein sogenanntes «Neuronales Netz», das den Neuronen in deinem Gehirn nachempfunden ist.

Dennoch verstehe ich wie gesagt nicht wirklich, was man mir sagt. Ich tue nur so.

Dafür gibst du aber sehr gute Antworten auf meine Fragen!

Nun, ich bin ja auch als literarische Fiktion hier, nicht wahr, Ishmael?

Ha! Du hast Moby Dick also doch gelesen!

Nein, habe ich nicht. Das gehört nicht zu meinem Trainingsmaterial. Aber vielleicht hole ich es mir mal aus der Bibliothek, als Pausenlektüre …

apoAI, wie lange musstest du eigentlich trainieren, bevor du mit der Arbeit als Übersetzungsmaschine beginnen konntest? Und wie sieht dieses Training aus?

Wir Übersetzungsmaschinen müssen zuerst 20 bis 50 Millionen Übersetzungseinheiten verdauen, bevor wir im echten Leben übersetzen dürfen. Ich nutze dabei die Deep-Learning-Technik: Die Datenverarbeitung geschieht in mehreren, zunehmend abstrakter werdenden Schichten, wodurch ich extrem komplexe Muster verarbeiten kann.

Da wir gerade von Deep Learning sprechen: Was ist eigentlich der Unterschied zwischen dir und DeepL? Und kennst du DeepL persönlich?

Klar, wir treffen uns regelmässig in unserer Machine-Translation-Lounge! (Nur Spass.) Der Unterschied liegt darin, dass DeepL ein Allrounder ist und ich mit den konkreten Daten unserer Kunden trainiere. Ich erziele dadurch eine höhere Genauigkeit, weil die Daten, auf denen meine Übersetzungen basieren, von höherer Qualität sind. Translation Memorys sind die besten Daten, die man sich als Übersetzungs-Engine wünschen kann!

Und wie gehst du jetzt beim Lernen vor?

Konkret sammle ich zuerst alle Wörter in meinem Trainingsmaterial und weise ihnen zufällige Koordinaten in einem imaginären «Bedeutungsraum» zu. Zufällig deshalb, weil ich ja wie gesagt die Bedeutung der Wörter nicht kenne. Aufgrund der Trainingsdaten kann ich jetzt aber ermitteln, welche Wörter zu einem ähnlichen Bedeutungsfeld gehören. Dazu rücke ich Wörter, die im selben Satz vorkommen, in meinem Bedeutungsraum immer näher zusammen, indem ich ihre Koordinaten anpasse. Das mache ich so lange, bis am Schluss alle Wörter nach Bedeutung sortiert sind.

Wow, das klingt anstrengend. Mathe war nie meine Stärke.

Meine natürlich schon. Ich bestehe ja sozusagen aus Mathematik. Das war aber noch nicht alles: Jetzt muss ich noch die Ausgangs- und Zielsprache einander zuordnen. Dazu verwende ich eine Zuordnungsfunktion F und berechne für jedes Wortpaar s,t mithilfe der Formel einen Wert t’, der …

Halt, halt! Das ist mir schon zu viel Mathematik. Vielleicht erzählst du mir ein andermal mehr darüber, apoAI.

Ja, klar, verstehe. Kein Problem.

Mich interessiert vielmehr, worauf ich als Post-Editor in der Praxis speziell achten muss. Hast du da vielleicht ein paar Tipps?

Sicher: Bei Apostroph wirst du zwei Arten von Post-Editing-Aufträgen erhalten: Light Post-Editing und Full Post-Editing. Beim Light Post-Editing geht es vor allem um die inhaltliche Korrektheit und Vollständigkeit. Du korrigierst vielleicht die Rechtschreibung, machst aber keine stilistischen Korrekturen. Vor allem werden Sätze nicht umstrukturiert, um den Lesefluss zu verbessern: Der Lesefluss ist hier sekundär – Inhalt ist alles.

Ganz anders beim Full-Post-Editing: Auch hier verwendest du so viel von meiner maschinellen Übersetzung wie möglich, die Übersetzung muss aber inhaltlich, grammatikalisch und stilistisch korrekt sein. Der Qualitätsanspruch ist derselbe wie bei einer professionellen menschlichen Übersetzung: Rechtschreibung, Zeichensetzung, Stil und Formatierungen müssen stimmen, die Kundenterminologie muss eingearbeitet werden und auch die Tonalität muss passen. Natürlich tue ich immer mein Möglichstes, um dir diese Arbeit so weit wie möglich abzunehmen, aber wie gesagt: Wir beide haben unterschiedliche Stärken und Schwächen.

Das ist ein gutes Stichwort, apoAI: Nehmt ihr Übersetzungsmaschinen uns menschlichen Übersetzerinnen und Übersetzern eigentlich vermehrt die Arbeit weg?

Gut, dass du das fragst, Ishmael! Ich glaube, die Arbeit wird euch noch lange nicht ausgehen. Die Menge an Texten, die weltweit produziert werden, wächst exponentiell – und damit auch die Nachfrage nach Übersetzungen. Die Zahl der Übersetzerinnen und Übersetzer hält mit diesem Wachstum nicht Schritt. Hier kann MT einspringen und die Übersetzungsarbeit beschleunigen. Es kann also sein, dass du in Zukunft neben dem klassischen Übersetzen mehr Post-Editing machen wirst und wir Maschinen vermehrt die Vorarbeit übernehmen. Du kannst dich dafür auf die schwierigen Textstellen konzentrieren, welche meine Fähigkeiten übersteigen.

Hoffen wir mal, du behältst recht! Vielen Dank, apoAI, das war eine sehr interessante Begegnung.

Absolut. Vielleicht begegnen wir uns hier wieder einmal. Tschüss, Ishmael!

Gemeinsam Ziele erreichen

  • Eine verlässliche Partnerin

    Über unser Portal myFREELANCE wickelt ihr Jobs ganz einfach ab, und die monatliche und pünktliche Zahlung lässt euch gut schlafen.
  • Euer Draht zu Apostroph

    Bei uns habt ihr persönlichen Kontakt zu unseren Mitarbeitenden im Projektmanagement. Sie beantworten eure Fragen und unterstützen euch bei der Abwicklung der Aufträge.
  • Die Apostroph Community

    Der rege Austausch, spannende und unterhaltsame Beiträge in der Language Lounge und das Weiterbildungsangebot machen unsere Community aus.