Du sprichst von Machine Learning (ML). Kannst du das kurz erklären?
R: Machine Learning ist ein Teilgebiet der künstlichen Intelligenz. Algorithmen erkennen Muster in Datensätzen und entwickeln daraus Lösungen. Für die Sprachen- und Textwelt von Apostroph ist ML wertvoll und unverzichtbar.
War immer klar, dass ihr in der IT arbeiten werdet?
S: Ich kann mir keinen anderen Beruf vorstellen. Als ich mit 13 meinen ersten PC gebaut habe, war schon klar, dass ich in der IT arbeiten möchte. In meiner Studienzeit habe ich mich dann mit Machine Learning auseinandergesetzt und beschlossen, das zu meinem Beruf zu machen.
R: Das war bei mir ähnlich. Der Enthusiasmus für Technologie war schon als Kind da.
Ein Apostroph Chatbot?
R: Ja, spezialisiert auf Übersetzung und Korrektorat, passgenau für unser Apostroph Dienstleistungsspektrum. Es ist so, dass generelle Modelle wie ChatGPT eigentlich nutzbar wären im Sprachen-Kontext. Leider liefern sie aber noch keine zufriedenstellenden, linguistisch korrekten Ergebnisse. Man kann nicht ein einziges Modell für viele verschiedene Zwecke einsetzen. Also arbeiten wir an einer individualisierten Lösung.
Wohin geht die Reise in Sachen Datensicherheit?
R: Ein absolut zentrales Thema. Unsere Datensicherheitsinfrastruktur in der Schweiz wird stetig weiterentwickelt. Wir erhöhen die Kapazitäten kontinuierlich für eigene Speicherlösungen inhouse.
S: Es ist für uns essenziell, dass alle Daten, die wir verarbeiten, und alle Systeme, die wir entwickeln, zu jeder Zeit in der Schweiz bleiben. Auch bei der Verarbeitung von Daten, mit denen wir KI entwickeln, sorgen wir zuverlässig dafür, dass diese sicher und geschützt bleiben.
Was gibt es Neues zu MT, TM usw.?
S: Im Bereich maschinelle Übersetzung ist es gerade interessant, weil viele Leute experimentieren und einige versuchen, einen Paradigmenwechsel herbeizuführen, im Sinne, dass grosse Sprachmodelle wie GPT anstelle von spezifisch trainierten Machine-Translation-Modellen für die automatische Übersetzung verwendet werden. Wir verfolgen diese Entwicklungen genau und erforschen derzeit die Ergebnisse und Implikationen eines solchen Ansatzes.
R: Eines der grossen Probleme mit mehrsprachigen Modellen ist, dass verschiedene Sprachen sich gegeneinander innerhalb des Modells um Parameter bekämpfen. Dazu kommt, dass auch Trainingsdaten für verschiedene Sprachen unausgeglichen sind, was zu schlechteren Ergebnissen für eher seltenere Sprachen führen kann. Eine neue Innovation, die von Apple publiziert worden ist, sind «exclusive model parameters», die nur für eine einzige Sprache zuständig sind. Dies zeigt, dass die Zeit der Innovationen im MT-Bereich noch lange nicht fertig ist, und ich bin gespannt, wie gut MT noch werden kann.
Bitte eine Prognose: Wohin entwickelt sich die IT-Zukunft in der Sprachenwelt?
S: Es ist zu hoffen, dass die Modelle beim Textverständnis und bei der Texterstellung noch besser werden. Sie werden immer intelligenter und lernen anhand von Beispielen, komplexe Aufgaben zu lösen. Mit nur einem einzigen Shakespeare-Gedicht als Vorlage werden sie in der Lage sein, weitere Gedichte im Shakespeare-Stil zu verfassen.
Ich hoffe, mehr von den neuen effizienten Techniken zum Training grosser Sprachmodelle zu sehen, sodass ein Entwicklungsprozess nicht mehr 100 Jahre für eine einzelne Person dauert und diese nicht mehr nur den Tech-Giganten vorbehalten bleiben.
Ausserdem denke ich, dass unsere Endgeräte immer leistungsfähiger werden und viele Sprachmodelle dann lokal und vermutlich nicht mehr nur über US-Clouds laufen werden. Möglicherweise wird es bald mehr End-to-End-Übersetzungen geben wie zum Beispiel Audio-zu-Text, Audio-zu-Audio oder Bild-zu-Text – das alles ohne komplexe Pipelines, die aus mehreren Modellen bestehen. Wir wünschen uns einfachere und elegantere End-to-End-Pipelines, die auf qualitativ hochwertigen Daten trainiert werden.
R: Die Rolle unserer Linguistinnen und Linguisten wird sich in Richtung Text-Direktoren entwickeln. Sie werden verschiedene technologische Systeme steuern, um linguistische Prozesse zu erstellen. Maschinell erstellte Übersetzungen und Texte werden immer weniger sprachlicher Adaption bedürfen. Die Expertise des linguistischen und kulturellen Verständnisses wird an technologisches Verständnis gekoppelt sein.
Raimon Wintzer
Raimon Wintzer ist Language Technology Engineer, absolvierte ein Bachelor-Studium in Computer Science und erwarb einen Master in Biomedical Computing. Raimon spricht Englisch, Deutsch, Französisch und Russisch. Im Moment lernt er Chinesisch. Alte Komödien aus UdSSR-Zeiten bringen ihn zum Lachen. Auf seinem Nachttisch liegt gerade das Buch «Jane Eyre» von Charlotte Brontë, der Lebenslauf eines Waisenkinds im viktorianischen England.
Szymon Ruciński
Szymon Rucinski ist Junior Language Technology Engineer, besitzt einen Master in Machine Learning and Software Engineering. Er spricht Polnisch, Deutsch, Englisch und … Python. Nach Feierabend tüftelt er gerade an Hobbyprojekten im Bereich Computer Vision. Während Netflix-Serien nicht so sein Ding sind, begeisterte er sich kürzlich für den Film «Quo Vadis» aus dem Jahr 1951, einen Monumentalfilm, der im antiken Rom spielt. Szymon hält sich mit Laufen und Radfahren fit. Er liest gerade «Pedalling Poland» von Bernard Newman. Das Buch beschreibt eine Radtour im Jahr 1934 in seinem Geburtsland: durch ein blühendes, volkstümliches Polen.
Möchten Sie regelmässig über neue Kundenprojekte und News zu Apostroph informiert werden?
In unserem Newsletter überraschen wir Sie mit ebenso informativen wie unterhaltsamen Artikeln. Wir würden uns freuen, auch Sie im Kreis unserer 20 000 Newsletter-Followerinnen und -Follower zu begrüssen.