Machine translation con post-editing

I sistemi di traduzione automatica (machine translation) come Google Translate o DeepL hanno raggiunto un alto livello di competenza linguistica grazie all’Intelligenza Artificiale (IA). L’importanza dei sistemi di traduzione automatica (MT) sta quindi aumentando, soprattutto nell’attività di traduzione per usi correnti. Secondo il Common Sense Advisory (2016), l’80% dei fornitori di servizi linguistici offre ora servizi di traduzione automatica. Esistono contenuti generati dall’utente che vengono tradotti direttamente dalla macchina senza alcuna revisione, come nel caso di eBay o Amazon ad esempio, ma i lavori più impegnativi richiedono comunque una rielaborazione per migliorare il risultato. Questo processo si chiama post-editing. Nel post-editing (PE) il testo viene rivisto e modificato da una persona. Il PE combina la traduzione convenzionale con la traduzione automatica (output di un sistema di traduzione automatica neurale). Il PE porta il testo definitivo di destinazione a un buon livello di leggibilità e scorrevolezza.

Prima del post-editing e prima ancora della traduzione automatica, il testo è sottoposto a un’altra fase di elaborazione: il pre-editing. Per pre-editing s’intende l’elaborazione del testo iniziale prima della traduzione automatica. Il testo di partenza viene letto e verificato completamente, gli errori di battitura e di altro tipo vengono eliminati in modo che il testo possa essere riconosciuto correttamente dalla macchina. Questo passaggio è importante soprattutto se il testo deve essere tradotto in più lingue. 

La «machine translation» (MT) indica la traduzione automatica di testi da una lingua all’altra per opera di un software. Nei primi anni 2000, Google ha cominciato a fornire un sistema di traduzione statistico. L’integrazione dell’intelligenza artificiale e in particolare dell’apprendimento profondo nella tecnologia nota come «neural machine translation»ha portato la traduzione automatica a un livello di perfezione tale che nel caso di testi molto semplici talvolta è impossibile distinguerla da una traduzione umana. La traduzione automatica neurale rappresenta un notevole progresso nell’efficacia e nell’adeguatezza dei programmi di traduzione automatica. Per valutare la qualità della traduzione si utilizzano algoritmi come Bleu Score, che misurano la somiglianza della traduzione automatica a una traduzione di riferimento umana. Bleu e altri parametri di valutazione sono ormai sorpassati e considerati poco affidabili. Oggi esistono ottimi sistemi in grado di generare traduzioni che sono giudicate ottime da valutatori umani, ma che pure ricevono valutazioni Bleu molto basse. Si stanno quindi cercando alternative che sono però difficili da trovare. A differenza della valutazione, ad esempio, di un apparecchio tecnico dalle prestazioni esattamente misurabili, è difficile formulare un giudizio esatto su un testo. L’argomento è molto soggettivo e il compito è arduo se consideriamo che, a parte le frasi brevi, quasi mai due traduttori traducono un testo alla stessa maniera.

Aspetti importanti del post-editing

Secondo un test condotto nel 2020, i tool di traduzione di DeepL e Google Translate ottengono i risultati migliori. Nondimeno, i tool di traduzione automatica spesso commettono errori gravissimi: le doppie negazioni e le traduzioni errate dei nomi propri ne sono un esempio. Per il post-editor è quindi fondamentale sapere se il suo testo proviene da un tool NMT. In tal caso deve prestare attenzione a errori del tutto diversi rispetto a quelli che potrebbero presentarsi in un testo tradotto da un essere umano.

Un altro punto debole della traduzione automatica è che spesso contiene errori stilistici non evidenti. Sono errori che durante una lettura superficiale non saltano subito all’occhio, perché sono annidati in frasi scorrevoli dal punto di vista linguistico e il testo sembra quadrare. Persino le migliori macchine di traduzione a volte forniscono risultati fuorvianti.

I vostri testi devono essere consultati nel tempo o sono destinati all’esterno e necessitano di una traduzione di alta qualità? In questo caso vi raccomandiamo un post-editing conforme alla norma ISO 18587. Il post-editing è più di una semplice correzione. Prevede una rielaborazione completa da parte di revisori madrelingua qualificati. Sotto certi aspetti, assomiglia a una traduzione classica. Stile e terminologia sono uniformi e adeguati alle esigenze del cliente.

I vostri testi sono urgenti o per l’uso interno? Allora consigliamo il post-editing light. Si tratta di una rielaborazione semplificata da parte di revisori madrelingua qualificati, ma è comunque più approfondita di una semplice correzione bozze. L’obiettivo è fornire un testo comprensibile, corretto e completo. Le questioni stilistiche e la terminologia del cliente non vengono considerate. Un post-editing light corregge solo gli errori evidenti e mira a ottenere un testo comprensibile, non necessariamente elegante dal punto di vista stilistico.

È importante stabilire cosa si vuole dal testo di arrivo. La destinazione d’uso determina se è possibile utilizzare la traduzione automatica e quale post-editing deve essere effettuato, oppure se il lavoro debba essere affidato a un traduttore specializzato qualificato. A seconda del tipo di testo o della combinazione linguistica, il post-editing può rivelarsi perfino più complesso e quindi più costoso di una traduzione umana eseguita ex-novo.

Un revisore o un traduttore specializzato può orientarsi in base alla nuova norma «Post-editing secondo ISO 18587» per la «rielaborazione dell’output della traduzione automatica». La norma descrive il modo in cui il traduttore umano deve lavorare alla traduzione automatica per ottenere una versione finale corretta dal punto di vista linguistico.

Requisiti per il post-editing (PE)

La traduzione automatica e la rielaborazione possono talvolta far risparmiare rispetto al classico processo di traduzione. Ma quasi più rilevante è il suo utilizzo in progetti con tempi critici: grazie alla traduzione automatica e al post-editing possono essere tradotte grandi quantità di dati in breve tempo.

Il tempo necessario al post-editing è un fattore importante per valutare se l’uso della traduzione automatica è economico o meno. Il post-editing è più complesso e richiede più tempo della correzione bozze di un testo prodotto in maniera non automatica. La necessità di un post-editing light o completo della traduzione automatica dipende in ultima analisi dalla qualità della traduzione grezza. Per garantire la qualità della lingua, si raccomanda l’uso di un sistema di traduzione automatica professionale. Un sistema di questo tipo è idealmente addestrato con traduzioni precedenti e la terminologia tecnica esistente.

Post-editing light

Per testi più effimeri e per la comunicazione interna, un post-editing leggero può essere sufficiente per raggiungere bene il pubblico target e trasmettere il messaggio. Inoltre la qualità della materia prima riveste un ruolo importante: i testi che contengono errori o sono scritti male vengono riconosciuti e contestualizzati con più difficoltà dal sistema di traduzione rispetto alle frasi comuni.

Post-editing a norma ISO 18587


La norma ISO 18587 definisce i requisiti per la rielaborazione delle traduzioni automatiche. La norma è stata pubblicata dall’ISO (Organizzazione internazionale per la normazione) ed è quindi vincolante in tutto il mondo. Lo scopo della norma ISO 18587 è quello di fornire una maggiore trasparenza ai consumatori e agli utenti dei servizi di traduzione. Ad esempio, il nuovo standard richiede, tra l’altro, che il fornitore di servizi linguistici si avvalga di traduttori specializzati (traduttori professionisti con competenze specifiche nella materia) per la post-elaborazione.

I testi redatti secondo la norma ISO 18587 sono rivolti all’utente finale e devono rendere la funzione del testo con precisione nella lingua di destinazione e, se necessario, superare l’esame dell’occhio critico di certi ambienti specializzati.

In sintesi si può dire che la «machine translation» è in grado di tradurre grandi volumi in modo rapido ed efficiente. Tuttavia non sono produzioni perfette: il linguaggio è un sistema così complesso che una macchina probabilmente non potrà mai eseguire una traduzione completamente priva di errori e con uno stile appropriato. Anche il computer più potente ha bisogno di un essere vivente che capisca, verifichi e corregga le sue traduzioni.