Comment sont générés les sous-titres de films ?

La demande en sous-titrage ne cesse d’augmenter. Cette évolution est due, d’une part, à un souci d’accessibilité et, d’autre part, à la volonté d’atteindre un public national et international au moyen de la production de sous-titres dans différentes langues, dans notre pays plurilingue qu’est la Suisse. Mais comment les sous-titres sont-ils générés ? Comment leur traduction se déroule-t-elle précisément ?

Pour commencer, il faut bien sûr avoir un texte source. Le mot-clé est ici : « speech to text ». La méthode traditionnelle consiste à taper le contenu parlé d’une vidéo, à le transcrire. Mais pour le sous-titrage, outre la transcription du contenu parlé, des informations supplémentaires sont nécessaires, surtout les timecodes : à quel moment quelle phrase est-elle prononcée, et pendant combien de temps le sous-titre correspondant doit-il être affiché ? La transcription est un art en soi, et quiconque l’a déjà pratiqué sait à quel point il prend du temps.

illustration sous-titrage

L’intelligence artificielle nous mâche le travail

Il n’est pas très surprenant que la transcription soit désormais effectuée en grande partie automatiquement. Chez Apostroph, nous utilisons un outil d’IA appelé Whisper. Il a été développé par OpenAI (les créateurs de ChatGPT) et atteint un niveau de précision étonnamment bon en matière de reconnaissance vocale. Nous alimentons ainsi Whisper avec un fichier vidéo et obtenons un fichier de sous-titres, habituellement au format SRT. Ce dernier contient le texte parlé de la vidéo, transcrit par Whisper, avec les timecodes. Jusqu’ici tout va bien !

Mais même si Whisper est très performant, il n’est pas parfait. Le texte source est donc encore retravaillé pour contrôler qu’il soit correct, que les sous-titres ne soient pas trop longs et que la position des timecodes pour l’affichage et le masquage (« spotting ») soit adéquate. Ensuite seulement, le fichier de sous-titres est prêt à être traduit.

Outils de traduction pour les fichiers de sous-titres

Quand on ouvre le fichier de traduction dans Word, il se présente ainsi :

illustration sous-titrage

Il est lisible et traduisible, mais peut encore être amélioré. Les programmes spécialisés de sous-titrage comme Aegisub ou Subtitle Edit exposent non seulement les sous-titres de manière plus lisible, mais permettent aussi d’intégrer le fichier vidéo correspondant. Vous pouvez ainsi contrôler si les sous-titres sont adaptés à la vidéo. Sont-ils affichés et masqués au moment opportun ? Sont-ils visibles suffisamment longtemps (au moins une seconde) ? Leur longueur est-elle adaptée ? Vous pouvez traduire les sous-titres directement dans ces outils et enregistrer le fichier sous un nouveau nom, comme vous le feriez dans Word.

Mais vous pouvez aussi traduire les fichiers de sous-titres dans Trados Studio. Si vous installez le plug-in Studio Subtitling (disponible dans l’AppStore RWS), vous verrez un aperçu de la vidéo avec vos sous-titres pendant que vous traduisez. Un onglet situé au bas de la fenêtre (« Subtitling Data ») vous fournira d’autres informations importantes, comme la longueur du texte.

Comment un mandat se déroule-t-il ?

  • Si vous devez corriger pour nous un fichier de sous-titres en langue source, vous recevez ce fichier au format SRT, avec toutes les informations concernant le mandat. Vous modifiez les sous-titres dans l’un des outils mentionnés et vous nous livrez le document SRT retravaillé, en ajoutant _edit au nom du fichier.
  • Vous recevez généralement les mandats de traduction de sous-titres sous forme de projets Studio sur lesquels vous pouvez travailler comme d’habitude. Vous avez alors besoin du plug-in Studio Subtitling évoqué précédemment. Une fois votre travail terminé, vous nous livrez comme d’habitude votre fichier cible et le fichier SDLXLIFF.
  • Si le mandat est très urgent, nous vous demanderons peut-être de travailler directement sur le document généré de manière automatisée et de le traduire, ou nous mettrons à votre disposition un fichier SRT généré automatiquement avec pré-traduction automatique. Dans ce cas, merci d’ouvrir la transcription / le fichier SRT dans l’outil de sous-titrage ou dans Studio (avec la vidéo) et d’en vérifier la qualité (langage correct, timecodes adaptés, respect des autres règles du sous-titrage). Si le spotting est complètement erroné ou que la pré-traduction est inutilisable, prière de le communiquer impérativement à l’équipe de gestion de projets.

Informations complémentaires

Des règles particulières s’appliquent pour la transcription et le sous-titrage. Nous les avons réunies pour vous dans le portail de connaissances de myFREELANCE :

Nous avons par ailleurs organisé une formation sur cette thématique en janvier et abordé Whisper un peu plus en profondeur. Vous trouverez l’enregistrement de cette formation ici : https://myfreelance.apostroph.ch/fr/portail-de-connaissances/

Liens de téléchargement

Les trois outils sont gratuits. N’hésitez pas à les tester !

 

Atteindre les objectifs ensemble

  • Une partenaire fiable

    Grâce à notre portail myFREELANCE, vous effectuez vos mandats en toute simplicité et grâce au paiement mensuel et ponctuel, vous pouvez dormir sur vos deux oreilles.
  • Votre lien avec Apostroph

    Chez nous, vous avez un contact personnel avec nos Project Managers. Ils ou elles répondent à vos questions et vous assistent dans le déroulement des mandats.
  • La communauté Apostroph

    Notre communauté se caractérise par des échanges intenses, des articles aussi captivants que divertissants dans le Language Lounge, et notre offre de formation continue.