Miriam Rosen et Claude Tsao

"Demain, la traduction automatique"
- Mode d'emploi -

(article paru dans le hors-série du Monde Diplomatique
"Internet, l'extase et l'effroi" en octobre 1996)

How That Walks ?(*)

A la différence du traducteur humain, un logiciel de traduction ne corrige pas les fautes d'orthographe ou de ponctuation du texte source (à traduire). Avant de lancer la traduction il faut impérativement le vérifier minutieusement. Le programme, déjà pas très perfectionné, devient totalement borné aux moindres imperfections orthographiques, stylistiques, typographiques ou syntaxiques.

Il y a plusieurs façons d'aborder la traduction par ordinateur.

La plus triviale mais aussi la plus efficace consiste à utiliser des phrases-types, qui peuvent toutefois supporter quelques variations. Cette méthode est utilisée pour traduire les documentations techniques d'un seul domaine, tel l'aéronautique, où les volumes à traduire sont énormes et les textes répétitifs.

Une autre approche consiste à faire porter les efforts sur le texte source en l'adaptant le plus possible à la syntaxe de la langue cible. Cette approche a été développée pour Titus par l'institut textile de France. Si le thème s'en trouve amélioré, la version est quelque peu délaissée.

Pour tenter de traduire des textes courants, les problèmes sont nettement plus complexes à résoudre.

Le programme travaille phrase par phrase pour effectuer un analyse à la fois morphologique, sémantique et syntactique. Les délimiteurs de phrase sont simples à identifier (point, point d'interrogation etc.). Le repérage des mots est nettement plus délicat à régler. Les délimiteurs que sont l'espace ou la virgule (normalement accolée au mot qui la précède) ne suffisent pas toujours pour trouver le mot. Comment trouver avec seulement le délimiteur "espace" le nom commun pomme de terre ? Pour résoudre ce problème le programme doit regarder le mot précédent et le mot suivant et rechercher dans un dictionnaire si le mot ou le groupe de mots existe. Pour augmenter la qualité de traduction, des dictionnaires spécialisés par domaine d'activité sont constitués. Avec un dictionnaire pour le bâtiment ferme sera traduit différemment qu'avec un dictionnaire pour le commerce.

Dans ce dictionnaire, tous les mots sont stockés avec leurs types grammaticaux. Par exemple, ferme peut être un adjectif, un nom commun ou une forme verbale de fermer. Pour gagner de la place et aussi pour réduire le temps de traitement, chacune des informations grammaticales est codée sur un seul digit. Un digit n'a que deux valeurs possibles : 0 ou 1 (un caractère alphabétique utilise huit digits). Dans le cas de ferme, le digit utilisé pour indiquer que le mot est un adjectif sera à 1, celui pour le nom commun à 1 et celui pour le verbe à 1, mais celui pour l'adverbe ainsi que celui de la préposition à 0.

Une fois que tous les mots de la phrase sont typés, le programme applique les règles linguistiques à la phrase entière. Cette opération de désambiguïsation permet de déterminer le rôle de chacun des mots dans la phrase (sujet, verbe, compléments...)

La phase dite de transfert peut commencer. Elle consiste à traduire les mots, en changer l'ordre (en anglais l'adjectif est toujours placé avant le nom alors qu'en français cette règle n'est pas absolue), résoudre le problème des articles et celui des prépositions (encore plus difficile, donc plus mal résolu car il n'y a pas souvent de correspondance entre langue source et langue cible).

Il ne reste plus qu'à passer à la dernière étape de la traduction : la synthèse. C'est la finition de la phrase. Elle consiste à conjuguer les verbes et à décliner les noms.

A partir de cet instant, l'utilisateur n'a plus qu'à réviser la traduction ou, le cas échéant, courir s'inscrire à un cours intensif d'apprentissage de la langue cible.

Claude Tsao


(*) Traduction de «Comment ça marche ?» selon Globalink et AccentDuo. Pour les anglophones, lire « How Does It Work ?».