Retour au format normal

Traduction automatique

10 octobre 2006

Technolangue.net

 

Un système de traduction automatique par ordinateur (TAO) permet de traduire un document original en langue source en un document traduite en langue cible.

On distingue plusieurs types de TAO :

Les différents traitement linguistiques mis en œuvre dans un système de TAO permettent de définir l’architecture linguicielle du système. Pour simplifier, on distingue en général trois étapes de traitement : l’analyse, le transfert et la génération. Ces étapes utilisent des grammaires de transformation (chaîne vers arbre, arbre vers arbre, arbre vers chaîne) et des dictionnaires monolingues ou bilingues.

Si l’étape d’analyse permet d’obtenir une représentation sémantique abstraite de l’énoncé à traduire, il n’y a pas d’étape de transfert, mais directement une étape de génération. On parle dans ce cas de tradcution par pivot. Inversement, si l’étape d’analyse est très réduite (recherche des formes du dictionnaire des mots du texte), l’étape de transfert fait tout le travail, et il n’y a pas de génération. On parle alors de traduction directe (ou de système de première génération). Dans les autres cas on parle de traduction par transfert (ou de système de seconde génération).

Il existe aussi des systèmes de traduction qui utilisent des approches fondées sur les données : les systèmes à mémoire de traduction et les systèmes statistiques. Le cœur d’un système à mémoire de traduction est une base de données dans laquelle chaque segment déjà traduit est représenté par sa représentation en langue source et sa représentation en langue cible. La représentation peut être plus ou moins complexe allant d’une simple chaîne de caractères à une représentation utilisant plusieurs niveaux de représentation linguistique. Traduire un nouveau segment S signifie chercher une combinaison de segments, ou sous-segments, de la base de données qui se rapproche le plus de S. Les traductions des segments ou sous-segments choisis sont combinées pour produire une traduction de S en langue cible.

Avec un système de traduction statistique, on considère la traduction comme un problème de décodage. Le modèle de base utilise deux sources de connaissances statistiques définies par des distributions de probabilités calculables séparément :

L’étape de traduction proprement dite est une étape de décodage (de recherche) qui cherche à maximiser le produit Pr(c).Pr(s|c) pour l’ensemble des phrases cibles c connaissant la phrase source s.

Hervé Blanchon