Des nouvelles pas fraîches

TAUM

TAUM

TAUM

La traduction automatique de l’Université de Montréal

Dans un pays officiellement bilingue et pratiquement multilingue comme le Canada, nombreux sont les problèmes suscités par la barrière des langues.

C’est donc dans cette optique de réunion de toutes les «solitudes» que l’Université de Montréal a choisi, depuis une quinzaine d’années, de créer un Groupe de recherche linguistique orienté d’abord vers le traitement informatisé des langues puis vers la traduction, d’ouvrir une école de traduction et d’organiser une banque de terminologie ainsi qu’un centre de documentation, lesquels ne sont que le commencement d’une série d’initiatives qui ont déjà réussi à attirer l’attention du monde entier.

Depuis les années 50, plus d’un centre de recherches universitaire ou industriel a tenté de s’attaquer à la traduction automatisée mais a dû abandonner faute de subventions. C’est donc toute une décision que celle de se lancer en pionnier dans cette maîtrise des secrets de la langue… la tâche du Groupe de recherche fut néanmoins facilitée par le Gouvernement du Canada qui, dès 1965, par l’entremise du Conseil national de recherches a fourni des subventions au premier Centre d’étude du traitement informatique des données linguistiques (CETADOL) qui devint le Groupe de recherche en traduction automatique connu sous le sigle de TAUM. Et c’est en collaboration avec le Secrétariat d’État du Canada que TAUM s’efforce aujourd’hui de réaliser un système de traduction informatisée.

En 1975, TAUM MÉTÉO (actuellement le seul système de traduction informatisée en exploitation au monde) a vu le jour et depuis 1977, les bulletins du Centre météorologique canadien sont traduits automatiquement.

Puis en 1976. TAUM AVIATION est conçu pour traduire de l’anglais les manuels d’entretien du nouvel avion Aurora de la Défense nationale. Et c’est le 27 mars dernier que l’Université de Montréal présentait officiellement le système de traduction informatisée qui marque une étape décisive en traduction. Personne, avons-nous cru, n’était mieux placé pour nous en parler que le directeur de TAUM. Marcel Paré.

Une récente démonstration qui s’est déroulée à l’Université de Montréal semble avoir établi que l’ordinateur pouvait traduire, est-ce exact?  C’est faire à l’ordinateur beaucoup d’honneur ! L’ordinateur ne traduit évidemment pas.

Il peut cependant faire des opérations logiques très complexes qui pourraient correspondre partiellement au cheminement que suit, avec les mots et les phrases, le traducteur humain. La traduction informatisée est réalisée par l’ordinateur dans la mesure où on lui a fourni les moyens de le faire, en mettant à sa disposition le plus grand nombre de renseignements, nécessaires d’ailleurs au traducteur humain pour accomplir la même tâche, c’est-àdire des dictionnaires et des grammaires.

Mais cela ne suffit pas. Le traducteur se sert aussi de ce qu’on appelle (curieusement) les «mécanismes» de son intelligence et de sa mémoire, pour utiliser à bon escient ses dictionnaires, ses grammaires, son expérience, ses connaissances, etc.

Parallèlement, l’ordinateur, n’ayant pas une once d’intelligence, d’expérience et d’intuition, doit être «programmé» avec soin pour pouvoir consulter dictionnaires et grammaires.

Plutôt que l’ordinateur, c’est donc ceux qui l’ont alimenté qui sont au fond les vrais traducteurs. C’est juste. La qualité d’une traduction informatisée repose sur la qualité des éléments fournis à la chaîne de traduction que ce soient les dictionnaires ou les grammaires d’analyse, de transfert et de génération syntaxique et morphologique.

Qu’entend-on par les dictionnaires el les grammaires fournis à l’ordinateur? S’agit-il des ouvrages que nous connaissons? Les éléments d’information qui constituent les dictionnaires et les grammaires sont sensiblement les mêmes que ceux dont nous nous servons, mais présentés et utilisés différemment.

Les dictionnaires, au nombre de deux, sont le dictionnaire d’analyse de la langue de départ (présentement l’anglais) et le dictionnaire de traduction (de l’anglais au français), le dictionnaire d’analyse contient tous les mots anglais du texte à traduire; il ne sert qu’à bien analyser la phrase anglaise afin d’en comprendre le sens. Au collège, on nous répétait que la traduction des textes de Virgile ou d’Homère reposait sur la bonne analyse que nous pouvions en faire, une fois l’analyse faite, c’était un jeu d’enfant. Notre dictionnaire renferme donc tous les renseignements dont le système a besoin pour analyser chaque phrase anglaise du texte à traduire.

Quant au dictionnaire de traduction, il comprend tous les mots anglais du dictionnaire d’analyse ainsi que tous les équivalents français dont on aura besoin pour réaliser la traduction.

Les équivalents de la langue courante sont choisis avec soin ; mais quant aux termes techniques, cela va de soi, ce sont ceux que le client juge conformes à ses normes. Ce dictionnaire contient aussi des renseignements d’ordre syntaxique, sémantique et morphologique, tout comme le dictionnaire d’analyse, mais, cette fois, en fonction de la langue d’arrivée, soit le français.

Pour ce qui est des grammaires, elles se composent de toutes les règles de traitement devant être utilisées pour traduire un texte. Ces règles permettent les analyses de morphologie, de syntaxe et de transfert des mots selon le contexte ainsi que la génération syntaxique et morphologique d’une phrase en langue d’arrivée.

El au moyen de ces outils, pourriez-vous traduire n’importe quoi ?

Loin de là, car nos dictionnaires devraient renfermer tous les mots des langues en présence et nous devrions avoir établi toutes les règles de comportement des langues de départ et d’arrivée, ce qui est impossible.

D’abord, la langue a des moyens d’expression qui débordent les règles de son comportement, moyens qui obéissent aux préoccupations du rédacteur ou de l’écrivain et qui lui sont dictés par sa fantaisie, son imagination, son affectivité et bien d’autres mobiles.

Or la machine est insensible à ces préoccupations et aux subtilités langagières qu’elles peuvent engendrer. Qui sait, peut-être la machine à traduire de l’an 3000 aura-t-elle cette sensibilité, mais ni vous ni moi ne serons là pour en juger.

Ce que la chaîne de traduction informatisée de TAUM AVIATION peut traduire à l’aide de ses dictionnaires et de ses grammaires, c’est ce qu’on appelle une langue de spécialité, un sous-langage, qui n’a pas besoin de tous les mots de la langue, mais seulement de ceux d’un domaine particulier. La médecine emploie un de ces sous-langages, dont l’anatomie est à son tour un sous-langage plus restreint. Le manuel d’entretien du système hydraulique d’un avion peut compter 100000 mots ou même davantage, mais il peut n’avoir été écrit qu’à l’aide de 4 ou 5000 mots. Ce qui réduit singulièrement le volume des dictionnaires.

Prenez la météorologie dont les bulletins sont traduits automatiquement de l’anglais au français depuis plus de deux ans. Je ne vous apprends rien en vous disant que la météo emploie non seulement une terminologie très restreinte, mais aussi une grammaire très limitée. Son style télégraphique se prête bien à la traduction informatisée. Il en va de même pour les manuels d’entretien qui ne souffrent aucune ambiguïté, dont la terminologie, pour un domaine donné, est facile à cerner, qui ne s’embarrassent pas de longues périphrases ni de propositions enchevêtrées, qui n’emploient jamais la première personne, ni même la deuxième, et dont les verbes sont le plus souvent à l’impératif (que le système transposera automatiquement en infinitif français dans la plupart des cas). Le langage des directives se prêle bien, lui aussi, à la traduction informatisée.

Mais pourquoi l’Université de Montréal s’intéresse-l-elle à la traduction informatisée ?

Parce que c’est un champ d’activité d’une importance grandissante. En effet, c’est un champ d’activité très important qui est loin d’être défriché. Car bien que les recherches en traduction appliquée connaissent un véritable succès, elles soulèvent toutefois de nombreuses questions que seule peut résoudre la recherche théorique. C’est pourquoi il serait tout à fait indiqué, parallèlement aux recherches en cours, de pousser l’enseignement vers la formation de linguistes, de traducteurs, de terminologues et d’informaticiens spécialisés en traduction automatique. Ce genre de formation pourrait se faire dans le cadre d’un Laboratoire d’analyse et de traitement du langage, qui regrouperait alors toutes les sciences du langage !

Par Joselyne Delage. L’Interdit, la revue des Diplômés de l’Université de Montréal, #269, mai-juin 1979

langue

Langue

Nombreux sont les problèmes suscités par la barrière des langues. Photo : Megan Jorgensen

Lire aussi :

Laissez un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Vous pouvez utiliser ces balises et attributs HTML : <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>