00000001.jpg

CHERCHER

Accueil Actualités Dépêches Coup de projecteur Manifestations Contact

Technologies de la Langue

Imprimer cet article

  Objectifs
mardi 13 mai 2003


Les technologies de la langue, parlée comme écrite, font l’objet d’enjeux industriels et économiques grandissants au plan international. Le développement de la Société de l’information nécessite leur disponibilité, aussi bien dans le cadre de la mondialisation des marchés que dans celui de la localisation des produits et des services. De multiples applications apparaissent, liées en particulier à la généralisation de l’usage de l’Internet et des systèmes de téléphonie mobile.

Ce secteur est d’autant plus important qu’à côté des aspects technologiques, scientifiques et économiques, il possède une très forte dimension culturelle et sociétale.

Des actions ont déjà été menées dans les Réseaux de recherche et d’innovation technologiques, sous forme de financement de projets de R&D associant industriels et chercheurs qui développent ou utilisent ces technologies, dans le cadre de différentes applications, ou dans le cadre de l’organisation d’un colloque commun RNRT-RNTL sur le thème « Langue et technologies » en novembre 2000 à Nancy.

Mais ces actions sont limitées dans le temps. L’objectif de l’action Technolangue est de mettre en place un dispositif permanent qui permette de capitaliser sur les résultats des recherches et développements conduits dans le contexte de la recherche publique et de l’industrie.

Ce dispositif doit comporter plusieurs éléments :

-  Une veille technologique permettant de connaître l’état de l’art des technologies de la langue et de leurs usages dans différentes applications, dans le contexte international.
-  Une infrastructure d’évaluation des technologies de traitement automatique du langage parlé (reconnaissance vocale, synthèse de la parole, reconnaissance du locuteur...) et du langage écrit (recherche d’informations, résumé automatique, traduction automatique, compréhension de textes...), mais également l’usage de ces technologies dans le cadre d’évaluation ergonomique.

-  Une infrastructure de ressources langagières. Ces ressources peuvent être composées de données de texte ou de parole, comportant ou non une valeur ajoutée (annotations de différents niveaux), telles que corpus, lexiques ou données terminologiques. Ces données sont essentielles pour développer et tester des systèmes. Les ressources peuvent également comporter des outils de traitement de la langue, en particulier ceux qui auront été évalués. Ce thème comporte à la fois des aspects technologiques et des aspects liés à l’économie et au droit de ces ressources.

-  Un accès facile à la connaissance des normes et standards développés pour ce domaine, et une participation à leur constitution. Ce dispositif doit à la fois pouvoir faire intervenir les meilleurs experts de ces domaines, tant chercheurs qu’industriels et veiller à ce que l’accessibilité pérenne au dispositif soit assurée.

Compte tenu des efforts consentis pas la Commission européenne au domaine des Technologies de la Langue dans le passé (programme Human Language Technology du 5e PCRD), et annoncé pour le 6e PCRD (Knowledge Management et Multisensorial Interface, un des 4 thèmes de l’action Information Society Technologies doté d’un budget de 3,6 G€ , et des différentes actions structurantes en cours (Euromap, Class, Elsnet), il est primordial que soit définis et établis des liens avec les activités de la Commission européenne, à travers les nouveaux instruments, Réseaux d’excellence, Programmes intégrés et utilisation de l’Article 169 pour le soutien aux collaborations nationales, dans la perspective de la construction de l’Espace européen de la Recherche, qui pourrait nous amener à collaborer avec des programmes similaires identifiés dans d’autres pays européens.

Cette action devra également se situer dans le contexte international, en tenant compte des efforts consentis sur le thème des technologies de la langue, et tout spécialement de l’évaluation, d