00000001.jpg

CHERCHER

Accueil Actualités Dépêches Coup de projecteur Manifestations Contact

Technologies de la Langue

Imprimer cet article

  Technolangue.Net
vendredi 21 novembre 2003


Conception, réalisation et maintenance du Portail TECHNOLANGUE.NET - Un réseau de veille électronique sur les technologies de la langue écrite et parlée et des modalités associées

Fiche du 21 novembre 2003



Thème de l'action
Veille informationnelle
Début du projet
4 décembre 2002
Durée du projet
36 mois
 
Résumé
Ce projet a pour objectif le développement d'un portail Internet dans le domaine des technologies du traitement de la langue écrite et parlée. Ce portail est destiné à valoriser le secteur, à informer sur ses acteurs, à rendre compréhensible ses enjeux et à alerter sur les principales évolutions scientifiques, technologiques, industrielles et normatives.

Ce portail s'adressera à deux catégories principales d'usagers : d'une part, les « nouveaux entrants » dans le domaine du traitement des langues, c'est-à-dire les personnes et organismes qui prennent contact avec la communauté du traitement de l'écrit ou de la parole et qui ont besoin d'identifier des ressources, des produits, des offreurs de technologies, des centres de recherche ou qui veulent accéder à une connaissance minimale du domaine, d'autre part tout acteur du domaine désirant accéder à une information ponctuelle. In extenso, ce portail servira également d'ouverture vers le grand public désireux de découvrir les technologies de la langue.

Le portail donnera accès à une information ouverte, qualifiée et utile pour la prise de décisions. Elle couvrira différents secteurs (informations générales présentant le domaine du traitement de la langue écrite et de la langue parlée, ses enjeux, ses possibilités réelles d'applications, panorama de l'offre industrielle et technologique, recensement des appels à propositions et appels d'offres intéressant le domaine, etc., et différentes zones géographiques, parmi lesquelles l'Union européenne, les Etats-Unis, le Japon et les pays francophones.

Objectifs
Ce projet consiste en la création d'un réseau d'information électronique constitué d'un portail central et d'un ensemble de sites spécialisés associés. Ce réseau, par son existence, permettra la création d'une « communauté » d'experts mais aussi d'usagers, francophones comme non francophones. Le mode de création sur Internet permet d'obtenir un tissage de compétences à plusieurs niveaux.

Ce réseau sera construit pour devenir :
  • Un état de l'art, commenté et hiérarchisé, évolutif et global de ce secteur en constante et rapide évolution, avec une attention particulière aux avancées et limites actuelles du secteur ;
  • Un lieu de référence sur les enjeux et les spécificités de ce secteur et pour aider les futurs producteurs à faire les choix qui s'imposent face à des besoins précis ;
  • Un centre de ressources présentant de façon claire et synthétique des définitions, des informations utiles, des conseils, des expertises techniques (les « us & coutumes » du secteur) ;
  • Un lieu de convergences et de débats afin d'offrir des réponses rapides et de favoriser les échanges entre chercheurs, enseignants, ingénieurs, techniciens, industriels, producteurs, journalistes, usagers.


Différentes structures, associations, forums, comme nous l'avons précédemment souligné, existent déjà, portant sur tout ou partie de ce domaine. Nous n'avons pas la volonté de les fédérer mais plutôt de créer des passerelles entre elles. Nous pensons particulièrement aux « liens » entre les lieux où se réfléchissent les normes et standards (comités, forums, etc.) et les lieux où ils doivent s'appliquer, aux « liens » à renforcer entre théoriciens et praticiens, entre les développeurs et les usagers, entre les formateurs et les « apprenants » et, bien sûr, entre le monde académique et le monde industriel. Ce réseau regroupera les diffuseurs d'information déjà existant non pour les suppléer mais pour permettre une diffusion efficace et harmonisée de leur information dans l'ensemble du secteur. Nous voulons établir un référencement plus « profond » qu'un simple échange de lien. Ce réseau sera donc fondé sur la mutualisation des efforts de chacun des partenaires.

Mise en œuvre et état de l'art
L'information joue aujourd'hui un rôle de plus en plus important dans toutes les activités du monde contemporain. En effet, de nombreux facteurs, agissant de manière synergique, ont contribué au cours du dernier quart du XXè siècle, à accroître son influence dans tous les domaines. Simultanément, l'internationalisation des marchés et le développement des Nouvelles Technologies de l'Information et de la Communication (NTIC) ont contribué au multilinguisme et à l'augmentation du volume d'information et ont mis en évidence des besoins nouveaux.

Dans ce contexte, il importe d'avoir une approche « raisonnée » des informations et données numériques ; les aspects d'acquisition, de gestion, d'analyse, d'exploitation, etc., des informations et des données, multilingues ou non, pour la plupart sous formes textuelles ou orales, sont au centre des préoccupations du monde de la recherche et de l'économie.

Les technologies de la langue sont au centre d'enjeux (essentiellement) économiques (elles peuvent conduire à des gains de productivité dans de nombreux secteurs) et culturels (les langues qui ne seront pas informatisées, c'est-à-dire pour lesquelles des outils performants de traitement automatique ne seront pas disponibles risquent à terme d'être exclues des médias modernes de production et diffusion de l'information, professionnelle ou non).

Ces technologies demeurent encore largement méconnues aujourd'hui alors que leur connaissance et leur maîtrise sont essentielles. Beaucoup d'entreprises, d'organismes et de groupes de recherche s'intéressent à ces technologies, de différentes manières. Ils contribuent au développement du secteur soit en créant des outils de traitement de la langue, soit en les évaluant, soit en constituant des ressources linguistiques, soit en valorisant le domaine, soit en favorisant l'informatisation de certaines langues, soit en proposant des normes et standards, soit en intégrant ce type de technologies dans des applications, etc.

Il est par ailleurs important d'attirer l'attention sur l'étendue des champs d'action de l'ingénierie linguistique, l'éclatement de ses composantes et l'hétérogénéité de ses objectifs. Il s'agit d'un secteur, certes porteur, mais qui connaît des bouleversements constants. Il suffit de comparer le paysage des industries de la langue en 1999 à celui d'aujourd'hui pour s'en rendre compte. Des organismes ont soit disparu, soit changé de nom, soit modifié et/ou réduit leurs activités, d'autres sont apparues, d'autres encore, ont rencontré ou rencontrent des difficultés.

Il y a ainsi besoin d'avoir un lieu central organisant un réseau de veille et de valorisation de ces technologies des langues qui puisse répondre aux actions suivantes :
  • Répertorier les acteurs, les outils et les technologies du domaine ;
  • Analyser les pratiques et les rendre explicites ;
  • Rendre visibles les nouvelles tendances et avancées ;
  • Montrer la création et l'implémentation des normes et standards, en usage ou en cours d'élaboration.


Organisation
Le site portail sera constitué de différents lots informationnels identifiables. Chaque lot sera sous la responsabilité d'un ou plusieurs partenaire(s). Tous les partenaires gèreront et mettront à jour leur propre contenu sur leur site du réseau, tout en alimentant le portail conformément au(x) lot(s) dont ils ont la responsabilité.


Un comité de pilotage sera composé de représentants des partenaires et de personnalités extérieures.


  1. Première étape :
    • Analyse, convergence des ressources existantes et commande de contenus originaux ;
    • Création du site portail (architecture, base de données, interface, réalisation requêtes et pages matrices) ;
    • Durée : 3 mois.

  2. Deuxième étape :
    • Phase de test ;
    • Portage des informations minimales (toutes les parties du site doivent être complétées avec une information de premier niveau) ;
    • Durée : 3 mois.

  3. Troisième étape :
    • Correctifs informatiques et validation de la structure du site portail ;
    • Durée : 3 mois.

  4. Quatrième étape :
    • Mise en ligne du site et lancement du réseau ;
    • Valorisation du réseau (alimentation complète de toutes les parties) ;
    • Développements informatiques nouveaux suivant les usages réels du réseau ;
    • Mise à jour et actions trimestrielles pour répondre aux besoins émergents (commandes de nouveaux outils ou de contenus originaux) ;
    • Durée : 3 mois.

      Total des phases de création : 1 an.

  5. Cinquième étape :
    • Finition des lots informationnels (alimentation complète de toutes les parties) ;
    • Développements informatiques nouveaux suivant les usages réels du réseau ;
    • Mises à jour et actions trimestrielles pour répondre aux besoins émergents (commandes de nouveaux outils ou de contenus originaux) ;


Retombées du projet
Le résultat sera de deux types :

1)Un principe d'anneau reliant les sites des différents partenaires, avec un site portail faisant office de porte d'entrée dans l'anneau. Les sites de l'anneau seraient reliés entre eux et avec le site portail. Chaque partenaire se chargerait d'alimenter et de mettre à jour des rubriques clairement identifiables sur son propre site, correspondantes aux lots dont il a la charge. Pour identifier et rendre plus visible ce réseau, ces sites membres respecteront une signalétique commune, donnant accès aux autres sites du réseau à partir de leur page d'accueil ; chaque partenaire se devra par ailleurs de maintenir un haut niveau de qualité et de fiabilité proportionnel à leurs engagements.

2)Un site portail présentant des informations validées, synthétisées et actualisées, renvoyant, par des liens nombreux et précis aux ressources de différents sites du réseau. Ce site portail sera structuré en différentes parties nettement identifiables, correspondant à des lots informationnels qui seront sous la responsabilité d'un ou plusieurs partenaires. Ainsi, le site portail ne sera ni une coquille vide ni un prétexte. En plus de la viabilisation de son propre site, comme décrit dans le principe d'anneau, chaque partenaire aura la charge d'animer la/les partie(s) du site portail, correspondant aux lots dont il a la charge. Il s'agit de faire un réel site portail donnant un accès complet et « raisonné » aux ressources du domaine, ne se substituant pas aux sites déjà existant mais en offrant une « plus value » par la mutualisation des ressources et une vue complète du domaine. Chaque partenaire restera « maître » des ressources de son propre site mais il aura la charge d'en extraire une synthèse répondant aux objectifs du site portail.

Etat d'avancement
Projet en cours

Partenaires du projet
  ELDA (Evaluation and Language Resources Distribution Agency)
CRIS (Centre de Recherche en Information Spécialisée et en médiation des savoirs, Université Paris X)
ATALA (Association pour le Traitement Automatique des LAngues)
APIL (Association des Professionnels des Industries de la Langue)
AFCP (Association Francophone de la Communication Parlée)

Autres collaborateurs :
AFNOR (Association Française de Normalisation)
DFKI GmbH (German Research Center for Articifial Intelligence)
 
Contact
  Responsable CRIS : Richard Walter

Responsable ELDA : Valérie Mapelli
Téléphone : 01 43 13 33 33
Mel : info@technolangue.net