00000001.jpg

CHERCHER

Accueil Actualités Dépêches Coup de projecteur Manifestations Contact

Technologies de la Langue

Imprimer cet article

  NEOLOGOS : les ressources linguistiques issues du projet sont disponibles
jeudi 16 novembre 2006


L’information :

Les ressources linguistiques du projet NEOLOGOS sont désormais disponibles dans le catalogue de ressources linguistiques d’ELRA. Elles se composent des bases de données suivantes :

-  ELRA-S0226-01 IDIOLOGOS 1 "Bootstrap" (NEOLOGOS Project)
Cette base de données contient les enregistrements de 1 000 locuteurs français adultes (470 hommes, 530 femmes) enregistrés à travers le réseau téléphonique fixe français. Les locuteurs ont prononcé 45 phrases phonétiquement riches. Ces 45 phrases sont identiques pour tous les locuteurs.

-  ELRA-S0226-02 IDIOLOGOS 2 "Eingenspeakers" (NEOLOGOS Project)
Cette base de données contient les enregistrements de 200 locuteurs français adultes (97 hommes, 103 femmes) enregistrés à travers le réseau téléphonique fixe français. Les locuteurs ont prononcé 45 phrases phonétiquement riches, avec 10 appels par locuteur. Les 450 phrases prononcées par locuteur sont identiques pour tous les locuteurs. Les locuteurs ont été sélectionnés à partir de la base IDIOLOGOS 1 "Bootstrap" (ELRA-S0226-01).

-  ELRA-S0227 PAIDIALOGOS (NEOLOGOS Project)
Cette base de données contient 37 364 occurrences de 1 010 locuteurs français enfants (510 hommes, 500 femmes) enregistrés à travers le réseau téléphonique fixe français.

L’analyse de la Dépêche Technolangue :

Le programme Technolangue vise, entre autres objectifs, à mettre en place un dispositif pérenne qui aide à capitaliser sur les résultats des recherches et développements issus de la recherche publique ou de l’industrie, en offrant un accès aux outils et données nécessaires à développer les technologies et poursuivre de bonnes pratiques dans les domaines couverts. Dans ce contexte, le projet NEOLOGOS, financé par le Ministère français chargé de la Recherche et des Nouvelles Technologies (MRNT), a eu pour but de produire des ressources de parole pour le développement et l’évaluation de systèmes de reconnaissance de la parole ou du locuteur pour la langue française, ainsi que de systèmes de synthèse de la parole. Une méthode générale a été proposée afin d’optimiser le contenu des bases de données en terme de diversité des voix enregistrées, tout en réduisant le nombre de locuteurs enregistrées. Un autre objectif était également de proposer une bonne couverture des voix d’enfant pour la langue française. Le consortium NEOLOGOS est formé de partenaires universitaires et industriels français : ENSSAT, France Télécom R&D, IRISA, LORIA, TELISMA et ELDA. Une description du projet est disponible sur ce site.