00000001.jpg

CHERCHER

Accueil Actualités Dépêches Coup de projecteur Manifestations Contact

Technologies de la Langue

Imprimer cet article

  Projet AudioSurf, pour une plate-forme d’indexation de l’audio
lundi 3 juillet 2006


L’information :

La société Sinequa, en partenariat avec la société Vecsys, le laboratoire LIMSI du CNRS, et Radio France se sont regroupés autour du projet AudioSurf, dans le but de créer une plate-forme d’indexation de l’audio afin de permettre à des utilisateurs de retrouver une information dans un corpus d’émissions radiophoniques de Radio France comme s’il s’agissait de documents texte.

L’analyse de la Dépêche Technolangue :

Le domaine de l’information est de plus en plus envahi par le multimédia. En particulier sur l’Internet, l’augmentation des données disponibles s’accompagne du phénomène bien connu d’impossibilité à retrouver une information archivée mais noyée au sein de bases de données gigantesques. Pour les données audio, on retrouve les mêmes contraintes que pour les données textuelles : impossibilité de traitement manuel, d’où une impossibilité à retrouver l’information.

L’une des réponses techniques pour permettre une meilleure récupération de l’information, en ce qui concerne les données textuelles, est le travail d’indexation de ces données. L’indexation de documents audio et audiovisuels sur l’Internet pose des problèmes particuliers essentiellement liés à la nature des données (compression, hétérogénéité, multimodalité de l’information). D’autres projets en cours aux USA (SpeechBot, Informedia à CMU, DARPA TDT) et au Japon concernent l’indexation de documents télévisés ou d’archives audiovisuelles. Cependant, aucun de ces projets ne traite la langue française.

Le projet propose de mettre au point des systèmes permettant de gérer l’information audio selon des procédés du même type que ceux déjà mis en place pour les informations textuelles (indexation, recherche documentaire, filtrage, routage, extraction d’information, catégorisation, etc.).

Liens utiles :
-  Fiche du projet AudioSurf du RNTL
-  Présentation du projet sur le site Sinequa