Corpus de la parole

Corpus de la parole

La Délégation générale à la langue française et aux langues de France (DGLFLF ) a présenté, dans le cadre du plan de numérisation piloté par la MRT (Mission pour la Recherche et la Technologie) du ministère de la Culture , un programme consistant à numériser des fonds sonores du français et des langues parlées en France. Ce projet concerne non seulement les fonds « fragiles » dont les supports analogiques sont dans un état de détérioration, mais aussi des fonds plus récents qui constituerons ainsi une vaste base de données.

Par leur indexation, leur catalogage et l'établissement de normes d'interopérabilité, l'objectif est de valoriser ces fonds. Un site portail sera créé, présentant les corpus de français et de langues de France de la base de données, regroupant de ce fait une riche collection de corpus des-dites langues. Par conséquent, cette base de données mettra à disposition à la fois de la communauté scientifique et du grand public des ressources représentant la diversité des pratiques linguistiques en France.

Les fédérations Institut de linguistique française (ILF ) et Typologie et universaux linguistiques (TUL ) ont été sélectionnées pour proposer les corpus qui bénéficieront du plan de numérisation et l'Institut de l'Information Scientifique et Technique (INIST ) a été chargé de l'intégration des extraits de corpus dans un site portail. Le CRDO intervient dans la coordination du travail sur les corpus de la fédération TUL.

Ce programme qui s'inscrit dans une initiative unique en Europe et au niveau international, propose la numérisation de notre patrimoine linguistique dans le respect des nouvelles technologies de conservation, mais aussi d'enseignement et de traitement automatique des langues, et assurera ainsi la vitalité du français et des langues de France, véritable source de diversité culturelle.

Consignes pour la description et éventuellement pour le dépôt des ressources qui vont alimenter le site portail: consulter les consignes.

Références