Enquête Socio-Linguistique d'Orléans

ESLO

Le corpus ESLO (Enquête Socio-Linguistique d'Orléans) constitue, par son ampleur et sa cohérence, le plus important témoignage sur le français parlé avant 1980. Constitué par des universitaires britanniques à des fins didactiques (enseignement du français langue étrangère dans le système public d'éducation anglais), il représente à la fois une masse de documents papiers et une collection de bandes magnétiques vieillissante. L'objectif est de transférer les données sonores contenues dans l'enregistrement magnétique et d'en assurer l'indexation, un premier balisage et la mise à disposition sur Internet. Parallèlement, une exploitation exhaustive d'un sous-ensemble est engagée.

Partant de l'expérience acquise, le CORAL (Centre orléanais de recherche en Anthropologie et Linguistique) a mis en chantier une nouvelle enquête dénommée ESLO2. L'objectif est d'évaluer, à une quarantaine d'années de distance, la dynamique sociale du français (et des usages de la langue comme des jugements sur son emploi) en prenant en compte la diversité des changements en fonction des paramètres sociaux. Le projet comprend quatre étapes :

  1. Constitution des données. Un travail de réflexion a été mené sur le questionnaire et sur la population auprès de laquelle sera menée l'enquête. Une première enquête auprès de témoins d'ESLO1 ré-interviewés (A. Chesneau) est en cours. Le CORAL bénéficie pour cela du soutien de laboratoires européens et, en sociologie, de l'assistance de Monique de Saint-Martin (EHESS).
  2. Transcription, annotation, balisage. Cette étape est engagée avec une réflexion plus générale sur le traitement des corpus (cf. Corpus Oraux, Guide des bonnes pratiques 2006, O. Baude éd.) et sur les conditions de réalisation d'une interopérabilité des corpus (programme GRICO CORAL-LACITO-MoDyCo).
  3. Mise en ligne. Afin d'offrir à l'ensemble des utilisateurs potentiels une accessibilité à la masse des données, la construction d'un site Internet, facile d'accès et hébergé sur un site public, est l'un des objectifs inclus dans notre cahier des charges. La possibilité d'interrogation multicritères, la convivialité, les capacités d'incrémentation et de liens avec des sites corrélés sont à prendre en compte sans restriction. En effet, la synergie avec d'autres bases est l'une des ambitions du travail à accomplir dans ce domaine. Cette étape se fait en partenariat avec le Programme "Corpus de la Parole"- DGLFLF-Ministère de la Culture).
  4. Proposition d'application. En lien avec une orientation du CORAL qui articule dans ses masters les formations en FLE (Français Langue étrangère) et en TAL (Traitement Automatique des Langues), des pistes pour la conception de didacticiels peuvent être esquissées.

Engagé depuis deux ans, ce programme a pris la forme d'une préservation d'ESLO1 et d'un traitement numérique des données, avec un recensement des travaux effectués sur le corpus. Depuis un an, il s'est engagé dans la préparation d'ESLO2.

Références