L'Open Archives Initiative

Historique

n.c Le mouvement OAI a pris racine lors d'un meeting les 21 et 22 octobre 1999 à Santa Fe (Nouveau Mexique). Ce meeting reunissait les plus grands archivistes de pre-prints et de e-prints (arXiv.org, CogPrints, NDLTD, RePEc, etc.). Son objectif était de faire discuter ensemble ces acteurs sur les difficultés ou impossibilités d'effectuer des requêtes portant sur plusieurs de leurs archives en même temps. Des solutions devaient être proposées pour résoudre ce problème d'interopérabilité.

Pour ce meeting, un prototype d'architecture avait été établi: l'UPS (Universel Preprint Service). Depuis ce prototype a évolué et est connu sous le nom de OAI-PMH (Open Archive Initiative Protocol for Metadata Harvesting), et l'organisation qui le gère sous le nom de OAI (Open Archive Initiative).

Dans une architecture OAI on distingue deux rôles principaux que sont les fournisseurs de ressources et les fournisseurs de services. COCOON est typiquement un fournisseur de ressources. Ses ressources n'ont de spécial que d'être des ressources d'une communauté particulière et d'une nature particulière (des corpus oraux). Les fournisseurs de services offrent des outils pour un ou plusieurs fournisseurs de ressources. L'outil de plus fréquement proposé est le moteur de recherche.

Le dialogue entre un fournisseur de service et un fournisseur de ressources se fait à l'aide du protocole définit par l'OAI (OAI-PMH). Les informations qui sont véhiculées lors de ces dialogues sont des métadonnées et non pas les données elles-même, c'est-à-dire des descripteurs de ressources (équivalent d'une notice bibliographique pour la publication papier classique)

L'entrepôt OAI Coccon

Cocoon est organisé sur le modèle OAI comme un fournisseur de ressources (ou "entrepôt"). L'interface qui répond au protocole OAI-PMH est accessible à partir de l'URL de base http://cocoon.huma-num.fr/crdo_servlet/oai-pmh. C'est cette URL qui est utilisée par les fournisseurs de services pour moissonner les métadonnées de Cocoon. Seules les ressources dont les métadonnées sont librement accessibles sont moissonnables par ce protocole. Cette interface permet de délivrer au choix, les métadonnées suivant plusieurs modèles (correspondant à des schémas de métadonnées différents):

  • 'oai_dc': correspond au Dublin-core simple (norme ISO 15836). Ce schéma, obligatoire dans le cadre de l'OAI, permet d'assurer la plus large inter-opérabilité.
  • 'crdo_dcq': correspond au Dublin-core Qualifié
  • 'olac': correspond au schéma définit par l'organisation "Open Language Archive Community", qui est basé sur le Dublin-core qualifié avec quelques ajouts de vocabulaires contrôlés
  • 'mods': "Metadata Object Description Schema" est un schéma de description de données bibliographiques développé à l'origine par la Bibliothèque du Congrès. Ce schéma permet d'assurer une base de compatibilité avec les outil bibliographiques.

Quelques moissonneurs de Coccon

L'entrepôt Cocoon est régulièrement moissonné par des fournisseurs de services. Nous pouvons citer à titre d'exemple, les moteurs de recherche suivant:

  • Isidore : la plateforme de recherche et d'accès aux données numériques et numérisés de la recherche en sciences humaines et sociales d'Huma-Num.
  • OLAC Language Resource Catalog : le moteur de recherche à facettes de l'organisation OLAC qui permet de rechercher dans l'ensemble des archives orales de cette communauté.
  • Virtual Language Observatory (VLO) : le moteur de recherche dans les ressources des centres CLARIN.
  • Bielefeld Academic Search Engine (BASE) : le moteur de recherche à facettes de l'université de Bielefeld.
  • Worldcat : la vaste base de données bibliographiques de l'Online Computer Library Center (OCLC).

Références