La pérennisation

La pérennisation des données consiste à prendre toutes les mesures nécessaires pour s'assurer que celles-ci restent intègres, lisibles et authentiques dans le temps. En ce qui concerne les informations numériques, la lutte contre l'obsolescence est particulièrement importante et conduit à des rythmes assez rapides de migrations de supports, de changements de matériel, de système et des transformations de formats. Une autre caractéristique du numérique est que l'information étant codée, des efforts supplémentaires doivent être fait pour décrire ce codage et maintenir cette description dans le temps.

Les services d'archives en charges de cette responsabilité font appel à des techniques d'empreintes, d'horodatage, de scellement, de redondance... La veille tehnologique et économique est aussi une part importante de leur travail. D'un point de vue organisationnel, ils doivent veiller à la sécurité et à la traçabilité de leurs opérations. La norme conceptuelle OAIS décrit un modèle d'organisation auquel de nombreux organismes se réfèrent. C'est ce modèle qui a été suivi dans la mise en place du service d'archivage pérenne de la TGIR Huma-Num.

L'archivage des données de Cocoon

COCOON a été impliqué lors de la conception en 2008 puis de la mise en place en 2010 du service de préservation à long terme de la TGIR Huma-Num. L’organisation de ce service a été construite sur le modèle de la norme ISO OAIS. Il est adossé sur deux centres de calcul: celui du CINES (Centre Informatique National de l'Enseignement Supérieur) comme site primaire et celui de l'IN2P3 (Institut national de physique nucléaire et de physique des particules) comme site secondaire. Le rôle de COCOON (à l’époque CRDO-Paris) dans cette organisation est celui d’un service versant pour le compte des producteurs, ainsi que celui d’un service d’accès auprès des utilisateurs.

Toutes les ressources de Cocoon sont archivées au fur et à mesure de leur publication par le CINES, l'opérateur d'archivage d'Huma-Num. Les seules ressources qui font exception sont celles qui sont déjà archivées aux Archives nationales ou à la Bibliothèque nationale de France. Dans tous ces cas, le modèle d'organisation utilisé par ces opérateurs est celui décrit dans la norme conceptuelle OAIS.

Open Archival Information System (OAIS)

L'OAIS correspond à la norme ISO 14721:2003 (révisé en 2012) - "Reference Model for an Open Archival Information System". Il s'agit du résultat d'un groupe de travail du Consultative Committee for Space Data Systems (CCSDS) rassemblant au départ les grandes agences spatiales et élargit pour des raisons de généricité du sujet, à d'autres domaines comme celui des archives institutionnelles ou des bibliothèques.

L'OAIS présente un modèle conceptuel définissant l'organisation d'un système d'archivage. Il définit:

  • Un modèle fonctionnel comportant les différentes entités (l'entrée, le stockage, la gestion des données, l'administration, la planification de la préservation et l'accès);
  • Des acteurs (les producteurs, l'archive, les utilisateurs, le management);
  • Un modèle d'information avec l'information de représentation (syntaxique et sémantique), l'information de périnnisation (identification, provenance, contexte, intégrité) et l'information d'empaquetage;
  • Une définition des paquets d'information: les SIP Submission Information Package ou Paquet d'informations à verser, les AIP Archival Information Package ou Paquet d'informations archivé, les DIP Dissemination Information Package ou Paquet d'informations diffusé.
  • Un lexique associé à tous ces concepts

Références

  • La norme OAIS (traduite en français) sur le site du groupe PIN (Préservation de l'Information Numérique).
  • La mise en oeuvre du modèle OAIS dans le cadre des archives orales de Cocoon: Le projet d'archivage pérenne du TGE-Adonis