Objectifs de ce texte

Qu’est-ce qu’un document, comment se matérialise-t-il, que contient-il ? Comment a-t-il été généré et dans quel contexte ? Quel est le rôle de l’archiviste ? Comment traite-t-il l’information contenue dans ce document ? Comment gère-t-il le document ? Autant de questions familières à l’archiviste, probablement moins au non-archiviste. Qui prétend fournir des outils informatiques utiles au travail de l’archiviste doit se poser ces questions et y apporter ses propres (car celles-ci peuvent être diverses) réponses. Et, ces réponses ne viennent pas toutes avant la conception du logiciel, elles se forment également au cours du temps, en fonction des expériences accumulées et de réflexions permanentes. Ces réponses ne sont jamais définitives et un logiciel doit sans cesse s’améliorer, particulièrement dans un contexte qui évolue, comme actuellement, de manière profonde. Anaphore propose ici, principalement sous la forme de schémas, une vision, sa vision (nécessairement simplifiée), de l’écosystème (pour employer un terme à la mode) du document d’archives, vision qui a été à la base de la conception de son logiciel mais qui est aussi à la base de ses évolutions à venir. Nous souhaiterions que la présentation de ce formalisme suscite des commentaires, des contradictions. Nous poursuivrons, à travers d’autres textes à venir, à exposer nos réflexions sur la description archivistique.

Qu’est-ce qu’un document ?

Un document (une ressource archivistique) :

  • est un objet
  • il contient de l’information

DocumentObjetInformation

L’objet peut être matériel (dossier papier, estampe, photographie…) ou numérique. On peut donc distinguer deux types d’objets-documents : matériel ou numérique.

DocumentObjetType

L’objet est matérialisé par un support, qui diffère suivant qu’il est matériel (papier, verre – comme les photographies sur plaque de verre…) ou informatique (bande, CD, serveur…).

DocumentObjetSupport

Ce support a des caractéristiques, suivant sa nature : dimensions, nombre de feuillets ou de pages dans le cas d’un livre, d’un registre, d’un dossier… Il ne s’agit pas, ici, de détailler ces caractéristiques. L’information consignée dans le document peut nous donner des renseignements sur une personne, un lieu, un événement… On dira qu’elle concerne un (ou plus d’un) sujet. On peut distinguer information sous forme de texte non structurée et information structurée. Cette distinction a une importance pratique car, pour les dernières, l’archiviste, son prestataire ou l’utilisateur final peuvent sans difficulté en extraire des jeux de données exploitables. C’est le cas, bien entendu, de données nominatives : les registres matricules militaires dans l’actualité récente. Il est possible qu’un même document contienne des informations sous formes structurée et non structurée.

DocumentSujetNature

 

Document, objet, information

On peut s’interroger sur l’articulation de ces trois notions.

Nous avons déjà évoqué le modèle conceptuel FRBR des bibliothécaires, qui distingue quatre entités – œuvre, expression, manifestation, item. Les deux premières sont de nature intellectuelle, les deux dernières la matérialisation des précédentes. Les archivistes finlandais, par exemple, se sont directement inspirés du modèle FRBR pour leur modèle conceptuel de description archivistique. Toutefois, FRBR ne s’applique pas directement aux archives, au moins pour l’ensemble des entités du groupe 1, citées ci-dessus. Néanmoins, on doit distinguer des propriétés qui se rapportent au document comme objet, et des propriétés qui concernent l’information consignée dans le document. Lorsque nous avons commencé à travailler sur un modèle pour les archives, nous nous sommes assez longuement interrogés pour savoir si nous devions prendre en compte une classe unique des documents, deux classes distinctes correspondant aux aspects matériels (le document lui-même) et immatériels (l’information qui y est consignée) ou trois classes, le document étant une superclasse des deux autres. Nous n’avons pas choisi de distinguer plus d’une classe, mais de bien prendre en compte d’une part des propriétés qui concernent l’objet (matériel ou numérique) et, d’autre part, des propriétés qui concernent l’information consignée.

Dans le tout premier schéma ci-dessus, sont présentées deux propriétés de natures très différentes – « est un » et « contient » :

  • Le document est un objet. Cela peut signifier l’appartenance à une classe très large des objets. En tant que tel, le document peut avoir des propriétés communes avec d’autres types d’objets : une taille, un poids, être géré comme, par exemple, un stock de pièces détachées dans un dépôt…
  • Le document contient des informations.

Origine des documents

Ce volet est parfaitement connu des archivistes : des producteurs sont à l’origine de documents.

DocumentProducteur

Dans tout ce qui précède, rien n’est spécifiquement archivistique, même si la notion de producteur est une notion archivistique. Le schéma ci-dessus peut s’appliquer à tout type de document. Nous abordons maintenant des points plus spécifiques à l’archivistique.

  • Tout d’abord, les producteurs produisent dans le cadre des fonctions qu’ils exercent. Les relations entre producteurs, fonctions et documents ont été clairement représentées dans l’annexe A de la norme ISDF.
  • Ensuite, les producteurs sont des personnes (morales ou physiques) organisées (cette organisation pouvant être complexe pour les personnes morales et simple pour les personnes physiques). Les documents produits sont regroupés en ensembles supposés organisés, cette organisation reflétant celle du producteur.

DocumentProducteurFonctionOrganisation

Tout ce qui précède est relativement simple à décrire et, nous l’imaginons, à concevoir. Mais, maintenant, un autre acteur va intervenir : l’archiviste … et les choses vont commencer à se compliquer.


Share This

Partagez!