Et l’archiviste ?

Un rôle double

L’archiviste a généralement un double rôle. Il assure la gestion :

  1. matérielle des documents-objets
  2. intellectuelle des informations consignées dans ces documents.

Il doit, en effet, assurer la conservation –  à long terme et dans les meilleures conditions – des documents et, en même temps, faciliter, pour différents publics, l’accès aux informations recherchées.

DocumentArchiviste

Dans ce qui suit, nous allons nous intéresser au traitement de l’information et laisserons donc de côté la gestion matérielle des documents.

Produire des descriptions

L’archiviste produit des descriptions, qui vont servir d’intermédiaire entre les publics, que nous évoquerons plus loin, et les informations consignées dans les documents.

ArchivisteDocument

En réalité, ces descriptions présentent différents volets, que nous ne détaillerons pas tous, mais que nous pourrons regrouper en plusieurs catégories.

Propriétés générales

  • Propriétés d’identification, comme la cote (ou autres identifiants) et l’intitulé.
  • Propriété d’origine, comme la précision du producteur, les modalités d’entrée…
  • Propriétés de gestion, comme la précision des gestionnaires, les traitements qu’ils ont effectués

Propriétés matérielles

  • Original ou copie
  • Type matériel ou numérique
  • Nature de support
  • Importance matérielle et propriétés du support

Propriétés de l’information contenue

  • Propriétés liées à l’organisation, comme hiérarchie, ordre, complémentarité
  • Dates des informations
  • Description littérale du contenu
  • Sujets concernés (personnes, lieux, événements, concepts, objets, autres documents…)

Propriétés liées aux possibilités d’accès et d’utilisation du document

Documents en relation

  • Sources complémentaires
  • Bibliographie

Le graphe ci-dessous schématise les différents rôles des descriptions produites par l’archiviste.

Description

Quelle forme peuvent prendre les descriptions ?

On rejoint ici la question déjà abordée : données et documents, plus précisément métadonnées et méta-documents. Schématiquement, on peut signaler les modes suivants :

  • L’instrument de recherche, document qui regroupe, de manière organisée hiérarchiquement, des notices descriptives. Il reflète l’organisation des ressources archivistiques et de leurs producteurs, donne une vue globale sur un ensemble de documents en relation d’origine et permet de partir à leur découverte. Il n’est pas très efficace pour une réponse précise à une question précise. Mode document.
  • La base de données documentaire s’est répandue dans les années 1980. Elle permettait d’offrir des réponses précises à des questions précises (à condition, toutefois, que les éléments de réponse se trouvent dans les descriptions). Elle ne permettait pas de rendre compte de l’organisation d’un ensemble de documents et, de ce fait, sacrifiait largement la notion de contexte de production qui est un des fondamentaux de l’archivistique. Mode données.
  • Le document XML (EAD) qui consiste en une restitution, suivant un format informatique, des instruments de recherche. Ce format, apparu au tournant des XXe et XXIe siècles, a permis l’émergence en France (d’ailleurs à l’initiative et sous l’impulsion d’Anaphore) de moteurs de recherche spécifiques aux archives. Ceux-ci proposaient une synthèse entre les possibilités de recherche (comme pour les logiciels documentaires ci-dessus) et l’affichage structuré hiérarchiquement des instruments de recherche. Mode document, mais les moteurs de recherche comme Pleade procédaient à un découpage du fichier XML en données pour l’interrogation.
  • La collection de données, plus exactement métadonnées descriptives, en mode graphe, suivant un modèle conceptuel et de triplets RDF qui permet de prendre en compte les différents types de relations pouvant exister entre entités, dont les relations hiérarchiques, mais aussi horizontales… Il s’agit d’un mode données et plus particulièrement adapté pour une réutilisation et des traitements automatiques par des machines.

Produire des notices d’autorité

La production de métadonnées descriptives concernant les documents est une des tâches essentielles de l’archiviste. Mais, pour autant, son travail ne s’y limite pas. L’archiviste peut être amené à produire des notices d’autorité.

NoticeAutorite

Une norme (ISAAR) et un format (EAC) ont été prévus pour des notices d’autorité sur les collectivités, personnes et familles (CPF) qui produisent les documents. On peut alors parler de notices d’autorité de contexte de production.

Mais, il arrive aussi que les services d’archives produisent des notices d’autorité, parfois regroupées en dictionnaires, décrivant les sujets des documents : notices et dictionnaires biographiques, topographiques… On peut alors parler de notices d’autorité de contenu des documents.

En complément des descriptions des ressources archivistiques, les archivistes produisent donc également ce que l’on nomme des notices d’autorité sur des entités de contexte de production (producteurs) est des entités de contexte de contenu (sujets) des ressources archivistiques.

NoticeProducteurSujet

Extraire des données

Nous avons évoqué le fait que les documents peuvent contenir des informations textuelles, non structurées, mais aussi des informations structurées. À partir de ces informations structurées, il est possible d’extraire des données.

On nous explique qu’aujourd’hui, la valeur se trouve dans les données. Pour un public majoritaire des services d’archives, les généalogistes, cet état de fait est bien antérieur au développement du big data. Des individus, des associations, des entreprises travaillent sur des documents d’archives pour en extraire des données sur des personnes, ceci depuis plusieurs décennies. Les Archives de France, puis le ministère de la Culture et de la Communication, ainsi que les services d’archives des collectivités territoriales, procèdent également à des extractions puis mise à disposition de données concernant des individus.

Peut-être, dans l’avenir, des données d’autres types pourront également être extraites pour d’autres usages ?

ExtraireDonnees

Synthèse

Dans ce qui précède, nous avons essayé de schématiser les traitements intellectuels effectués par les archivistes sur des documents. Schémas qui tentent, au moins en partie, de répondre aux questions :

  • Quelles sont la nature et les composantes du document ?
  • Quelles sont ses origines ?
  • Quels sont les outils que l’archiviste peut mettre à disposition de ses divers publics qui ont besoin d’accéder aux informations contenues dans les documents ?

Nous récapitulons ces différents points dans un schéma unique, nécessairement plus complexe.

DocuemntArchivisteDescriptionDonnees

On pourra noter que l’archiviste/le service d’archives produit des notices d’autorité, mais qu’une notice d’autorité peut également décrire l’archiviste/le service d’archives.

Les publics

Le dernier acteur, dans cette histoire, est le public – nous avons l’habitude de dire les publics, car ils sont variés.

Ces publics sont principalement à la recherche d’informations et de données.

  • Naguère, ces publics devaient se rendre dans les salles de lecture pour consulter des documents afin d’y relever des informations qui les intéressent. Cela reste largement vrai aujourd’hui pour la plupart des documents, mais pas forcément pour la plupart des consultations (qui sont le fait de généalogistes).
  • Depuis quelques années, des documents ont été numérisés en masse, prioritairement et principalement ceux qui intéressent les généalogistes. Ces derniers peuvent donc consulter des substituts numériques de ces documents sans se déplacer.
  • Enfin, pour un nombre encore plus restreint de cas, des informations peuvent être disponibles, sous forme de notices d’autorité ou sous forme de données extraites.

Les différentes métadonnées descriptives produites par les archivistes servent de médiateur entre les informations consignées dans les documents et les publics. Elles permettent, suivant les cas, d’accéder à la cote des documents à consulter en salle de lecture ou aux substituts numériques en ligne de ces documents, voire aux documents nativement numériques.

Quand des données sont extraites, soit elles offrent toutes les informations nécessaires, soit elles permettent de bénéficier d’un repérage beaucoup plus précis pour accéder au document numérique (cas, d’actualité, des dépouillements de registres matricules militaires).

Public

Remarque

Ce qui précède constitue un modèle fonctionnel plutôt qu’un modèle conceptuel.

Les trois acteurs principaux introduits dans les schémas précédents – les producteurs, les archivistes et les publics – ne constituent pas des catégories étanches. En effet, une même personne peut tenir plus d’un rôle. Par exemple :

  • Les services d’archives gèrent des documents, mais en produisent également et font aussi des recherches.
  • Les producteurs peuvent gérer, au moins temporairement, leurs archives et, bien entendu, font également des recherches.
  • Les publics produisent également, comme tout un chacun, des archives et les gèrent (plus ou moins bien) et ils peuvent extraire des données des documents…

Dans un modèle conceptuel, on regroupera ces trois entités dans une classe unique d’agents.

Share This

Partagez!