La réflexion de Louis Colombani sur la préparation de la mise en ligne des registres de recrutement militaires me donne l’occasion de partager via le blog d’Anaphore les idées et les envies des archives départementales de Vaucluse dans ce domaine.

Contrairement, peut-être, à d’autres départements dont la démarche de mise en ligne des images des registres matricules est déjà « ancienne », les archives départementales de Vaucluse ont démarré leur projet dans le cadre de l’incitation des archives de France en janvier 2013. Elles ont donc appuyé leur projet sur les recommandations nationales.
Après le début du projet vauclusien, en février 2014, ont été diffusées des recommandations pour l’indexation des images numérisées des registres de matricules militaires dans le cadre du « Grand Mémorial ».

Les données produites

Numérisation et indexation

Dans le Vaucluse, la série des registres matricules débute en 1864.

Les archives départementales de Vaucluse ont numérisé :

  •   l’ensemble des tables alphabétiques de 1865 (il n’existe pas de table pour l’année 1864) à 1940. Les images des tables de 1865 à 1938 sont consultables en salle de lecture, via l’application Pleade.
  •   les registres matricules de 1864 à 1921, les années 1887 à 1921 étant définies comme prioritaires. Ces images ne sont pas encore diffusées en ligne.

Les archives départementales ont créé une base de données nominative pour les registres matricules des hommes des classes 1887 à 1921 (nés entre 1867 et 1901). Ces registres correspondent en effet aux classes qui ont participé à la Première Guerre mondiale dont les commémorations nationales débutent cette année. La base de données contiendra à terme un total d’environ 60 000 hommes.

Structuration des données

Images

Sur la période 1887-1921, une classe compte 4 registres (plus une table alphabétique).
Ex. La classe 1887 comporte 4 registres, cotés 1 R 1189 à 1192.

Chaque registre compte 500 hommes environ et chaque homme est pourvu d’une fiche d’une page, mais cette page peut être éventuellement augmentée de « retombes », pièces de papier collées et repliées, soit, en tenant compte des « retombes » 500 à 1 000 images par registre.

RetombeExemple de retombe, repliée à gauche, dépliée à droite

 Les images sont au format jpeg et leur nommage est constitué de l’identifiant du service + cote + classe + n° de la photo.
Ex. FRAD084_01R1189_1887_0004.jpg

Les photos numériques sont regroupées par registre. Chaque répertoire d’images est désigné par l’identifiant du service + cote + classe.
Ex. FRAD084_01R1189_1887

Indexation

Les données sont constituées sous la forme d’un fichier Excel alimenté pour une part par le prestataire qui effectue la numérisation, pour une part par le service des archives départementales.
Conformément aux recommandations ministérielles de 2013, les champs retenus sont les suivants :

  • cote,
  • classe,
  • n° matricule,
  • département d’enregistrement du matricule,
  • pays d’enregistrement du matricule,
  • nom,
  • prénoms,
  • année de naissance,
  • département de naissance,
  • localité de naissance,
  • pays de naissance,
  • premier identifiant image,
  • dernier identifiant image.

Seuls trois champs proposés par les Archives de France en 2013 n’ont pas été retenus :

  • bureau de recrutement,
  • département de domiciliation lors de l’enregistrement,
  • localité de domiciliation lors de l’enregistrement.

Par rapport aux recommandations de février 2014, les champs suivants n’ont pas été indexés :

  • profession,
  • degré d’instruction générale.

Le moteur Généalogie/Grand Mémorial

Les archives départementales de Vaucluse souhaitent que leur base de données « registres matricules » soit interrogeable via le moteur de recherche du ministère de la Culture « Généalogie », et plus précisément de sa déclinaison « Grand Mémorial », qui sera capable de prendre en compte tous les champs d’indexation recommandés.
Le moteur ramène les résultats sous la forme de liens vers une notice ou une image, qui doit préalablement avoir été mise en ligne.

La procédure d’intégration débute par un questionnaire de paramétrage technique qui comporte, en annexe, le schéma d’export XML (schéma Nomina) « à respecter, autant que faire se peut ».

Deux points doivent donc être réglés :

  • la mise en ligne des notices et/ou des images des registres matricules,
  • la concordance entre le fichier Excel d’indexation et le schéma Nomina.

Mise en ligne des notices et/ou images des matricules

La solution qui a paru techniquement la plus pertinente à la Direction des services informatiques est de relier le moteur à une notice locale, elle-même reliée à une ou plusieurs images.
C’est le choix fait par les services qui ont déjà intégré Généalogie (2 à ce jour pour les matricules, l’Ain et la Mayenne).

Ci-dessous, exemple de l’Ain : recherche sur le nom Martin.
Exemple de l’Ain : recherche sur le nom Martin

Ce choix nécessite l’existence d’une application locale pour l’affichage des notices nominatives et des images liées. À ce jour, les AD de Vaucluse ne disposent pas d’un tel outil.
La société Anaphore a développé une application, dénommée « Bach », capable de prendre en compte et de mettre en ligne à la fois les données nominatives et les images.
Version de démonstration de Bach

Version de démonstration de Bach

Concordance avec le schéma Nomina

La DSI du département de Vaucluse a proposé de générer, à partir du fichier Excel, le fichier XML conforme au schéma Nomina. Afin de préparer cette transformation, les archives de Vaucluse ont modifié le fichier Excel de départ pour qu’il comporte toutes les données attendues par le schéma Nomina.
Extrait de la base de données Excel conforme au schéma Nomina

Extrait de la base de données Excel conforme au schéma Nomina

De son côté, la société Anaphore a également prévu de développer dans son progiciel Arkhéïa-Aide au classement la possibilité d’importer les données nominatives saisies dans Excel pour pouvoir restituer facilement pour les utilisateurs d’une part un fichier XML Bach, d’autre part un fichier XML Nomina (pour Généalogie/Grand Mémorial).

Le schéma suivant établit les correspondances entre le schéma conceptuel Nomina et les données créées par les archives départementales.

La base vauclusienne comprend 2 données de localisation : lieu d’enregistrement du matricule et lieu de naissance ; et 2 données date : année d’enregistrement, qui est en fait la classe d’intégration du jeune homme et année de naissance. Elle comporte également 3 compléments : l’indication de présence d’une image, le n° de matricule et la cote.
Correspondance entre la BDD des AD de Vaucluse et le schéma Nomina

Correspondance entre la BDD des AD de Vaucluse et le schéma Nomina

Le schéma Nomina attend autant de fichiers XML que de matricules (donc autant de fichiers XML que de lignes de la base de données nominative). Ceci permet le moissonnage régulier des données modifiées uniquement (au lieu de réimplanter l’ensemble de la base, y compris les données n’ayant subi aucune modification).

Attentes vis-à-vis de l’application Bach d’Anaphore

P
our la réalisation de leur projet, les besoins des archives départementales de Vaucluse sont d’un outil :

  • de mise en ligne des données nominatives
  • qui garantisse la sécurité des données nominatives qu’il contient
  • de mise en ligne des images des registres, reliées aux données nominatives, qu’il y ait une ou plusieurs images reliées à un matricule
  • qui intègre la validation d’une licence-clic pour accéder aux images par cohérence avec les autres accès aux images offerts par les archives départementales de Vaucluse
  • compatible avec l’utilisation du moteur Généalogie/Grand Mémorial. Bach doit être capable d’afficher la notice de résultat correspondant à l’interrogation formulée dans Généalogie/Grand Mémorial
  • proposant des URL pérennes pour les données reliées à Généalogie/Grand Mémorial
  • qui permette d’ajouter des données (nominatives + images) au fur et à mesure de l’avancement du projet
  • qui permette de faire des corrections et sur les données et sur les images si nécessaire (ajouts, modifications, suppressions)
  • qui permette que ces modifications soient prises en compte par Généalogie/Grand Mémorial.

Partenariat avec le Gard

Les archives départementales du Gard s’étant déjà décidées à utiliser Bach pour mettre en ligne leurs registres matricules dans quelques mois, les archives de Vaucluse ont souhaité s’associer à la démarche, afin de créer sur leur site Internet un espace complémentaire de consultation de leurs données nominatives.

Calendrier de mise en œuvre

La numérisation des registres matricules est achevée pour les classes 1887-1921 ; l’indexation en revanche est encore en cours chez le prestataire et en interne.
Toutefois, une partie des données et des images est déjà disponible. Il s’agit des images et de l’indexation correspondant aux matricules des classes 1887-1895 (registres 1 R 1189 à 1 R 1230), soit 15 900 hommes environ.

Deux temps forts sont prévus en 2014 dans le cadre de la commémoration de la guerre 14-18 : le 14 juillet et le 11 novembre.

La mise en ligne se fera de manière progressive, mais les Archives départementales de Vaucluse souhaitent pouvoir diffuser les premières données nominatives (au moins les 15 900 premiers matricules et davantage si possible) pour les célébrations du 14 juillet 2014.

Share This

Partagez!