On trouvera une présentation détaillée du portail européen des archives dans un article en langue anglaise de Karin Bredenberg et Silke Jagodzinski : Archives Portal Europe – A Challenge of Harmonisation and Outreach
Philosophie du projet
« Les archives sont la mémoire des sociétés, mais aussi leur chambre au trésor, qui peut améliorer la qualité de vie de tout citoyen, que ce soit au niveau personnel ou au niveau de la société. Le but principal du projet APEnet est de donner aux citoyens européens, aux autorités publiques et aux sociétés privées un portail commun, qui leur permettra de trouver les documents d’archives qui les concernent, qu’ils vivent ou non dans l’Union. […] Pour la première fois, les archives seront facilement accessibles aux citoyens européens à partir d’un point d’entrée unique, ce qui doit permettre au public de mieux comprendre l’histoire et la culture européennes. » Dans à propos d’APEnet.
Selon la version anglaise About APEnet du même (non traduit dans la version française), il s’agit de mettre en place un catalogue virtuel, en plusieurs langues, qui fasse tomber les dernières barrières limitant l’accès aux précieuses ressources conservées dans les services d’archives européens. La citation ci-dessous, reproduite dans Le portail européen des archives in les-infostrateges.com, 27 mars 2012, est attribuée aux « porteurs du projet » :
« Les frontières entre les pays européens ont souvent changé au cours de l’histoire. Les États ont fusionné et se sont séparés ; cette histoire mouvante forme un terreau commun, autant qu’il fonde les différences dans les évolutions. C’est cette tension entre leur histoire commune et leur diversité qui rend leurs histoires respectives encore plus intéressantes. En rassemblant des documents d’archives qui ont été créés au long de ces évolutions historiques et politiques, le portail européen des archives entend permettre la comparaison entre les évolutions nationales et régionales ainsi que la compréhension de leur spécificité, tout en les plaçant dans le contexte plus large de l’Europe. »
Acteurs et grandes étapes du projet
Aux origines du projet
Le projet lui-même est découpé en trois grandes étapes dont il est facile de retrouver la trace et que nous présentons ci-dessous. Mais se pose la question de ce qui a fécondé ce projetNous avons dû recourir à l’expertise et à la mémoire de Lucile Grand, actrice de premier plan du projet pour avoir accès à cette origine..
Le journal officiel de l’Union européenne souligne, en mai 2003, l’importance des archives pour la compréhension de l’histoire et de la culture de l’Europe et pour un fonctionnement démocratique de la société. Il propose la constitution d’un groupe d’experts : Council Resolution of 6 May 2003 on archives in the Member States.
Un rapport publié en 2005 par la Commission européenne marque le point de départ du projet : Report on archives in the enlarged European Union Increased archival cooperation in Europe: action plan / Elaborated by the National Experts Group on Archives of the EU Member States and EU institutions and organs at the request of the Council of the European Union. – European Communities, 2005. La question des instruments de recherche, de leur diffusion en ligne, des standards… est largement abordée dans ce rapport au sein de la seconde partie Access to archives: institutional, technical and professional aspects et un chapitre est spécifiquement consacré à la question d’un portail : 2d Internet Gateway to documents and archives in Europe and European networking projects (p. 81). Ces grandes lignes étant tracées, il restait à constituer une équipe et trouver les financements, ce qui a conduit de 2005 à 2008.
APEnet project
Archives Portal Europe network : Réseau Portail européen des archives
Projet soutenu par la Commission européenne, au sein du programme eContentplus.
15 janvier 2009-15 janvier 2012
17 services nationaux d’archives
Une première version du portail est mise en ligne le 1er janvier 2012.
Le site APEnet est toujours en ligne.
APEx project
Archives Portal Europe network of excellence
Projet soutenu par la Commission européenne, cette fois au sein du programme ICT PSP
1er mars 2012 et initialement prévu pour se terminer au 1er mars 2015, prolongé jusqu’au 30 septembre 2015
Plus de services nationaux d’archives et ouverture aux services d’archives régionaux et locaux, 85 services d’archives en 2013.
Une nouvelle version du portail est mise en ligne le 17 janvier 2013.
Le site APEx.
APE-F
Archives Portal Europe Foundation : Fondation pour le Portail européen des archives
Septembre 2015, à l’occasion de la deuxième conférence internationale du portail européen des archives, à Budapest, du 7 au 9 septembre 2015.
Contenu du portail
Le portail donne accès à trois types d’informations :
- Des descriptions de ressources archivistiques, à partir d’instruments de recherche conformes à la norme ISAD (G) et encodés au format XML-EAD.
- Des informations sur les producteurs de ces archives, à partir de notices conformes à la norme ISAAR (CPF) et encodées au format XML-EAC.
- Des informations sur les services gestionnaires de ces archives, à partir de notices conformes à la norme ISDIAH et encodées au format XML-EAG 2012
Les ressources archivistiques constituent, en nombre de descriptions disponibles et en nombre de recherches de la part des internautes, le contenu principal du portail.
Les notices de présentation des institutions sont accessibles à partir d’un annuaire et par le moteur de recherche (cf. ci-dessous).
Les notices des institutions françaises ne sont pas détaillées. On pourra regarder celle de la Fondation Maisons des sciences de l’homme qui fait figure d’exception.
La recherche et l’accès aux descriptions
Le moteur de recherche
Il ne s’agit pas, ici, de présenter en détail le fonctionnement du portail, mais d’en donner un simple aperçu. Sur la page d’accueil est présente une zone de saisie pour les recherches :
On trouve également un onglet « Recherche avancée » qui donne accès à une nouvelle page.
Cette nouvelle page propose trois onglets « Archives et inventaires », « Personnes et collectivités » et « Institutions » qui correspondent aux trois types d’informations signalées ci-dessus.
Les recherches concernent l’ensemble de ces trois domaines et les onglets permettent de sélectionner un domaine :
Ce moteur intègre les caractéristiques des moteurs de troisième génération déjà présentées sur ce blog : modèle vectoriel, suggestions en cours de frappe, affinement des requêtes par facettes…
Exploration et navigation
Les réponses à une requête peuvent être présentées « Par pertinence » ou « Par cadre de classement », quand il s’agit d’inventaires, la première solution étant nettement la plus pratique et elle est d’ailleurs paramétrée par défaut.
De plus, il est possible de faire apparaître, en vis-à-vis de la réponse sélectionnée, un aperçu de la description.
Il est enfin possible d’accéder à l’inventaire ou la partie d’inventaire correspondant grâce au bouton en bas à droite « Voir l’inventaire » ou, tout simplement, en double-cliquant sur la réponse.
Le portail fonctionne donc comme un moteur de recherche, tout en permettant d’explorer les instruments de recherche en fonction de leur organisation hiérarchique.
L’inventaire se présente ensuite de manière classique.
On peut noter la présence d’une zone de recherche au-dessus de l’inventaire, mais celle-ci sert à relancer une nouvelle recherche alors que l’on aurait pu s’attendre à une recherche dans l’inventaire affiché.
L’accès aux documents numériques
Quand des documents numériques (images, sons…) sont liés à des descriptions, le portail européen permet d’y accéder.
Par exemple, pour une image, une vignette légendée pourra apparaître dans une description.
Et un clic sur la vignette permettra de visionner l’image sur le site d’origine, soit dans une visionneuse, soit dans l’instrument de recherche ou sous toute autre forme choisie par le service.
Il faut noter que le portail européen ne stocke pas les fichiers numériques, y compris pour les vignettes, qui s’affichent depuis le site de l’institution. Les liens depuis les descriptions renvoient sur le site de l’institution où sont stockés les fichiers.
Les formats pris en compte par le portail
Nous revenons brièvement sur cette question qui a été simplement évoquée ci-dessus à propos des contenus du portail.
Un projet du type portail européen des archives se heurte à la question des formats. Un tel projet doit, bien entendu, s’appuyer sur des formats standard, communs à l’ensemble des institutions susceptibles de publier des métadonnées.
On se heurte là à deux types de problèmes :
- Les formats standard, et particulièrement EAD, permettent des utilisations très variées par la combinaison d’éléments et d’attributs XML et sont donc utilisés de façon très sensiblement différentes dans les différents pays (et même à l’intérieur d’un même pays).
- Contrairement à ce que nous pensions, chez Anaphore, il s’avère que ces formats standard sont encore relativement peu utilisés, en tout cas en France.
- L’EAG n’est pas du tout utilisé
- L’EAC reste très peu utilisé
- L’EAD lui-même est encore minoritaire, de nombreux services d’archives disposant de la plupart de leurs instruments de recherche en formats image, fichiers bureautiques et pdf.
Il n’est pas du pouvoir du projet de portail européen de résoudre le second problème, mais il était indispensable de prendre en compte le premier.
Dans le cadre du projet de portail, des formats transnationaux, qui correspondent à des profils des formats standard ci-dessus, ont été définis. Nous les citons simplement et renvoyant au site du portail européen (version anglaise) pour plus de détails.
- Pour les descriptions archivistiques, le format apeEAD
- Pour la description des producteurs d’archives, le format apeEAC-CPF
- Pour la description des institutions d’archives, EAG 2012 spécialement développé au sein du projet APEx en utilisant comme base de départ (fortement remaniée) le format EAG (Encoded Archival Guide), développé dans le cadre du Guide des archives d’Espagne et des pays d’Amérique latine – Censo Guía de Archivos de España e Iberoamerica – par le ministère de la Culture espagnol.
Nous préciserons seulement que, pour permettre une compatibilité entre les instruments de recherche provenant de différentes institutions de différents pays, la publication dans le portail européen nécessite un respect strict des formats dont apeEADÀ l’inverse, les moteurs de recherche utilisés en France sont beaucoup plus tolérants : un fichier XML bien formé, même ne respectant pas strictement la syntaxe de la DTD ou du schéma EAD 2002 pourra être publié..
Des outils complémentaires
Dans le cadre du projet de portail européen des archives, outre de la documentation, des outils complémentaires sont mis à disposition des services d’archives. Ces outils sont téléchargeables sur le site du projet APEx, distinct du site du portail lui-même, à l’onglet Outcomes, Tools and manuals.
Nous dirons un mot sur l’outil de préparation des données Local Data Preparation Tool, dont nous recommandons vivement l’utilisation aux e-archivistes.
Cet outil est facile à installer (il nécessite la présence de Java sur votre ordinateur, mais c’est généralement le cas par défaut) et à utiliser.
Il a plusieurs fonctions :
- Vérification de la validité de vos fichiers selon les formats correspondants (apeEAD, schéma EAD 2002, DTD EAD 2002, apeEAC-CPF…)
- Conversion, par exemple, de fichiers EAD 2002 en fichiers apeEAD
- Saisie de fiches ISDIAH et restitution au format EAG 2012
- Saisie de fiches ISAAR et restitution au format apeEAC-CPF
- Comptabilisation de l’indexation
- Ajout de règles personnalisées pour normaliser les dates textes.
Ces différentes fonctions peuvent être très utiles.
Nous verrons qu’avec Arkhéïa Aide au classement, nous n’avons pas besoin d’utiliser la fonction de conversion des fichiers EAD.
La présence des institutions françaises dans le portail européen
Il faut constater qu’elle reste, à ce jourAoût 2015., très modeste. Une très grande partie des « inventaires » des archives des collectivités territoriales françaises sont en fait des fiches de présentation des fonds privés mises en ligne par le SIAF (à partir de fiches BORA) et non par les services eux-mêmes. Seulement un tout petit nombre de départements (les Alpes-Maritimes, le Cantal, la Manche, les Yvelines), les Archives nationales et le SIAF ont mis vraiment des instruments de recherche en ligne.
On peut s’interroger sur les raisons de la très faible présence des institutions françaises dans le portail européen. Des explications plus ou moins pertinentes nous ont été données.
- Les services doivent signer une convention, qui plus est en anglais, ce qui peut être une démarche un peu longue (par exemple dans un département, il faut souvent remonter jusqu’au président de l’exécutif), mais n’est pas un obstacle insurmontable.
- Cela représente un travail supplémentaire pour les archivistes qui croulent déjà sous la tâche. On m’a parlé de la nécessité de passer un marché avec un prestataire pour faire convertir les instruments de recherche au format apeEAD, avec tout le travail de rédaction du cahier de charges, analyse des réponses, suivi du travail du prestataire… En réalité, il n’est pas du tout indispensable de recourir à un prestataire.
- Peu d’archivistes maîtrisent suffisamment l’EAD dans les services.
- L’attente du nouveau format EAD3, enfin adopté officiellement en août 2015, et les interrogations induites sur l’évolution du schéma apeEAD ont pu également constituer un frein.
- Les responsables du projet, en France, ont beaucoup travaillé sur les aspects techniques et autres, mais n’ont pas eu le temps de communiquer suffisamment.
- Surtout, les instruments de recherche normalisés et disponibles dans un format standard sont en réalité trop peu nombreux !
Quelles qu’en soient les raisons, cette relative absence du réseau français des archives dans le portail européen est regrettable et il est souhaitable d’y remédier.
Il faut ajouter qu’il est prévu que le futur portail national interministériel des archives (PNIA) s’appuie sur les mêmes formats que ceux utilisés pour le portail européen.
Le travail réalisé en vue de l’intégration des instruments de recherche dans le portail européen sera directement réutilisable pour le portail national.
L’implication d’Anaphore
Anaphore a joué un rôle majeur dans la diffusion des normes et formats standard pour la description archivistique depuis de nombreuses années. Les utilisateurs d’Arkhéïa Aide au classement produisent des instruments de recherche au format EAD 2002 depuis que celui-ci est disponible.
Nous avions donc une vision déformée de la réalité, pensant que ce format était très largement répandu, d’autant qu’il s’agit d’une demande incontournable dans tous les cahiers des charges d’informatisation de services d’archives. Nous avons donc découvert récemment, par des témoignages provenant du SIAF et d’un consultant exerçant sérieusement dans le domaine des archives, que la réalité est tout autre.
Anaphore s’est engagée dans la restitution des instruments de recherche sur différents supports et suivant différents formats et reçoit d’ailleurs une aide du ministère de la Culture et de la Communication pour ce travail.
Anaphore a donc travaillé à la génération des instruments de recherche directement au format apeEAD, mais également sur deux chantiers complémentaires importants.
La restitution des instruments de recherche au format apeEAD
Il était tout naturel qu’Anaphore aide ses utilisateurs en facilitant grandement la publication de leurs instruments de recherche dans le portail archivistique européen en intégrant, dans ses outils, le format apeEAD.
Un important travail a donc été réalisé. Il a été possible grâce à des échanges extrêmement fructueux avec les responsables français du projet au SIAF, Lucile Grand, conservatrice en chef du patrimoine et Yoann Moranville, informaticien, développeur spécifiquement engagé pour travailler sur le portail européen des archives, et l’implication de Julien Pomart, archiviste à la Fondation Maison des sciences de l’homme, qui a fourni des instruments de recherche prêts à la publication et procédé à tous les tests nécessaires.
Sans rentrer dans les détails techniques, voici quelques grandes lignes de ce chantier, qui a nécessité plusieurs mois de développements et mises au point.
- Les tests de conversion EAD 2002 issus d’Arkhéïa Aide au classement vers apeEAD ont été positifs. Mais, compte tenu de la variété et de la richesse de l’encodage d’Arkhéïa, la conversion entraînait un appauvrissement non négligeable. Un nouvel encodage à partir des données saisies dans Arkhéïa permettait, au contraire, de prendre en compte, en amont, un grand nombre des subtilités présentes dans les bases de données Arkhéïa. De plus, le fait de produire directement et automatiquement au format apeEAD allège nettement le travail des archivistes et va donc les encourager à publier dans le portail européen.
- Il a fallu étudier le format apeEAD, ses contraintes, ses différences par rapport à EAD 2002.
- Le gros du travail a consisté à développer le code permettant la génération de fichiers apeEAD, sensiblement différent de celui pour EAD 2002.
- De très nombreux tests ont été effectués sur plusieurs centaines d’instruments de recherche très différents fournis par les partenairesArchives départementale de Vaucluse, de Tarn-et-Garonne, archives municipales de Tours, archives de la fondation MSH (qui ont, depuis, signé la convention avec le portail européen). initiaux d’Anaphore dans le cadre du projet 2014 Services numériques culturels innovants . Ces instruments de recherche devaient être aussi variés que possible par leur taille, leur précision et leur complexité, ainsi que par les types de documents décrits…
- Des points particuliers ont dû être pris en compte. Par exemple, pour la question que nous avons évoquée de la visualisation des images quand on produit un fichier EAD 2002, le lien est interne au site du service d’archives alors que, lorsqu’on génère un fichier apeEAD, les liens sont externes. Les deux syntaxes, totalement différentes, doivent être générées automatiquement, sans nécessiter l’intervention des archivistes.
- Compte tenu de la rigueur des contrôles de validité dans le portail européen, nous avons ajouté des contrôles supplémentaires à l’intérieur d’Arkhéïa Aide au classement.
- Il était également important d’anticiper les futures évolutions qu’EAD3 pourra apporter.
- Le SIAF avait proposé l’aide de Yoann Moranville aux différents éditeurs de logiciels pour archives, compte tenu des difficultés que ceux-ci rencontrent (en particulier pour mettre au point leur entrepôt OAI). Anaphore a, bien entendu, accepté cette offre et nous avons pu organiser un atelier avec des représentants de services d’archives départementalesGard, Tarn-et-Garonne, Vaucluse. animé par Yoann Moranville, puis travailler avec ce dernier.
- D’autres services d’archives départementales et municipales sont également partants pour s’impliquer dans le projet de portail européen. Nous leur fournissons les outils et les conseils pour leur faciliter la démarche.
La prise en compte du format EAG 2012
Arkhéïa Aide au classement intégrait déjà une interface de saisie de la fiche ISDIAH servant à décrire les services d’archives. Nous avons pu constater que les notices présentant les services français d’archives dans l’annuaire du portail européen sont très peu détaillées. Et, d’une façon générale, les services d’archives ne produisent pas leur fiche ISDIAH.
L’annuaire du portail européen des archives s’appuie sur les notices rédigées par les services d’archives suivant la norme ISDIAH et restitués suivant le format XML EAG 2012 (Encoded Archival Guide). Ces notices peuvent par ailleurs être utilisées ailleurs que dans le portail européen.
Il était donc logique qu’Anaphore fournisse un outil complet de gestion de ces notices. L’interface de saisie initiale a été considérablement enrichie pour prendre en compte la richesse du format EAG 2012 et un export automatique à ce format EAG 2012 est maintenant disponible.
Arkhéïa Aide au classement propose également un export simple au format html afin de faciliter les contrôles.
Enfin, un autre format, destiné à l’encyclopédie en ligne Wikipédia, est en cours d’élaboration.
Un service de gestion d’entrepôt OAI-PMH
Anaphore a développé un service d’alimentation d’entrepôt OAI-PMH pour un moissonnage automatique par le portail européen, mais aussi d’autres portails. Cet outil et le service associé sont présentés en détail dans un autre article.