Diffuser les descriptions archivistiques

Il ne s’agit pas de se contenter des constats précédents. Il ne s’agit pas, non plus, de prétendre régler toutes les questions complexes qui peuvent se poser. Mais il s’agit de réagir face à une forme de paresse qui consiste à laisser faire, à vouloir croire que les promesses de la techniques et surtout celles de ses vendeurs nous dispensent de réfléchir à l’élaboration de cette nouvelle culture indispensable et d’apporter, chacun, notre modeste pierre à l’édifice.

Anaphore tente, à son niveau, de le faire avec ses outils informatiques.
Les descriptions sont saisies dans le logiciel Arkhéïa Aide au classement et stockées dans un système de gestion de bases de données. Ces données descriptives peuvent ensuite être assemblées et restituées automatiquement en différents formats informatiques et selon différentes formes élaborées. Nous en sommes, en effet, arrivés à la conclusion que la restitution des descriptions au seul format XML EAD, ensuite transformé, était loin d’une solution optimale. Les descriptions archivistiques, par leur complexité mais aussi leur richesse, méritent non seulement d’être mises en valeur, mais aussi organisées et formatées en fonction de leurs destinations.
Ces destinations vont au moins dans deux directions :

  • Des descriptions archivistiques destinées à être lues directement par les humains
  • Des descriptions archivistiques destinées à être traitées par des machines.

Dans les deux cas ci-dessus, on va rencontrer plus que des variantes :

  • On ne traitera pas tout à fait de la même façon un instrument de recherche destiné à être lu sur papier et un instrument de recherche à lire sur un écran (d’ordinateur, de tablette, de téléphone).
  • Les données descriptives exploitables par un moteur de recherche interne à un site internet ne seront pas forcément organisées de la même façon que celles destinées au vaste réseau des données liées.

editorialisation 2

A. Faire renaître les instruments de recherche

On pourrait retourner la fameuse phrase de Giuseppe Tomasi di Lampedusa dans son roman Il Gattopardo (Le Guépard) : « Se vogliamo che tutto rimanga come è, bisogna che tutto cambi ! », souvent traduite, en français, « Il faut que tout change pour que rien ne change ».

Il faut donc, dans un premier temps, que rien ne change pour que tout change. À l’ère du numérique, les instruments de recherche conservent toute leur place, aussi bien en version imprimable qu’en version en ligne, pour offrir aux publics, aussi bien qu’aux archivistes, une possibilité d’appréhension à la fois globale et détaillée des fonds et collections. Malgré les critiques que nous avons reproduites précédemment, de vrais instruments de recherche conservent toute leur place et leur intérêt essentiel. Certes, leur appréhension peut demander quelques efforts de la part de ceux auxquels ils s’adressent ; efforts qui peuvent être minimisés par ceux qu’auront consentis les archivistes pour les rendre plus lisibles, plus agréables à consulter.
Les informations de contextualisation, les présentations de la méthodologie suivie, des compléments comme les glossaires, les tables de sigles éventuels… sont essentiels pour prévenir ou en tout cas limiter l’obsolescence culturelle à venir. Les bonnes vieilles introductions littérales de nos instruments de recherche, les annexes – que l’informatisation a poussé à réduire pour entrer dans le moule de la norme et surtout du format standard – doivent revenir d’actualité.

Anaphore a beaucoup travaillé, depuis un an environ, à la production automatique d’instruments de recherche mis en forme. Il s’agissait de prendre en compte l’équivalent des étapes d’édition et de publication signalées par Baptiste de Coulon. Nous parlons plutôt d’éditorialisation (suivant le terme forgé par Bruno Bachimont) puisqu’il ne s’agit pas, dans notre cas, de partir seulement d’un document rédigé (dans une étape de rédaction), mais de données descriptives saisies, que le logiciel assemble pour produire un document élaboré (des données vers un document).
Jean-Michel Salaün parle de redocumentarisation. On lira avec intérêt, par exemple, son article Pourquoi le document importe  où l’on pourrait voir comme un plaidoyer indirect en faveur de nos instruments de recherche-documents.

« Ainsi, la transformation du document par le numérique, voire son effacement au profit des données, n’est pas une évolution anodine. C’est un symptôme important de modifications de la régulation de nos sociétés, jusqu’à l’organisation de nos vies quotidiennes. Cette transformation modifie notre relation au savoir et elle marque un rapport différent à notre passé. Elle a un impact sur l’évolution de la notion d’information, sa conservation et sa transmission. »

Il fait, en effet, la distinction entre ce qu’il appelle protodocument et document : « un protodocument est une trace permettant d’interpréter un événement passé à partir d’un contrat de lecture. Un document est la représentation d’un protodocument sur un support, pour une manipulation physique facile, un transport dans l’espace et une préservation dans le temps. ».

On peut imaginer l’importance de ce travail d’éditorialisation ou redocumentarisation face à la solution de facilité qui consiste à mettre sur le web un peu n’importe quoi et, en tout cas, n’importe comment.

Notre travail a consisté, d’abord, avec les archives départementales de Vaucluse et la société Glanum, à la génération de fichiers que l’on peut directement imprimer sur son imprimante de bureau ou fournir à un imprimeur.
Ensuite, avec les mêmes partenaires, nous avons travaillé la génération d’une page HTML diffusable sur Internet. Cette page sera présentée plus en détail dans un futur post.
Dans les deux cas, il s’agissait de travailler à rendre lisible, compréhensible la complexité des instruments de recherche et à rendre ceux-ci aussi agréables que possible.
Il fallait donc, en particulier, régler au mieux la question de l’intelligibilité de la hiérarchie. Ce qui est moins difficile sur la version en ligne, en adoptant une forme s’apparentant au volumen, c’est-à-dire la possibilité de dérouler en continu l’instrument de recherche à l’écran où des filets de suite verticaux et un fil d’Ariane (en bas de la page) permettent toujours de situer le contexte.

PageHTML

B. Mais pas seulement

La critique vis-à-vis de la diffusion de données formulée par Jean-Michel Salaün, dans l’article cité, peut paraître sévère.

« Avec le nouveau millénaire, le document désormais numérique n’est plus, nous l’avons vu, qu’un ensemble de signaux dans un vaste flux. […]. Le document est aujourd’hui un ensemble de pièces éparses réagencées à la volée, une tête d’un réseau concrétisée par les liens hypertextuels, et les traces laissées par les internautes sont des outils de gestion du trafic et des stratégies des firmes. Tous ses éléments constitutifs sont bousculés et la notion de document elle-même est ébranlée.
Mieux ou pire, le Web de données, par ses capacités calculatoires, a l’ambition de reconstruire des documents à la demande, nous donnant l’illusion d’avoir toutes les réponses à nos questions avant même qu’elles ne soient posées, comme si notre futur était un destin déjà inscrit dans les machines ou comme s’il n’était que la solution d’un problème dont il suffirait de traiter les « données » par des algorithmes de plus en plus puissants. »

Il faut, nous semble-t-il, prendre cette citation comme un avertissement.
Trouver rapidement une information précise ou une série d’informations sur un sujet donné n’est pas à négliger. Simplement, on ne doit pas se contenter d’offrir des possibilités de recherche (plus ou moins – souvent moins – efficaces) mais on doit aussi offrir, suivant les termes de Baptiste de Coulon, des « supports fiables et efficaces de connaissances et d’apprentissage ». Pour cela, les compétences de l’archiviste et le sérieux du prestataire sont essentiels.
Ce serait une erreur de penser que les moteurs de recherche et autres technologies sont destinés à remplacer l’instrument de recherche document. Il faut voir ces différents outils comme complémentaires.

C. Optimiser la recherche

Si la plupart des sites internet d’archives ne brillent guère par la qualité de la restitution des descriptions, la performance de leurs moteurs de recherche n’est pas plus séduisante : souvent, en dehors des documents sériels (et encore !), on ne trouve rien ou pas grand-chose, quand ce n’est pas n’importe quoi.
On peut, là encore, nuancer avec Pleade qui intègre des fonctions de recherche efficaces, mais qui manquent de convivialité et ne correspondent pas aux attentes des publics aujourd’hui, qui ont du mal à s’y retrouver (« il faut avoir fait l’École des chartes… »).
Concernant ce sujet, on pourra se reporter au post qui présente les travaux effectués par les bibliothécaires auprès des publics et ont abouti à une nouvelle génération de moteurs. Nous aurons également l’occasion de présenter Bach, l’outil sur lequel nous avons travaillé depuis deux ans.
Mais, les performances de la recherche dépendent très étroitement, contrairement à ce que des vendeurs ont voulu faire croire, de la qualité des descriptions, et de leur indexation. C’est donc en amont, par le travail de l’archiviste et par la qualité des outils de production des instruments de recherche, que se prépare leur efficacité.
Se pose aussi la question des formats utilisés. Le format EAD est-il le meilleur pour alimenter les moteurs de recherche ? Il faudra sans doute revenir sur cette question.

D. S’échapper de nos silos d’archives

Les sites internet d’archives constituent, comme d’autres, ce que l’on nomme des silos. Les descriptions y sont stockées en profondeur et pas très visibles sur le web. Par exemple, en schématisant, pour trouver quelque chose, on doit savoir où on doit chercher, dans quel « silo de données ». À l’inverse, quand nous faisons une recherche sur un moteur grand public, nous ne savons pas sur quel site vont se trouver les réponses à nos interrogations. La solution n’est pas dans le référencement auprès de ces moteurs grand public : pour les descriptions d’archives, il est souvent mauvais.
D’autre part, les descriptions de documents d’archives et des acteurs qui y sont liés ne sont pas sans relation avec d’autres données, soit dans d’autres institutions patrimoniales (autres services d’archives, bibliothèques, musées…) soit dans des outils grand public (Wikipédia…).
Face à ces constats, les portails (thématiques, régionaux…) ne constituent que des solutions partielles : ils étendent un périmètre de recherche, mais restent des silos, seulement un peu plus larges.

Ici on doit aborder très rapidement la question du web des données, des données liées.
On a vu que les instruments de recherche nous paraissent un moyen de restitution essentiel pour les descriptions d’archives. Sont-ils pour autant le seul moyen possible ? On en revient à la question des documents et des données (correspondant en gros au document comme trace et document comme source, repris par Baptiste de Coulon de Marie-Anne ChabinChabin, Marie-Anne, 2004, Document trace et document source. La technologie numérique change-t-elle la notion de document ? in Information – Interaction – Intelligence, vol 4, no 1, p. 141-158.) et à la remarque (que nous avons citée dans la première partie de ce post) d’Eric Lease Morgan.
Comme les bibliothécaires sont déjà bien engagés à le faire, les archivistes devront, eux aussi, inscrire leurs descriptions dans le réseau des données liées.
Anaphore s’est déjà bien préparée à cette évolution et Thomas Francart a présenté le travail fait sur une ontologie.
Travailler sur une ontologie pour les archives, alors que d’autres l’ont déjà fait et que le Conseil international des archives (CIA) s’y est attelé, peut paraître prétentieux de la part d’une société comme Anaphore. Mais, d’une part les travaux déjà conduits sont souvent partis sur des fondations fragiles (convertir des documents EAD en RDF alors qu’il est nécessaire de commencer par un modèle conceptuel, comme le fait le CIA), d’autre part notre responsabilité vis-à-vis de nos utilisateurs est de nous préparer dès à présent à ces évolutions, de manière à assurer une transition, au moins sans douleur si ce n’est en douceur. Anaphore peut d’autant mieux anticiper et préparer ces évolutions qu’elle fait de la veille depuis longtemps et que ses outils n’ont pas confondu format d’échange et format de stockage des données et ne sont donc pas prisonniers d’une syntaxe présentant des limites importantes et promise à une prochaine obsolescence.

En conclusion, forcément provisoire

Comme souvent, les nouvelles technologies ont pu être présentées comme solution miracle qu’on est obligé de vénérer, sauf à vouloir passer pour rétrograde. Se met alors en place une nouvelle forme de pensée magique. N’a-t-on pas lu que le logiciel Machin apportait « un vrai bonheur » !
Les nouveaux mages ont tout intérêt à vendre la croyance que leur outil va faire le travail à notre place. C’est, bien entendu, une illusion totale et, après les illusions, viennent les désillusions. Entre les deux, on a gaspillé beaucoup de temps, d’énergie et d’argent.

Prendre de la hauteur, réfléchir à un modèle conceptuel – c’est-à-dire aux relations qui existent entre des entités que nous manipulons (ressources archivistiques ; agents comme producteurs, gestionnaires, sujets de ces ressources ; lieux, événements, concepts… comme sujet également ; etc.) et à la manière de formaliser ces relations – est une façon, pour les archivistes, de faire face à une urgence : celle de se réapproprier l’essence de leur travail que les évolutions récentes ont eu tendance à abandonner aux techniques et aux techniciens.
Travailler sur la qualité des descriptions, sur leur indexation, sur la lisibilité des instruments de recherche, sur l’usabilité ou l’ergonomie des moteurs de recherche et des sites internet ne nécessite aucune maitrise du code informatique. Et, il faut se souvenir que les informaticiens, que ceux qui produisent des sites internet sont généralement très loin de détenir ces compétences.

Cela a sans doute été une grave erreur de réfléchir insuffisamment à ces questions, de laisser trop de pouvoir aux techniciens et aux commerciaux car, comme le dit encore Jean-Michel Salaün dans les dernières lignes de son article, avec lesquelles nous terminerons :

« Ces changements ne sont évidemment pas une simple conséquence de choix techniques, ils accompagnent des évolutions sociales et sémantiques profondes. Ils mériteraient une meilleure discussion collective, une méditation sociétale pourrait-on dire, où les sciences humaines et sociales, en particulier les sciences de l’information, ont un rôle spécifique à jouer. ».

 

Share This

Partagez!