Ce billet aurait pu être publié le 27 septembre 2012, lorsque Jordi Navarro et moi avons diffusé des datavisualisations réalisées à partir des rapports annuels du Service interministériel des Archives de France. En 2012, data.gouv.fr soufflait sa première bougie ; les toutes premières collectivités territoriales ouvraient un portail open data et les services d'archives ferraillaient contre Généalogie.com (devenu NotreFamille.com, puis Filae) avec comme épée de bois les licences de réutilisation.

A l'origine des datavisualisations que nous avions diffusé, il y avait une source : les statistiques annuelles des services d'archives publiques en France, compilées et diffusées par le Service interministériel des Archives de France sous la forme d'énormes tableaux au format PDF avec plein de données fort intéressantes, parfois très hétérogènes, sous-exploitées, et dont le remplissage hérissait les services d'archives... Nous avions un objectif : plutôt que discuter théorie, nous étions convaincus que la meilleure façon de montrer ce qu'était l'open data et à quoi ça pouvait servir dans notre secteur professionnel, c'était de montrer ce qu'on pouvait faire avec des données archivistiques en terme de visualisation. C'était également le but du datasprint lors du forum de l'AAF en 2016 : expérimenter et donner à voir pour avancer et convaincre par l'exemple.

Les messages annonçant ces visualisations de 2012 ont disparu corps et biens avec les Yahoo groups ; quelques tweets sont encore en ligne (pour combien de temps ?). Mais l'essentiel, à savoir les visualisations, est toujours en ligne sur Tableau public ! Exhumation ci-dessous, avec les datavisualisations concernant les services d'archives départementales, suivies de celles des archives communales et intercommunales.

 

 

siaf 2011 archives departementales

Statistiques Archives départementales

 

 

siaf 2011 archives municipales

Statistiques Archives communales et intercommunales

 

Retour vers le futur, onze ans après (j'ai raté l'anniversaire des 10 ans).

Les rapports statistiques annuels postérieurs à 2010 sont désormais accessibles sur France Archives aux formats PDF et XLS, tandis que les données postérieures à 2019 sont accessibles en open data sur la plateforme data.culture.

 

 

En faisant un peu d'archéologie dans la collection des rapports annuels (PDF OCRisés) disponibles sur France Archives, j'ai pu reconstituer des données sur une plage temporelle plus étendue pour :

  • le nombre d'employés en ETP (équivalent temps plein). Les données étant parfois séparées entre fonction publique d'Etat et fonction publique territoriale, j'ai eu l'occasion de faire pour la première fois une addition dans OpenRefine (c'est d'une simplicité à pleurer... il suffit de compiler deux colonnes numériques avec un + au milieu) ;
  • le volume d'archives conservé ;
  • le nombre de visiteurs par an : il s'agit bien du nombre de lecteurs, tels qu'ils figurent depuis des décennies d'après les rapports annuels (et non un chiffre parfois cumulé aujourd'hui dans les chiffres-clés des institutions, qui mêle expositions et lecteurs IRL).

 

Je suis remontée jusqu'en 1975 (données qui figurent dans le rapport de 1976), afin d'avoir des chiffres juste avant la loi de communicabilité sur les archives de 1979. Avant 1975, les chiffres couvrent des années scolaires et non civiles, j'ai donc choisi de m'en tenir à 1975. Les années suivantes ont été relevées : 1980, 1990, 2000, 2010, 2019 à 2022 (données de data.culture).

Le tout a été injecté dans Wikidata, ce qui permet de faire quelques requêtes...

 

Volume d'archives conservé par les archives départementales en 2022 (en mètre linéaire et ordre décroissant) (lien vers la requête)

 

 

 

Nombre d'employés des services d'archives départementales (en ETP et ordre décroissant) (lien vers la requête)

 

 

Fréquentation des services d'archives départementales en 2019 (avant Covid) (nombre de visiteurs, par ordre décroissant) (lien vers la requête)

 

 

Fréquentation des services d'archives départementales en 2022 (nombre de visiteurs, par ordre décroissant) (lien vers la requête)

 

 

Voici ce que ça donne pour un service d'archives départementales précis, avec les données de la Haute-Garonne intégralement reconstituées depuis 1975 par Jordi Navarro :

 

 

Volume d'archives conservé (en mètre linéaire) dans les services d'archives départementales en Bretagne depuis 1975 (lien vers la requête)
 

 

Evolution du nombre d'employés (ETP) dans les services d'archives départementales en Bretagne (lien vers la requête)

 

 

Fréquentation des archives départementales en Bretagne (22, 29, 35, 44, 56) (lien vers la requête)

* à noter une longue période de fermeture pour travaux de la salle de lecture des AD22.

 

Dans les services d'archives, il n'y a pas le bug mais le boum (généalogique) de l'an 2000... juste avant que les portails d'archives numérisées arrivent, faisant baisser la fréquentation physique puisque les sources ultra-consultées (état civil surtout) étaient désormais consultables à distance.

Des chiffres de visiteurs en ligne des portails numériques figurent dans les rapports annuels depuis les années 2000. Ils n'ont (pour l'instant du moins) pas été ajoutés à Wikidata, notamment car ils n'ont pas leur place sur les éléments "archives départementales de X". Il serait plus judicieux de créer autant d'éléments "portail d'archives des archives départementales de X" (exemple Q635985) que de services d'archives, avec les déclarations qui vont bien. Quitte à faire les choses en masse, il faudrait les faire correctement dès le début, par exemple en partant à la pêche des dates de création des sites web (pas si facile à trouver selon les cas !)... Cependant, ces chiffres de fréquentation en ligne, quand ils existent et sont correctement renseignés (sans mélanger visiteurs / visiteurs uniques / sessions / etc.), sont très dépendants des outils utilisés pour les produire (Google Analytics, Matomo, etc.), et sont potentiellement sujets à biais et discussions... Sans compter qu'il y a désormais des portails en ligne qui concernent plusieurs services, et des regroupements de services. Bref, je ne m'y suis pas risquée !

 

 

Pour terminer, et pour le plaisir, retour vers la fin des années 1990, avec quelques pépites...

 

archives sites internets 1998

Rapport de la direction des Archives de France, 1998 (page 305)

 

 

archives sites internets 1998

archives sites internets 1997

Rapport de la direction des Archives de France, 1997 (pages 141 et 292)

 

archives sites internets 1996

Rapport de la direction des Archives de France, 1996 (page 106)

 

 

 

 


Comments est propulsé par CComment

À propos

Le numérique c’est fantastique (et non dramatique), surtout quand on travaille dans le domaine du patrimoine.

« C’est compliqué… ». « Je n’ose pas… ». « Je ne sais pas comment faire… »

Nul besoin d’années de code pour se simplifier la vie et le boulot sur un ordinateur. Archiviste et formatrice sur les outils et la médiation numérique, j'ai créé en 2015 ce blog pour partager et diffuser auprès des acteurs des archives et du patrimoine des tutoriels et des outils simples, pratiques et gratuits.

Idées, requêtes, questions, contributions sont les bienvenues.

Maïwenn Bourdic