patrimoine numerique

Profitons de ces temps de confinement pour réveiller (déconfiner ?) ce site un peu endormi... alors même les activités numériques parallèles ne manquent pas ! Ces dernières années, j'ai notamment investi Wikidata à travers différents projets archivistico-professionnalo-personnels :

  • renseignement de la propriété "archivé par" (P485 pour les intimes), en particulier dans le cadre du concours organisé lors du forum de l'AAF en 2019 ;
  • consolidation de données pour une liste d'autorité des architectes diocésains, à la fois en récupérant des informations de Wikidata (données biographiques, identifiant BNF, Leonore, etc.) et en y rajoutant de nouveaux éléments (données biographiques manquantes, fonctions, ajout de signatures) (Archives nationales ; voir la requête en ligne sur Wikidata) ;
  • ajout en masse des identifiants RSN manquants pour les services d'archives à partir des données disponibles sur data.culturecommunication, création en masse des services d'archives communaux et régionaux inexistants
  • création d'éléments et insertion des métadonnées descriptives de documents figurés téléversés sur Commons (travaux de restauration des cathédrales au XIXe siècle (Archives nationales ; voir la requête en ligne sur Wikidata) ;
  • et tout frais, tout neuf : 70 ans d'expositions aux Archives nationales (voir la requête en ligne sur Wikidata) .

 

Wiki quoi ? (en très bref)

Wikidata est une base de connaissances libre et gratuite qui peut être lue et modifiée tant par les personnes que par les dispositifs informatisés.

Wikidata fait office de stockage central pour les données structurées des projets frères de Wikimedia, comme, par exemple, Wikipédia, Wikivoyage, Wiktionary, Wikisource, et autres…

Wikidata offre aussi un support à beaucoup d'autres sites internet et services, au-delà des projets de Wikimédia ! Le contenu de Wikidata est disponible sous une licence libre, il s'exporte en utilisant des formats standards, et il peut être relié à d'autres ensembles de données libres sur le web.

Wikidata par Wikidata

wikidata beauvoir france

En gros : une méga base de données relationnelles, contributive, ouverte, multilingue... C'est également à mon sens le moyen le plus facile pour comprendre très simple ce qu'est le RDF et le web sémantique.

(Simone de Beauvoir) (est) un (être humain)

sujet + verbe + complément

(Simone de Beauvoir) (a comme pays de nationalité) (France)

(France) (a pour hymne) (La Marseillaise)

On peut ainsi naviguer d'éléments en éléments, les interroger ("lieux de naissance des personnes qui ont comme prénom Antoine", "rues de France nommées d'après une femme"), les réutiliser ailleurs.

La contribution est assez simple, très rapide dès qu'on a l'information, et les services d'archives y ont toute leur place pour préciser et référencer des informations (voir plus haut pour quelques idées).

Projet Expositions des Archives nationales

Les Archives nationales téléversent désormais des images des expositions temporaires sur Commons. Le rattachement des fichiers à une catégorie spécifique à l'exposition est déjà bien, mais on peut aller plus loin, en créant par exemple un élément Exposition XXX sur Wikidata, rassemblant toutes les métadonnées possibles, lui rattacher la catégorie Commons, et permettre ainsi l'affichage d'une infobox (à droite) dont toutes les informations sont dans Wikidata.

 wikidata expo 68

Une fois créés sur Wikidata les éléments pour les 6 expositions ayant une catégorie sur Commons, j'ai voulu aller plus loin... Résultat : plus de 190 expositions depuis les années 1950 désormais référencées dans Wikidata.

Ressources utilisées

D'abord des ressources un peu sérielles :

  • Le catalogue de la boutique des AN : le contenu est en PDF, mais un bon copié / importé dans OpenRefine du texte de la partie qui m'intéressait, a fait l'affaire ;
  • Le catalogue de la BNF : export d'une recherche avancée sur "archives nationales exposition" et sélection / nettoyage / dédoublonnage sur OpenRefine ;

Puis, de manière plus "manuelle" et plus longue (en plein texte...), mais ô combien riche, nécessaire et intéressante pour compléter les données et consolider des éléments moins bibliographiques (dates réelles de fermeture après prolongation, fréquentation finale, voire commissaires d'exposition) :

  • les numéros "Les Archives nationales en 19...", bilans d'activités annuels publiés dans La Gazette des Archives, consultables sur Persée ;
  • les rapports annuels des Archives de France mis en ligne sur FranceArchives, en PDF mais OCRisés ;
  • quelques informations grapillées dans la Salle des inventaires virtuelle des Archives nationales.

Résultat : plus de 190 expositions recensées à ce jour. Le chiffre et les données ne sont pas totalement exhaustifs et sont appelés à évoluer (consolidation d'éléments, notamment des dates de fin manquantes ou de la fréquentation, ajout à la marge d'éléments manquants).

Exemple d'élément sur Wikidata

Exposition Michelet, sa vie, son oeuvre, en 1961-1962

wikidata expo michelet

A quoi ça sert ?

(re)donner vie et visibilité à des ressources de l'institution, (re)découvrir, diffuser, etc.

Faire des statistiques sur les sujets proposés, la fréquentation, les titres. Uniquement sur ce dans la sphère du web sémantique grâce à l'outil de requête SPARQL de Wikidata : quelles sont les expositions référencées qui ont eu lieu entre 2008 et 2010 en France (voir le résultat de la requête), que trouve-t-on sur telle personne / période / thème, etc.

Voire c'est une première étape pour valoriser des ensembles de documents exposés lorsqu'ils ont été numérisés et déposés sur Commons (d'ailleurs, si j'arrivais à remettre la main sur ce catalogue d'exposition de 1959 que je saisavoir quelque part...).

Petite mise en bouche visuelle à partir des données Archives nationales insérées dans Wikidata

(sous réserve de quelques consolidations d'éléments encore à venir, notamment les expos hors les murs avant les années 1960)

 Sujets Personnes les plus fréquents dans les thèmes des expositions des Archives nationales (2 occurrences et plus)

wikidata expo personnes

 

Podium des expositions les plus courues

Notons, en cette période de confinement, l'ironie du titre de cette exposition de 1976-1977 : "Le Parisien chez lui au XIXe siècle"

wikidata expo podium succes

[Mise à jour: après complément, notamment avec les expos hors des murs, il s'avère que Saint Louis à la Sainte Chapelle en 1960 a tué le game : 251 000 visiteurs]

Analyse textuelle (très succincte) des titres et sous-titres des expositions

wikidata expo titres

 Voir aussi