Sidebar

Patrimoine et numérique
  • Accueil
  • Tutoriels
  • Data-visualisations
  • Journées d'études
  • Ressources
    • Fichiers
    • Tags
    • Liens
  • À propos
#43 - Coucou Mastodon
#43 - Coucou Mastodon
27 août 2023
C'est fait ! Aprés avoir effacé puis quitté Facebook au printemps 2018, j'ai repris le balai sur Twitter en décembre 2022 (quelques pouets sur le sujet plus bas), non sans y avoir songé des mois sans totalement franchir le pas... Une fois mon archive de tweets soigneusement téléchargée (avec un mote...

  Lire la suite

"Do you SPARQL ?" - Compilation de requêtes patrimoniales et culturelles sur Wikidata
22 août 2023
Pense-bête et compilation de requêtes des données de Wikidata, portant sur le patrimoine et la culture, modifiables et remixables à souhait, d'après les formidables #1jour1requête de @belett Les requêtes sont en clair. Les liens renvoient vers le requêteur SPARQL. La requête se lance en cliquant su...

  Lire la suite

#42 - Cat-a-lot, outil pour catégoriser en masse des (ses) médias sur Wikimédia Commons
#42 - Cat-a-lot, outil pour catégoriser en masse des (ses) médias sur Wikimédia Commons
03 août 2023
Les images patrimoniales sont souvent utilisées par des Wikipédiens pour illustrer des articles Wikipédia. Ces médias, hébergés sur Wikimédia Commons (voir aussi Mettre en ligne des images sur Commons) sont généralement correctement décrits, avec indication de leur provenance dans la description. El...

  Lire la suite

#41 - Où sont les femmes ? ou comment genrer nos données patrimoniales
#41 - Où sont les femmes ? ou comment genrer nos données patrimoniales
12 juillet 2023
Cela aurait pu être une communication (non retenue) lors d'une journée d'étude... mais ça sera finalement un billet de blog. Avec un clin d'oeil pour commencer : Une photographie joyeuse des Archives des Bouches-du-Rhône, ainsi légendée : "Yves Montand, une divette et un journaliste, René Mondu...

  Lire la suite

#40 - Utiliser les expressions régulières (
#40 - Utiliser les expressions régulières ("regex")
28 avril 2023
Les expressions régulières ("regex" pour les intimes) est une syntaxe qui permet de décrire et identifier un ensemble de chaîne de caractères possibles. Quand on gère au quotidien des catalogues, inventaires ou bases de données, elles peuvent servir de super "rechercher / remplacer par" très utile p...

  Lire la suite

Archives et open data : les jeux de données
Archives et open data : les jeux de données
02 février 2023
Dans le cadre d'une intervention "Archives et open data" auprès du master 2 Archives d'Angers (janvier 2023), j'ai compilé les jeux de données "archives" diffusés en open data, à partir du catalogue des données de data.gouv (version du 5 javier 2023). Le fichier CSV, accessible sur Framagit, recens...

  Lire la suite

Archives et open data : frise chronologique
Archives et open data : frise chronologique
12 janvier 2023
Frise chronologique créée à l'occasion d'une intervention "Archives et open data" auprès du master 2 Archives d'Angers (janvier 2023)     Pour aller plus loin Frise chronologique en ligne Tableur de données source (CC BY-SA) Outil : Timeline JS (voir le tutoriel)    ...

  Lire la suite

#39 - Opération
#39 - Opération "Signatures", ou disséminer des autographes sur Commons, Wikidata et Wikipédia
22 décembre 2022
Voici une action de dissémination de contenus facile, rapide à mettre en oeuvre, et plutôt satisfaisante en terme de résultats (et de statistiques). L'opération "Signatures"1 vise à numériser et diffuser sur les plateformes Wiki des signatures de personnes plus ou moins VIP croisées dans les fonds d...

  Lire la suite

Statistiques des services d'archives en France
Statistiques des services d'archives en France
22 décembre 2022
Ce billet aurait pu être publié le 27 septembre 2012, lorsque Jordi Navarro et moi avons diffusé des datavisualisations réalisées à partir des rapports annuels du Service interministériel des Archives de France. En 2012, data.gouv.fr soufflait sa première bougie ; les toutes premières collectivités ...

  Lire la suite

Le Parisien chez lui au XIXe siècle, ou reconstituer une exposition sur Commons
Le Parisien chez lui au XIXe siècle, ou reconstituer une exposition sur Commons
22 décembre 2022
Un an après l'opération "70 ans d'expositions aux Archives nationales" sur Wikidata, le contexte sanitaire n'ayant pas beaucoup évolué, l'occasion est parfaite pour tenter une reconstitution de l'une des expositions qui a le plus marché : "Le Parisien chez lui au XIXe siècle", qui a eu lieu en 197...

  Lire la suite

Wikidata et les archives (2) - Chronologie des préfets du Finistère
Wikidata et les archives (2) - Chronologie des préfets du Finistère
27 mars 2021
En marge d'un travail d'alignement et enrichissement du Dictionnaire des préfets français de 1870 à 1982 (Bargeton II pour les intimes) avec Wikidata, j'ai voulu faire une frise chronologique exhaustive des préfets du Finistère à partir de la base de connaissance libre et collaborative... Si les élé...

  Lire la suite

#ChallengeAZ Wikidata / femmes / archives / Maitron
#ChallengeAZ Wikidata / femmes / archives / Maitron
01 novembre 2020
Difficile de résister à l'idée et à l'envie : parce que Wikidata vient d'avoir 8 ans le 29 octobre dernier, parce que le mois de novembre est consacré au #Challenge de A à Z des blogs de généalogie, parce que j'ai peu de temps à consacrer dernièrement au Projet Les Sans Pages, parce que dès que pos...

  Lire la suite

#43 - Coucou Mastodon

Détails
30 août 2023
Affichages : 2035

Mastodon logotype (simple) new hueC'est fait ! Aprés avoir effacé puis quitté Facebook au printemps 2018, j'ai repris le balai sur Twitter en décembre 2022 (quelques pouets sur le sujet plus bas), non sans y avoir songé des mois sans totalement franchir le pas... Une fois mon archive de tweets soigneusement téléchargée (avec un moteur de recherche beaucoup plus manipulable que ne l'est le site lui-même), j'ai liquidé quelques 22 000 tweets, 2300 abonnés et 13 ans d'activité de mon compte principal. Avec comme objectif de (ré-)investir uniquement et une bonne fois pour toutes le fédiverse, via Mastodon. Mes deux comptes Twitter sont désormais désactivés avant suppression automatique d'ici fin septembre 2023.

 

43 geek twitter daieuxdailleurs


Je ne renierai pas ces 13 ans sur Twitter (surtout les 10 premières années), qui m'ont tant apporté. Aussi bien sur le plan professionnel que personnel, j'y ai fait de très belles rencontres, que je n'aurais pas forcément faites ailleurs. J'y ai énormément appris, découvert plein de choses et partagé (beaucoup de veille archivistique et généalogique), qui m'ont permis d'évoluer et d'élargir mes horizons. Mais je pense ici plutôt au Twitter des années 2010. Depuis plusieurs années, les modifications des algorithmes, les difficultés à réussir à y faire une veille efficace, le côté scroll chronophage et vide-cerveau, les TT nauséabonds qu'on essaie de ne pas voir, les mini buzz de cette bulle déconnectée du réel (mais avec tant d'impact, notamment dans les médias), le harcèlement publicitaire... L'outil avait perdu ce qui en faisait son intérêt, bien avant son rachat par EM.

Me voici depuis 10 mois en plein ré-investissement de Mastodon, avec la ré-activation de mon compte @daieuxetdailleurs@framapiaf créé en 2017 sur une instance gérée par Framasoft. J'avais également utilisé en son temps l'instance etalab avec mon mail pro. Il "manque" encore quelques comptes que j'aimais bien suivre (archivistes, institutions culturelles, associations, historiens, centre de recherche, journalistes). Mais je survis sans, et j'ai réactivé de bons vieux flux RSS (quand c'est possible). Il n'y a plus de possibilité de rechute et de s'en scroller une sur Twitter : désormais (au 30 août 2023, à chaque jour sa nouvelle régression), les internautes lambda non connectés ne peuvent plus voir les tweets des comptes (sauf à avoir une coche "compte certifié").

Ce que j'aime sur mon instance Mastodon :

  • il y a des gens qui ne s'étaient jusque là jamais inscrits sur un réseau social (oui, ces gens existent !) ;
  • je suis de nouveau en phase découvertes (de domaines, de lecture, de gens) ;
  • la légèreté (bienveillance, pas de pub, pas de mise en avant de TT débiles et réacs qui n'existent que dans la bulle d'un réseau social, désintoxication à l'audience des likes et des vues de ses messages) ;
  • les mots-clés, c'est la vie (oubliés depuis un bail sur Twitter, c'était une plaie pour la veille pro). Et la recherche "plein texte" arrive dans les prochaines montées de version (parce que jusqu'à présent, pour retrouver un pouet, c'est un peu galère... mais sur Twitter aussi) ;
  • on peut faire des listes avec des abonnés (ceci me rappelle quelque chose...) ;
  • on peut programmer des pouets (ceci me rappelle quelque chose qui s'appelait comment ? ah oui, Tweetdeck, liquidé en plein mois d'août pour ceux qui ne déboursent pas) ;
  • on peut gérer des audiences de pouets (public / public non cherchable / abonnés / message direct) ;
  • on peut éditer un pouet pour rajouter un mot-clé oublié ou corriger une coquille d'orthographe ;
  • on peut faire de la veille sur des mots-clés ! avec un flux RSS (exemple pour mon instance https://framapiaf.org/tags/archives) ;
  • il y a même des bots des comptes Twitter de quotidiens nationaux (exemple Le Monde) et des transports (par exemple RATP et Ile-de-France).

 

Oui mais... "c'est trop compliqué par rapport à Twitter", " j'y comprends rien au fediverse".

C'est vite oublier ses propres débuts sur Twitter (et j'en ai formé des professionnels qui n'y comprenaient rien à Twitter... par ailleurs les deux billets consacrés à Twitter du blog ont été dépubliés révisés), que le confort de l'habitude / la peur du changement existe dans le quotidien comme dans le numérique. et surtout qu'on n'a jamais rien compris non plus aux algorithmes de Facebook et Twitter et qu'on a toujours fait avec sans se poser de question. Quand il n'y a qu'un seul outil, c'est plus simple de choisir (quand bien même il serait déjà quasi obsolète - en matière de "médiation grand public" en tout cas et politiquement contestable, c'est la force de la majorité). Quant à l'addiction aux statistiques de visualisation (là encore, en terme de médiation numérique et patrimoniale), mieux vaut miser sur l'open content, Commons et Wikipédia : les contenus des réseaux sociaux sont éphémères et introuvables au bout d'une semaine.

Quand on est une institution / association / personne publique, on souhaite s'adresser au plus grand nombre. Mais la situation actuelle de l'outil majoritaire devrait nous faire réfléchir à ce mode de communication quasi unique : ça fait belle lurette qu'en réalité on ne s'adresse qu'à une infime partie de ses milliers d'abonnés (y compris parfois pour des informations "pratiques" qu'on ne trouve pas ailleurs, comme une fermeture au public imprévue. Problématique non ?). Il suffit de rapporter les vues, les likes et les retweets au nombre d'abonnés théorique. Qui voit réellement les publications, qui les aiment et les retweet ? Toujours les mêmes. Dans une bulle. A défaut de choisir la migration totale et définitive, il serait au moins nécessaire de réfléchir à ses modes de communication et leur diversification.

Bref, j'ai choisi d'aller buller ailleurs.

Pour commencer

  • Choisir une instance (voir cette liste de serveurs Mastodon) - Mastodon est un outil installé sur des serveurs décentralisés, connectés entre eux. Chaque instance (un Mastodon installé sur un serveur) a ses propres administrateurs, ses règles et sa communauté. Il est possible de déménager d'instance après inscription (avec plus ou moins de suivi des abonnés selon les cas semble-t-il). Côté services publics, il y a bien eu une instance Etalab en 2017 (pour les @gouv.fr), mais pour l'instant c'est palôt... A part la Direction du numérique pour l'édution (ministère de l'Education nationale) ;
  • Se créer un compte ;
  • S'abonner à des gens en cherchant des comptes ou des mots-clés (#archives, #histoire, etc.). Les noms d'utilisateurs s'écrivent sous la forme @pseudo@instance (exemple @daieuxetdailleurs@framapiaf). Il existe également des listes d'utilisateurs thématiques (archives, GLAM, histoire, digital humanities, généalogie), des instances thématiques (histoire, digital humanities), des mots-clés "communautaires" (#archivistodon, #histodon) et des systèmes de groupes ou listes automatiques (exemples : @Cette adresse e-mail est protégée contre les robots spammeurs. Vous devez activer le JavaScript pour la visualiser. ; @Cette adresse e-mail est protégée contre les robots spammeurs. Vous devez activer le JavaScript pour la visualiser.)
  • Faire un pouet d'introduction (avec les mot-clés #introduction #introductionfr et les thématiques d'intérêt).

Un peu de lecture

  • Le fédiverse c'est quoi (Wikipédia)
  • Mastodon kesaco (Wikipédia)
  • Une liste de serveurs Mastodon
  • Ressources académiques sur Mastodon (listes d'utilisateurs thématiques, instances, groupes, etc.)
  • Le Monde, "Twitter devenu X : le problème Musk" (25 août 2023)
  • Le Monde, "De Twitter à X : le long épilogue d’une histoire chaotique" (24 juillet 2023)
  • Actu.fr, "Pourquoi l'Université Rennes 2 s'oppoPourquoi l'Université Rennes 2 s'oppose à Elon Musk, patron de X (ex-Twitter)" (1er septembre 2023)
  • NextInpact, IA, biométrie, parcours pro : Twitter/X s’autorise de nouveaux usages des données personnelles (1er septembre 2023)

 

 

 

 

 

Twitter réseaux sociaux Mastodon logiciel libre
Ecrire un commentaire (0 Commentaires)

"Do you SPARQL ?" - Compilation de requêtes patrimoniales et culturelles sur Wikidata

Détails
23 août 2023
Affichages : 938

Pense-bête et compilation de requêtes des données de Wikidata, portant sur le patrimoine et la culture, modifiables et remixables à souhait, d'après les formidables #1jour1requête de @belett

Les requêtes sont en clair. Les liens renvoient vers le requêteur SPARQL. La requête se lance en cliquant sur le bouton bleu (1). Au survol, une bulle d'aide décrit les propriétés (P...) et les éléments (Q...) (2). Ces propriétés et éléments peuvent être modifiés facilement en utilisant la saisie par auto-complétion (ctrl + barre espace). Le mode d'affichage de la visualisation peut être modifié (liste, mosaïque, diagramme... selon les paramètres permis par la requête) (3).

 

sparql wd lancer 

Mais pourquoi ces copier-coller de requêtes, alors qu'il y a des ressources pour apprendre le SPARQL ??? D'abord à titre de pense-bête perso des supers requêtes patrimoniales de @belett, de crainte qu'elles ne qui ne disparaissent corps et âme avec feu-Twitter (pour l'âme de Twitter, c'est déjà trop tard). Dans le monde du numérique et du web, il n'y a par ailleurs souvent rien de mieux pour apprendre que de modifier des copier-coller de code déjà faits, en changeant les paramètres (surtout quand on n'a pas le temps de se plonger dans lesdites ressources, tutoriels et autres supers vidéos). Aveu : j'ai paramétré et généré cette carte des femmes ayant un identifiant FranceArchives (avec calque par siècle) à partir de la requête cartographiant Carte des lieux de naissance des joueurs de l'ASM...

Plus d'une soixantaine de requêtes sont répertoriées ci-après. Afin de s'y retrouver, elles ont été triées par type de visualisation (liste, mosaïque d'images, graphiques, cartes, ...)... même si toute visualisation n'est en fait qu'une liste de données visualisée autrement. Une fois "habitué.e." à changer quelques éléments, les requêtes SPARQL en clair permettent de chercher les formulations pour grouper, trier, paramétrer des conditions, etc.

 

PS : le tropisme auvergnato-breton a une double explication (Nicolas Vigneron a été wikimédien en résidence en Auvergne puis au musée de Bretagne à Rennes).

 

Sommaire

Des listes (affichage par défaut) - Des images (ImageGrid) - Des graphiques (LineChart, BubbleChart, BarChart) - Des cartes (Map) - Des frises chronologiques  (Timeline) - Autres - Bonus

 

Pour aller plus loin

  • Tutoriel SPARQL Wikidata
  • Forum de l'AAF 2019, concours Wikidata
  • MOOC Wikidata
  • Vidéos (Youtube) et twitch.tv de @belett

 

Commons Wikipédia open data données Wikidata SPARQL linked open data
Lire la suite : "Do you SPARQL ?" - Compilation de requêtes patrimoniales et culturelles sur Wikidata
Ecrire un commentaire (0 Commentaires)

#42 - Cat-a-lot, outil pour catégoriser en masse des (ses) médias sur Wikimédia Commons

Détails
4 août 2023
Affichages : 483

Les images patrimoniales sont souvent utilisées par des Wikipédiens pour illustrer des articles Wikipédia. Ces médias, hébergés sur Wikimédia Commons (voir aussi Mettre en ligne des images sur Commons) sont généralement correctement décrits, avec indication de leur provenance dans la description. Elles sont néanmoins rarement rattachées aux catégories regroupant les collections des institutions patrimoniales (lorsqu'elles existent... et lorsque c'est le cas, elles sont peu connues). Le gadget cat-a-lot permet d'ajouter sur Commons des catégories à des lots d'images ou des catégories. Ce travail de catégorisation est important :

  • il permet d'identifier la provenance des contenus réutilisés par les internautes :
  • il offre la possibilité d'avoir des statistiques de leur visualisation ;
  • il permet d'améliorer la visibilité de l'institution patrimoniale (qu'elle contribue en téléversant des contenus sur Commons ou non).

Des centaines d'images issues des collections des archives départementales, mises en ligne sur Commons, ont ainsi pu être rattachées à leur institution d'origine, alors même que moins d'une dizaine de services mettent en ligne "volontairement" des médias sur cette plateforme.

 

42 cat a lot commons 0

 

Petit mode d'emploi rapide de cet outil cat-a-lot.

Commons image statistiques open content
Lire la suite : #42 - Cat-a-lot, outil pour catégoriser en masse des (ses) médias sur Wikimédia Commons
Ecrire un commentaire (0 Commentaires)

#41 - Où sont les femmes ? ou comment genrer nos données patrimoniales

Détails
13 juillet 2023
Affichages : 786

41 genrer divette

Cela aurait pu être une communication (non retenue) lors d'une journée d'étude... mais ça sera finalement un billet de blog. Avec un clin d'oeil pour commencer :

  • Une photographie joyeuse des Archives des Bouches-du-Rhône, ainsi légendée : "Yves Montand, une divette et un journaliste, René Monduel, prennent la pose"
  • Et ma réponse : "mais qui est la divette ?"

La preuve par l'exemple qu'en matière d'invisibilisation des femmes, nos données patrimoniales font pâle figure. Quand on cherche des femmes dans les bases de données et catalogues, on peut en trouver, bien sûr, mais principalement en effectuant une recherche nominative (et encore, entre le nom d'épouse et le nom de naissance) ou en rusant sur les termes et des vocabulaires susceptibles de concerner "des femmes".

Les données c'est bête et méchant : une notice concernant Marguerite ne sortira pas en résultat de recherche "femme" s'il n'est pas précisé que Marguerite est une femme. Que faire alors pour mieux faire sortir des résultats de recherche, mais aussi améliorer la découvrabilité des contenus et rendre visible l'implicite ?

Petit retour d'expérience sur ce que je pratique dès que c'est possible lors d'opérations de rétroconversion et/ou mise en qualité de données nominatives sérielles.

expérience utilisateur openrefine données femmes
Lire la suite : #41 - Où sont les femmes ? ou comment genrer nos données patrimoniales
Ecrire un commentaire (0 Commentaires)

#40 - Utiliser les expressions régulières ("regex")

Détails
28 avril 2023
Affichages : 814

Les expressions régulières ("regex" pour les intimes) est une syntaxe qui permet de décrire et identifier un ensemble de chaîne de caractères possibles. Quand on gère au quotidien des catalogues, inventaires ou bases de données, elles peuvent servir de super "rechercher / remplacer par" très utile pour normaliser et corriger quelques coquilles ou en masse.

40 regex emailAu lieu de rechercher un mot strict (par exemple "chat"), les expressions régulières permettent de chercher des chaînes de caractères (par exemple 4 lettres, ou "c" suivi de 3 lettres, ou "c" + 2 lettres + "t"...), et si besoin de les modifier en mémorisant les valeurs initiales.

Quelques cas d'usages au quotidien quand on travaille sur des milliers de lignes :

  • traquer le point final (absent ou présent, selon les choix), en fin de ligne / balise
  • traquer la minuscule qui subsiste en début de champ / balise
  • chercher l'année ou la date mal écrite (par exemple trois ou cinq chiffres qui se suivent)
  • repérer des coquilles d'orthographes (les suivi d'un mot sans s final : les ([a-z]{3,})([a-r|t-x]) )
  • etc.

Voir aussi l'article "Expression régulière" sur Wikipédia

recherche avancée tutoriel csv outils
Lire la suite : #40 - Utiliser les expressions régulières ("regex")
Ecrire un commentaire (1 Commentaire)

Plus d'articles...

  1. Archives et open data : les jeux de données
  2. Archives et open data : frise chronologique
Page 1 sur 12
  • Début
  • Précédent
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • Suivant
  • Fin

À propos

Le numérique c’est fantastique (et non dramatique), surtout quand on travaille dans le domaine du patrimoine.

« C’est compliqué… ». « Je n’ose pas… ». « Je ne sais pas comment faire… »

Nul besoin d’années de code pour se simplifier la vie et le boulot sur un ordinateur. J'ai créé en 2015 cette boîte à outils numérique faite d’astuces et de tutoriels simples, pratiques, naturellement gratuits, à partager et diffuser auprès des acteurs des archives et du patrimoine.

Idées, requêtes, questions, contributions sont les bienvenues.

Maïwenn Bourdic

Derniers articles

  • #43 - Coucou Mastodon
  • #42 - Cat-a-lot, outil pour catégoriser en masse des (ses) médias sur Wikimédia Commons
  • #41 - Où sont les femmes ? ou comment genrer nos données patrimoniales
  • #40 - Utiliser les expressions régulières ("regex")
  • #39 - Opération "Signatures", ou disséminer des autographes sur Commons, Wikidata et Wikipédia
  • Le Parisien chez lui au XIXe siècle, ou reconstituer une exposition sur Commons
  • #38 - D'un inventaire PDF à un fichier XML : cas pratique OpenRefine
  • Wikidata et les archives (1) - 70 ans d'expositions aux Archives nationales

Mots-clés

capture d'image (1) Framadate (3) chercher (2) XnView (3) logiciel libre (1) nommage (1) datasprint (2) réutilisation (2) calendrier (2) presse (2) Facebook (2) Mastodon (1) médiation (8) Commons (6) raccourci clavier (2) Framapad (2) blog (1) Creative Commons (1) médias (5) référencement (2)

Patrimoine et numérique - Licence Creative Commons - à propos | Plan du site | Contact | rss 48Flux RSS
 

Bootstrap is a front-end framework of Twitter, Inc. Code licensed under MIT License. Font Awesome font licensed under SIL OFL 1.1.