#40 - Utiliser les expressions régulières ("regex")
Les expressions régulières ("regex" pour les intimes) est une syntaxe qui permet de décrire et identifier un ensemble de chaîne de caractères possibles. Quand on gère au quotidien des catalogues, inventaires ou bases de données, elles peuvent servir de super "rechercher / remplacer par" très utile pour normaliser et corriger quelques coquilles ou en masse.
Au lieu de rechercher un mot strict (par exemple "chat"), les expressions régulières permettent de chercher des chaînes de caractères (par exemple 4 lettres, ou "c" suivi de 3 lettres, ou "c" + 2 lettres + "t"...), et si besoin de les modifier en mémorisant les valeurs initiales.
Quelques cas d'usages au quotidien quand on travaille sur des milliers de lignes :
- traquer le point final (absent ou présent, selon les choix), en fin de ligne / balise
- traquer la minuscule qui subsiste en début de champ / balise
- chercher l'année ou la date mal écrite (par exemple trois ou cinq chiffres qui se suivent)
- repérer des coquilles d'orthographes (les suivi d'un mot sans s final : les ([a-z]{3,})([a-r|t-x]) )
- etc.
Voir aussi l'article "Expression régulière" sur Wikipédia