Expressions régulières

<< Click to Display Table of Contents >>

Navigation:  Conseils et annotations >

Expressions régulières

Les expressions régulières décrivent des motifs dans les chaînes de caractères qui peuvent être utilisés pour déterminer si un motif donné apparaît ou non dans un texte. Dans TreeSize, les expressions régulières peuvent être utilisées pour trouver des fichiers et/ou des dossiers spécifiques qui correspondent aux critères spécifiés par les expressions régulières

 

Le tableau suivant présente certaines des syntaxes les plus utilisées et fournit quelques exemples :

Expression

Syntaxe

Description de l'expression

 Exemple

Tout caractère

.

Correspond à tout caractère unique à l'exception d'un saut de ligne.

a.o correspond à "aro" dans "around" et à "abo" dans "about", mais pas à "acro" dans "across".

Zéro ou plus

*

Correspond à zéro ou plusieurs occurrences de l'expression précédente et effectue toutes les correspondances possibles.

a*b correspond à "b" dans "bat" et à "ab" dans "about".

e.*e correspond au mot "entreprise".

Une ou plusieurs

+

Correspond à au moins une occurrence de l'expression précédente.

ac+ correspond aux mots contenant la lettre "a" et au moins une occurrence de "c", tels que "race" et "ace".

a.+s correspond au mot "access".

Début de la chaîne

^

Correspond au début d'une chaîne de caractères

^[0-9] correspond aux chaînes qui commencent par un chiffre.

Fin de la chaîne

$

Recherche la fin d'une chaîne de caractères

exe$ correspond aux chaînes qui se terminent par "exe".

Début de mot

[[:< :]]

Correspond uniquement au début d'un mot à cet endroit du texte.

[[:< :]]in correspond aux mots tels que "inside" et "into" qui commencent par les lettres "in".

Fin du mot

[[:> :]]

Correspond uniquement aux mots qui se terminent à cet endroit du texte.

ss[[:> :]] correspond à des mots tels que "across" et "loss" qui se terminent par les lettres "ss".

N'importe quel caractère de l'ensemble

[]

Correspond à l'un des caractères de l'ensemble []. Pour spécifier une plage de caractères, énumérez les caractères de début et de fin séparés par un tiret (-), comme dans [a-z].

be[n-t] correspond à "bet" dans "entre", "ben" dans "sous" et "bes" dans "à côté", mais pas à "bel" dans "sous".

Tout caractère ne faisant pas partie de l'ensemble

[^...]

Correspond à tout caractère qui ne fait pas partie de l'ensemble de caractères qui suit le ^.

be[^n-t] correspond à "bef" dans "avant", "beh" dans "derrière" et "bel" dans "en dessous", mais pas à "ben" dans "en dessous".

Ou

|

Correspond à l'expression qui précède ou qui suit le symbole OR (|). Utilisé le plus souvent dans un groupe.

(éponge|boue) correspond à "bain d'éponge" et "bain de boue".

Caractère d'échappement

\

Correspond au caractère qui suit la barre oblique inverse (\) en tant que caractère littéral. Cela vous permet de trouver les caractères utilisés dans la notation des expressions régulières, tels que { et ^.

\^ recherche le caractère ^.

Répéter n fois

{n}

Correspond à n occurrences de l'expression précédente.

[0-9]{4} correspond à toute séquence de 4 chiffres.

Groupement

()

Permet de regrouper un ensemble d'expressions. Si vous souhaitez rechercher deux expressions différentes en une seule fois, vous pouvez utiliser l'expression Regroupement pour les combiner.

Si vous souhaitez rechercher [a-z][1-3] ou [0-9][a-z], vous devez les combiner : ([a-z][1-3])|([0-9][a-z]).

 

Autres exemples :

Expression régulière

Cas d'utilisation

[0-9] ou \d

Recherche tous les fichiers/dossiers dont le nom contient au moins un chiffre.

a|b

Recherche tous les fichiers/dossiers dont le nom contient "a" ou "b".

[^(A-Za-z)]

Recherche tous les fichiers/dossiers dont le nom contient au moins un caractère n'appartenant pas à la plage A-Z ou a-z.

^E[0-9]{7}$

Recherche tous les fichiers/dossiers dont le nom commence par un "E" suivi d'exactement 7 chiffres.

[A-Za-z]:\\([^\\]+\\){2,4}[^\\]+$

Recherche tous les fichiers/dossiers dont la profondeur est comprise entre 2 et 4.

[^\x00-\x7F]

Recherche tous les fichiers/dossiers contenant des caractères ASCII non valides.

[^\P{C}]

Recherche tous les fichiers/dossiers contenant des caractères Unicode qui ne peuvent pas être imprimés.

[\xA0]

Recherche tous les noms de fichiers/dossiers contenant le caractère espace insécable (Unicode NOBR, U+00A0) au lieu d'un caractère espace normal.

[~\"#%&\*\:<>\?\/\\{|}]

Recherche tous les noms de fichiers et de dossiers qui contiennent des caractères non valides sur les serveurs SharePoint.

^\s+.*

Recherche tous les fichiers et dossiers contenant un espace.

\s+(\.[^.]+)$

Recherche les fichiers avec une extension qui ont un espace à la fin de leur nom.

.*\s+$

Recherche les dossiers dont le nom se termine par un espace.

 

De plus amples informations et des exemples supplémentaires sont disponibles ici.

Une description de tous les caractères spéciaux pouvant être utilisés avec les expressions régulières est disponible ici.

 

Les outils suivants peuvent aider à former des expressions régulières :

https://regex101.com/ (en ligne)

http://regexpal.com/ (en ligne)

http://sourceforge.net/projects/regexpeditor/ (téléchargement)

http://sourceforge.net/projects/regextester/ (téléchargement)

http://sourceforge.net/projects/regaxe/ (téléchargement)