L'icône rouge permet de télécharger chaque page du wiki visitée au format PDF et la grise au format ODT →

Différences

Ci-dessous, les différences entre deux révisions de la page.

--- doc:programmation:shell:regexp [22/09/2013 09:53]
smolski [Introduction]
+++ doc:programmation:shell:regexp [22/09/2013 11:15]
127.0.0.1 modification externe
@@ Ligne 41: / Ligne 41: @@
 Par exemple pour cette commande [[:doc:systeme:ls]] dont l'option **-d** permet à **ls** de lister uniquement les répertoires, sans leur contenu :
-<code bash>
+<code user>
 ls -d *</code>
-C'est bash qui va **interpréter** la regexp * (étoile) et la remplacer par tout le contenu du répertoire rendu ainsi lisible pour la commande ls et son action sur chacun d'eux.
+C'est bash qui va **interpréter** la regexp * (étoile) et la remplacer par **tout le contenu du répertoire** rendu ainsi lisible pour la commande **ls** et son action sur chacun d'eux comme ici par exemple :
-   fichier1 fichier2 … dossier1 …
+  fichier1 fichier2 … dossier1 …
 <note important>**ATTENTION !**
@@ Ligne 59: / Ligne 59: @@
 ==== Syntaxes ====
-Pour ces **regexp**, __différents programmes__ //utilisent// __différentes syntaxes__, de ce fait leurs __symboliques peut être différentes__ il faut donc bien distinguer le contexte où interviennent les **regexp**.
+Pour ces **regexp**, __différents programmes__ //utilisent// __différentes syntaxes__, de ce fait leurs __symboliques peuvent être différentes__ il faut donc bien distinguer le contexte où interviennent les **regexp**.
 Par exemple, un **regexp** destiné à l'utilisation d'une commande [[:doc:systeme:sed]], [[:doc:systeme:find]], [[:doc:systeme:locate]] ou [[:doc:systeme:grep]], devra être écrit différemment que dans le contexte de __l'utilisation d'une commande **bash**__ (voir : [[commande:les_metacaracteres | Bash - Les metacaractères (Pattern - Glob)]]).
@@ Ligne 77: / Ligne 77: @@
 == Pour bash : ==
-Pour avoir la même expression avec bash, il faudra écrire : ''pl{o,i}p''
+Pour avoir la même expression avec bash, il faudra écrire : ''pl{o,i}p''. \\
 Nous voyons donc que dans le contexte **bash**, il faudra utiliser((à la place des caractères //crochets// ''[...]'' de l'exemple précédent)) les caractères //accolades// ''{ }'' pour définir les **glob** concernant les mêmes chaînes de caractères ''plop plip''.
 ==== Conclusion ====
-Il y a donc bien lieu d'__utiliser les bons termes__ pour rédiger une commande au résultat identique __selon le bon contexte__. \\
+Il y a donc bien lieu d'__//utiliser les bons termes//__ pour rédiger une commande au résultat identique __//selon le bon contexte//__. \\
 C'est pourquoi ce tuto s'attache particulièrement à différencier ce contexte d'utilisation.
 ===== REGEXP - Utilisation pour sed find grep locate =====
-Dans ce tuto, nous allons donc nous intéresser aux ''regexp'' utilisées par
+Dans ce tuto, nous allons donc nous intéresser aux **regexp** utilisées par
 **sed**, **find**, **grep** et **locate** (sensiblement les mêmes).
 ==== Préparation pour executer les TP ====
-  - [[manuel:le_debianiste_qui_papillonne|Utiliser GNU/Linux en ligne de commande, tout commence là !.]] :-)
+Nous allons ici utiliser [[:doc:editeurs:vim]], l'éditeur fétiche des amoureux du terminal ! ;-)
-  - [[:doc:editeurs:vim]] - L'éditeur fétiche des amoureux du terminal !
-Pour réaliser les TP mis en exemple dans ce tuto, il vous faut préparer ces répertoires et fichiers, permettant d'accomplir les TP qui vont suivre. \\
+Pour réaliser les TP mis en exemple dans ce tuto, il vous faut préparer ces répertoires et fichiers. \\
-Créer le repertoire ''tuto_regexp'' dans votre ''/home/user'' :
+Créer le repertoire ''/home/user/tuto_regexp'' :
-<code bash>
+<code user>
-mkdir /home/user/tuto_regexp</code>
+mkdir ~/tuto_regexp</code>
-Compléter ce répertoire avec les TP qui suivent. \\
+Compléter ce répertoire comme indiqué dans les TP qui suivent. \\
-Nous seront ainsi fin prêts pour réaliser les TP mis en exemple dans ce tuto ! ;-)
+Nous seront ainsi fin prêts pour réaliser les TP mis en exemple dans ce tuto ! :-)
 === TP-01 ===
 Créer le fichier abraca et y inscrire le mot : ''Abracadabrantesque'' ainsi :
-<code bash>
+<code user>
-vim /home/user/tuto_regexp/abraca</code>
+vim ~/tuto_regexp/abraca</code>
-et taper :
+et écrire :
    Abracadabrantesque
@@ Ligne 122: / Ligne 120: @@
 Ces caractères suivants ont un statut particulier dans les **regexp** :
-   ^ . [ ] $ * { } \
+  * L'accent circonflexe : '' ^ ''
+  * Le point : '' . ''
+  * Les crochets doubles : ''[ ] ''
+  * Le signe dollar : '' $ ''
+  * L'étoile : '' * ''
+  * Les accolades doubles : '' { } ''
+  * L'anti-slash : '' \ ''
-Avec les **regexp**, les shells (lignes de commande) effectuent certaines substitutions dans les commandes entrées par les utilisateurs avant de les exécuter.
+Avec les **regexp**, les //shells// effectuent certaines substitutions dans les commandes entrées par les utilisateurs avant de les exécuter.
 ==== Les caractères ====
-La première chose que l'on veut pouvoir reconnaître avec des motif, ce sont les
+La première chose que l'on veut pouvoir reconnaître avec des motif, ce sont les mots que l'on peut écrire sans **REGEXP**. \\
-mots que l'on peut écrire sans **regexp**. \\
+**Exemple :**
-Exemple :
    Abracadabrantesque
 Toutes ces lettres sont des caractères pouvant former une ''regexp''. \\
-''Abracadantesque'' est donc déjà en soi une ''regexp'' reconnaissant exactement
+''Abracadantesque'' est donc déjà en soi une ''REGEXP'' reconnaissant exactement le mot ''Abracadabrantesque''.
-le mot ''Abracadabrantesque''.
 ==== Les jokers ====
 ''A.racadabrant....e''
-Comme vous l'aurez compris, les ''.'' (points) signifient //n'importe quel caractère//. \\
+Comme vous l'aurez compris, les points ''.'' signifient //n'importe quel caractère//. \\
-La chaîne ci-dessus est une ''regexp'' qui reconnaît exactement les caractères entrant dans le mot recherché. \\
+La chaîne ci-dessus est dans son ensemble une **REGEXP** qui reconnaît exactement les caractères entrant dans le mot recherché. \\
-En effet, ''.'' (le point) est un caractère spécial reconnaissant //n'importe quel caractère//. On appelle aussi ce caractère un ''joker''((En bash, le caractère joker est ''?''))
+En effet, ''.'' (le point) est un caractère spécial reconnaissant //n'importe quel caractère//.
+<note tip>On appelle aussi ce caractère un ''joker''((En bash, le caractère joker est ''?''))</note>
+==== Les caractères échappés ====
+Tous nos caractères spéciaux ont des significations particulières, nous l'avons vu avec le .((point)), c'est vrai pour les autres. \\
+Ainsi, pour reconnaître chacun d'eux en tant que caractère non spécial, il faut l'échapper par un \((anti-slash)).
+Ainsi la combinaison : ''\.''((anti-slash point)) reconnaît simplement ''.''((point)) \\
+Comme la combinaison : ''\\''((anti-slash antislash)) reconnaît ''\''((anti-slash)) \\
+Ou encore la combinaison : ''\\\.''((anti-slash anti-slash anti-slash point)) reconnaît \.((anti-slash point))
+//Eh oui !// :-D
+==== Les caractères répétition ====
+Quand on ne sait pas combien de fois un caractère va apparaître, on l'indique avec une étoile * \\
+**Exemple** : \\
+''Ah*'' reconnaît aussi bien « Ah » que « Ahhhhhhhhhhhhhhhhhhhhhhhhhh » ou même « A »
+Quand on ne sait pas si un caractère va apparaître une fois ou jamais, on l'indique avec un point d'interrogation échappé ''\?'' \\
+**Exemple** : \\
+La **REGEXP** : ''Chevals\?'' reconnaît aussi bien « Cheval » que « Chevals ». \\
+Autre exemple : ''coq\?uille''
+==== Les ensembles de caractères possibles ====
+''Par[lt]ez'' reconnaît aussi bien « Parlez » que « Partez ». \\
+''[a-z]'' reconnaît n'importe quelle lettre minuscule (non altérée)2) de l'alphabet. \\
+''[A-Za-z]'' reconnaît n'importe quelle lettre (non altérée) de l'alphabet. \\
+''[0-9\-]'' reconnaît les chiffres et le caractère « - ».
+=== Remarque : ===
+Il y a aussi des classes de caractères déjà prédéfinies.
+**Tableau des classes prédéfinies** [[http://www.commentcamarche.net/contents/php/phpreg.php3 | Source]] (merci titia) :-)
+^  classe  ^   Resultat   ^
+|[:alnum:] |  caractères alphanumériques (équivalent à [A-Za-z0-9])|
+|[:alpha:] |  caractères alphabétiques ([A-Za-z])|
+|[:blank:] |  caractères blanc (espace, tabulation)|
+|[:ctrl:] |  caractères de contrôle (les premiers du code ASCII|
+|[:digit:] |  chiffre ([0-9])|
+|[:graph:] |  caractère d'imprimerie (qui fait une marque sur l'écran en quelque sorte)|
+|[:print:] |  caractère imprimable (qui passe à l'imprimante ... tout sauf les caractères de contrôle)|
+|[:punct:] |  caractère de ponctuation|
+|[:space:] |  caractère d'espacement|
+|[:upper:] |  caractère majuscule|
+|[:xdigit:] |  caractère hexadécimal|
+==== Les caractères interdits ====
+''[^x]'' reconnaît tous les caractères sauf « x » \\
+''[^xy]'' reconnaît tous les caractères sauf « x » et « y » \\
+''[^a-z]'' reconnaît tous les caractères sauf les lettres minuscules non altérées
+==== Début et fin de ligne ====
+''^'' désigne un début de ligne \\
+''$'' désigne une fin de ligne
-=== TP 01 : ===
+**Exemple :**
+''^Pouet'' reconnaîtra le motif //Pouet// s'il se trouve en début de ligne.
+==== Combinaisons ====
+''[ab]*'' comme [ab] reconnaît aussi bien « a » que « b », [ab]* reconnaît aussi bien « aaaaaaaaa » que « abababbbbbbbbb » ou que « babbbaaa » \\
+''Abra*[ca]*dabrante\?'' reconnaît les chaînes commençant par « Abr », suivi par un nombre quelconque de « a », puis un nombre quelconque de « c » et de « a » suivis par « dabrant », suivi ou non par « e ».
+//De nombreux TP restent à suivre...// :-D
 ===== Liens utiles : =====

doc/programmation/shell/regexp.txt · Dernière modification: 05/07/2023 11:44 par Croutons

Debian-facile

Différences

Pied de page des forums