logo Debian Debian Debian-France Debian-Facile Debian-fr.org Forum-Debian.fr Debian ? Communautés logo inclusivité

Debian-facile

Bienvenue sur Debian-Facile, site d'aide pour les nouveaux utilisateurs de Debian.

Vous n'êtes pas identifié(e).


L'icône rouge permet de télécharger chaque page du wiki visitée au format PDF et la grise au format ODT → ODT PDF Export

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
Prochaine révision
Révision précédente
Prochaine révision Les deux révisions suivantes
doc:programmation:shells:bash-vii-globs-etendus-regex [06/07/2014 11:16]
Hypathie [Correspondance de motifs avec les expressions rationnelles]
doc:programmation:shells:bash-vii-globs-etendus-regex [08/07/2014 19:52]
Hypathie [Correspondance de motifs avec les expressions rationnelles]
Ligne 68: Ligne 68:
 ls ~/​Test/​!(*jpg|*bmp) ls ~/​Test/​!(*jpg|*bmp)
 </​code>​ </​code>​
-Retour : 
 <​code>​ <​code>​
 /​home/​hypathie/​Test/​nom.txt /​home/​hypathie/​Test/​nom.txt
Ligne 89: Ligne 88:
 echo !(*jpg|*bmp) echo !(*jpg|*bmp)
 </​code>​ </​code>​
-Retour : 
 <​code>​ <​code>​
 nom.txt nom.txt
Ligne 119: Ligne 117:
 fi fi
 </​code>​ </​code>​
-Retour : 
 <​code>​ <​code>​
 mauvaise correspondance mauvaise correspondance
Ligne 139: Ligne 136:
 Certaines expressions régulières peuvent être utilisées avec bash, mais elles ne peuvent pas être utilisée comme modèle de comparaison avec des noms de fichier pour effectuer des recherches en ligne de commandes. Elles matchent des variables et s'​utilisent dans le cadres des scripts.\\ ​ Certaines expressions régulières peuvent être utilisées avec bash, mais elles ne peuvent pas être utilisée comme modèle de comparaison avec des noms de fichier pour effectuer des recherches en ligne de commandes. Elles matchent des variables et s'​utilisent dans le cadres des scripts.\\ ​
  
-Les expressions régulières reconnues par Bash sont nommées ERE ("​expression régulière étendues).\\  +Les expressions régulières reconnues par Bash sont nommées ERE ("​expression régulière étendues").\\  
-Depuis ​**Bash ​3.0**, on peut pour se faire utiliser l'​opérateur =~ avec un modèle regex, "​mot-clé"​<​code>​[[ mot-clé]] ​ # modèle regex</​code> ​Cet opérateur =~ permet alors de vérifier la correspondre entre une chaîne (valeur d'une variable à gauche) et le modèle regex à droite.\\ ​+Depuis ​__Bash ​3.0__, on peut pour se faire utiliser l'​opérateur ​''​=~''​.\\ Cet opérateur ​''​=~'' ​permet alors de vérifier la correspondre entre une chaîne (valeur d'une variable à gauche) et le modèle regex à droite.\\ ​
 Ou encore de vérifier la correspondance entre une variable constituée d'une chaîne de caractères littérales,​ et une variable constituée d'une regex.\\ Ou encore de vérifier la correspondance entre une variable constituée d'une chaîne de caractères littérales,​ et une variable constituée d'une regex.\\
 Voici quelques liens qui présentent la syntaxe et les caractères utilisables avec Bash sans les commandes grep, sed, awk.\\ ​ Voici quelques liens qui présentent la syntaxe et les caractères utilisables avec Bash sans les commandes grep, sed, awk.\\ ​
Ligne 155: Ligne 152:
 **Voici les caractères utilisables :** **Voici les caractères utilisables :**
 ^ "​signes"​ regex ERE basique ​ ^ signification (comparez avec le tableau de l'​index) ​            ^ ^ "​signes"​ regex ERE basique ​ ^ signification (comparez avec le tableau de l'​index) ​            ^
-<​code>​.</​code> ​| Correspond à tout caractère unique. Dans expressions POSIX entre crochets, le caractère point correspond à un point littéral | +''​.'' ​| Correspond à tout caractère unique. Dans expressions POSIX entre crochets, le caractère point correspond à un point littéral | 
-<​code>​[ ]</​code> ​| Correspond à un seul caractère qui est contenue dans les parenthèses. On peut mélanger [abcx-z] correspond à "​a",​ "​b",​ "​c",​ "​x",​ "​y"​ ou "​z",​ de même que [a-cx-z]. Le caractère - est traité comme un caractère littéral si c'est le dernier ou le premier. ​ | +''​[ ]'' ​| Correspond à un seul caractère qui est contenue dans les parenthèses. On peut mélanger [abcx-z] correspond à "​a",​ "​b",​ "​c",​ "​x",​ "​y"​ ou "​z",​ de même que [a-cx-z]. Le caractère - est traité comme un caractère littéral si c'est le dernier ou le premier. ​ | 
-<​code>​[^ ]</​code> ​| Correspond à un seul caractère qui n'est pas contenu dans les parenthèses. Par exemple, ​<​code>​[^ abc]</​code> ​correspond à tout caractère autre que "​a",​ "​b"​ ou "​c"​. | +''​[^ ]'' ​| Correspond à un seul caractère qui n'est pas contenu dans les parenthèses. Par exemple, ​''​[^ abc]'' ​correspond à tout caractère autre que "​a",​ "​b"​ ou "​c"​. | 
-<​code>​</​code> ​ | Correspond à la position de départ dans la chaîne. | +''​'' ​ | Correspond à la position de départ dans la chaîne. | 
-<​code>​$</​code> ​| Correspond à la position de fin de la chaîne ou la position juste avant un saut de ligne de chaîne interminable. ​  | +''​$'' ​| Correspond à la position de fin de la chaîne ou la position juste avant un saut de ligne de chaîne interminable. ​  | 
-<​code>​( )</​code> ​| Définit une sous-expression marquée. La chaîne correspondante entre parenthèses peut être rappelé plus tard (voir l'​entrée suivante, \ n). Une sous-expression marquée est aussi appelé un groupe de blocs ou de capturer. Mode BRE nécessite \ (\). | +''​( )'' ​| Définit une sous-expression marquée. La chaîne correspondante entre parenthèses peut être rappelé plus tard (voir l'​entrée suivante, \ n). Une sous-expression marquée est aussi appelé un groupe de blocs ou de capturer. Mode BRE nécessite \ (\). | 
-<​code>​\n</​code> ​| Correspond au nombre n de sous-chaîne,​ où n est un chiffre de 1 à 9.\\ Écriture équivalente à {n}  |   +''​\n'' ​| Correspond au nombre n de sous-chaîne,​ où n est un chiffre de 1 à 9.\\ Écriture équivalente à {n}  |   
-<​code>​*</​code> ​| Correspond à zéro ou plusieurs fois l'​élément précédent.\\ Par exemple, ​<​code>​ab * c</​code> ​correspond à "​ac",​ "​abc",​ "​abbbc»,​ etc. Ou encore, ​<​code>​[xyz] *</​code> ​correspond à " ", "​x",​ "​y",​ "​z",​ "​zx",​ "​zyx",​ "xyzzy ", et ainsi de suite. ​<​code>​(ab) *</​code> ​correspond à "",​ "​b",​ "​abab",​ "​ababab",​ et ainsi de suite. | +''​*'' ​| Correspond à zéro ou plusieurs fois l'​élément précédent.\\ Par exemple, ​''​ab * c'' ​correspond à "​ac",​ "​abc",​ "​abbbc»,​ etc. Ou encore, ​''​[xyz] *'' ​correspond à " ", "​x",​ "​y",​ "​z",​ "​zx",​ "​zyx",​ "xyzzy ", et ainsi de suite. ​''​(ab) *'' ​correspond à "",​ "​b",​ "​abab",​ "​ababab",​ et ainsi de suite. | 
-<​code>​{m,n}</​code> ​| Correspond au moins à m fois mais pas plus de n fois l'​élément précédent.\\ Par exemple, ​<​code>​a{3,5}</​code> ​correspond uniquement "​aaa",​ ou "​aaaa",​ ou "​aaaaa"​. ​ | +''​{m,n}'' ​| Correspond au moins à m fois mais pas plus de n fois l'​élément précédent.\\ Par exemple, ​''​a{3,5}'' ​correspond uniquement "​aaa",​ ou "​aaaa",​ ou "​aaaaa"​. ​ | 
-<​code>​{ }</​code> ​| "​exactement trois fois" par exemple ​<​code>​a{3}</​code> ​correspond aaa seulement. (équivalent de  aaa d'​expression) | +''​{ }'' ​| "​exactement trois fois" par exemple ​''​a{3}'' ​correspond aaa seulement. (équivalent de  aaa d'​expression) | 
-<​code>​{n,}</​code> ​| "​jusqu'​à trois fois". «trois fois ou plus». Par exemple, ​<​code>​a{3,}</​code> ​correspond aaa ou aaaa, etc. (équivalent de <​code>​a*</​code>​) | +''​{n,}'' ​| "​jusqu'​à trois fois". «trois fois ou plus». Par exemple, ​''​{3,}'' ​correspond aaa ou aaaa, etc. (équivalent de ''​a*''​) | 
-<​code>​{,n}</​code> ​<​code>​a{,3}</​code> ​"​jusqu'​à trois fois". Correspond à la chaîne vide ou a ou aa ou aaa (équivalent de <​code>​| a | aa | aaa</​code>​.| +''​{,n}'' ​''​a{,3}'' ​"​jusqu'​à trois fois". Correspond à la chaîne vide ou a ou aa ou aaa (équivalent de ''​| a | aa | aaa''​.| 
-|POSIX extended | Bash avec correctif, sinon il faut \ devant parenthèse et crochet. ​<​code>​\( \)</​code> ​et <​code>​\{ \}</​code>​ FIXME |+|POSIX extended | Bash avec correctif, sinon il faut \ devant parenthèse et crochet. ​''​\( \)'' ​et ''​\{ \}'' ​|
 |autres caractères ​                 | signification ​   | |autres caractères ​                 | signification ​   |
-<​code>​?</​code> ​                   | Correspond zéro ou une fois à l'​élément précédent. Par exemple, ab? c correspond seulement "​ac"​ ou "​abc"​. | +''​?'' ​                   | Correspond zéro ou une fois à l'​élément précédent. Par exemple, ab? c correspond seulement "​ac"​ ou "​abc"​. | 
-<​code>​+</​code> ​                   | Correspond une ou plusieurs fois à l'​élément précédent. Par exemple, ab + c correspond à "​abc",​ "​abbc",​ "​abbbc",​ et ainsi de suite, mais pas "​ac"​. | +''​+'' ​                   | Correspond une ou plusieurs fois à l'​élément précédent. Par exemple, ab + c correspond à "​abc",​ "​abbc",​ "​abbbc",​ et ainsi de suite, mais pas "​ac"​. | 
-<​code>​|</​code> ​      | Correspond à l'​expression d'​avant OU l'​expression d'​après l'​opérateur. Par exemple, ​<​code>​abc|def</​code> ​correspond à "​abc"​ ou "​def"​. | +''​|'' ​      | Correspond à l'​expression d'​avant OU l'​expression d'​après l'​opérateur. Par exemple, ​''​abc|def'' ​correspond à "​abc"​ ou "​def"​. | 
-| Et tous les caractères de class  posix  | voir leur signification ici [[http://​wiki.debian-facile.org/​doc:​programmation:​shell:​regexp#​les-ensembles-de-caracteres-possibles]] ​ | +| Et tous les caractères de class  posix(([[doc:​programmation:​shell:​regexp#​les-ensembles-de-caracteres-possibles]]))  |''​[:alnum:] [:alpha:] [:blank:] [:cntrl:] [:digit:] [:graph:] [:lower:] [:print:] [:punct:] [:space:] [:upper:] [:xdigit:]'' ​   |
-| <​code>​[:alnum:] [:alpha:] [:blank:] [:cntrl:] [:digit:] [:graph:] [:lower:] [:print:] [:punct:] [:space:] [:upper:] [:xdigit:]</​code> ​   ||+
  
    
Ligne 190: Ligne 186:
 done done
 </​code>​ </​code>​
- 
-Retour 
 <​code>​ <​code>​
 1234567 ne correspond pas à 9 nombres 1234567 ne correspond pas à 9 nombres
Ligne 239: Ligne 233:
 ===explication=== ===explication===
  
-  * début de l'​expression +> ''​ ^ ''​ : début de l'​expression
-<​code>​^</​code> ​+
  
-  ​* entre parenthèsespremière sous-expression,​ avec une paire de crochets contenant deux autres paires de crochets apha et blank, avec * pour signifier que le groupe ​(alphablankdoivent apparaître 0 ou plusieurs fois ; suivi d'un espace. +> ''<​nowiki>​([[:​alpha:​][:​blank:​]]*)</​nowiki>''​ :  
-<​code>​([[:​alpha:​][:​blank:​]]*)</​code> ​+>entre parenthèsespremière sous-expression, ​ 
 +>avec une paire de crochets contenant deux autres paires de crochets ​''​[:​apha:​]'' ​et ''​[:​blank:​]''​ 
 +>avec ''​*'' ​pour signifier que le groupe ​[alpha et blankdoivent apparaître 0 ou plusieurs fois ; suivi d'un espace.
  
-  * un tiret avec un espace après comme dans l'​expression littérale. +> ''​ - ''​ : un tiret avec un espace après comme dans l'​expression littérale.
-<​code>​- </​code>​+
  
-  ​* une sous expression faite d'un groupe composé d'un nombre quelconque d'​alphanumérique,​ un espace, un tiret, une autre sous-expression qui apparaît 0 ou 1 fois (?). +> ''​([[:​digit:​]]*) - ([[:​alpha:​]]?​)''​ : une sous expression faite d'un groupe composé d'un nombre quelconque d'​alphanumérique,​ un espace, un tiret, une autre sous-expression qui apparaît 0 ou 1 fois (''​?''​).
-<​code>​([[:​digit:​]]*) - ([[:​alpha:​]]?​)</​code>​+
  
-  * La sous-expression (.*) signifie n'​importe quel nombre (*) de tout caractères (.), puis littéralement jpg, puis $ qui signifie fin de l'​expression ​($).+La sous-expression ​''​(.*)'' ​signifie n'​importe quel nombre ( ''​*'' ​) de tout caractères (''​.''​),  
 +>puis littéralement ​''​jpg''​ 
 +>puis ''​$'' ​qui signifie fin de l'​expression
 + 
 +>Le tout entre ''​ " " ''​ et sans espace autour du égal qui affecte la variable "​regex"​ par la RE.
  
 Et voilà comment avec le shell bash, on peut dresser une expression rationnelle fonctionnant dans les tests !   :-P Et voilà comment avec le shell bash, on peut dresser une expression rationnelle fonctionnant dans les tests !   :-P
  
 <​note>​ <​note>​
-DONC\\ +Pour résumer :\\ 
  
-  *LES EXPRESSIONS RÉGULIÈRES UTILISÉES AVEC LE SHELL BASH NÉCESSITENT L'OPÉRATEUR ​=~ +  * Les expressions régulières utilisées avec le shell Bash nécessitent l'​opérateur ''=~''​ 
-  * ON Y RETROUVE CEUX DES CARACTÈRES GÉNERIQUES ​(globs) ​BASIQUES [ * [ ] ? (avec sens voisin mais étendus par une syntaxe particulière).  +  * On y retrouve ceux des caractères génériques ​(globs) ​basiques ''​*'',​ ''​[ ]'',​ ''​?''​.\\ ​(avec sens voisin mais étendus par une syntaxe particulière).  
-  * ON Y RETROUVENT CEUX DES CARACTÈTRES GÉNÉRIQUES ÉTENDUS [ | @ ! +  ^ (là aussi avec une nouvelle syntaxe).  +  * On y retrouve ceux des caractères génériques étendus ''​|'',​ ''​@'',​ ''​!'',​ ''​+'',​ ''​^''​\\ ​ (là aussi avec une nouvelle syntaxe). ​ 
-  * LES NOUVEAUX CARACTÈRES SONT [   **,** dans { }  **( )** **\n**  ​ainsi que l'​enchâssement de crochets simples.  + 
-  * ELLES NE S'UTILISENT PAS AVEC LA SYNTAXE DE CORRESPONDANCE OU DE SUBSTITUTION DE TYPE  +  * Les nouveaux caractères sont ''​}''​ , ''​( )''​ , ''​\n'', ​ainsi que l'​enchâssement de crochets simples ​''​[ ]''​.  
-<code +  * Elles ne s'utilisent pas avec la syntaxe de correspondance ou de substitution de type ''​<nowiki>​$var/​.../​...</​nowiki>'' ​ou ''<​nowiki>​$var//​.../​...</​nowiki>''​ 
-$var/​.../​... +  * Ce sont les ER d'autres programmes qui recourent à une syntaxe ressemblante\\ ​(voir index correspondance et substitution).  
-ou +  * Beaucoup de ces métacaractères sont identiques à ceux des ER d'autres programmes\\ ​(comparez avec l'​index).
-$var//​.../​... +
-</code+
-  * CE SONT LES ER D'AUTRES PROGRAMMES QUI RECOURENT À UNE SYNTAXE RESSEMBLANTE ​(voir index correspondance et substitution).  +
-  * BEAUCOUP DE CES MÉTA-CARATÈRES SONT IDENTIQUES À CEUX DES ER D'AUTRES PROGRAMMES ​(comparez avec l'​index).+
 </​note>​ </​note>​
  
-====4) un petit script pour s'​exercer au ER==== +====Un script pour s'​exercer au ER==== 
-**Voici un petit script "​exp.reg1" ​qui regroupe les notions étudiées jusqu'​à présent.**\\  +Voici un script "​exp.reg1" ​; il a pour but de s'​exercer aux expressions régulières.\\ ​ 
-Il a pour but de s'​exercer aux expressions régulières.\\ ​+
 <code bash> <code bash>
 #!/bin/bash #!/bin/bash
Ligne 318: Ligne 311:
 # ligne 33 (if) : $? (code de retour) -eq (égal à) zéro (pas d'​erreur de sortie, donc bonne correspondance) # ligne 33 (if) : $? (code de retour) -eq (égal à) zéro (pas d'​erreur de sortie, donc bonne correspondance)
 </​code>​ </​code>​
 +Lancez-le comme ci-dessous, explications détaillées dans le retour :\\ 
  
-**Lancez-le ainsi (explications détaillées dans le retour) :**\\  
-(en considérant que le dossier parent de ce script figure dans $PATH, après modification du fichier ~/​.bashrc\\ ​ 
-voir : [[atelier:​chantier:​debuter-avec-les-scripts-shell-bash#​executer-son-script-depuis-n-importe-ou|3) Exécuter son script depuis n'​importe où !]]) 
 <code user> <code user>
-exp.reg1 "​^[a-b]"​ "​abc"​ "​ABC" ​# ER comme premier argument et le ou les chaînes à vérifier en second, troisième, etc.+./exp.reg1 "​^[a-b]"​ "​abc"​ "​ABC" ​
 </​code>​ </​code>​
 +>La ER comme premier argument de "​exp.reg1",​ puis le ou les chaînes à vérifier en second, troisième, etc. argument de "​exp.reg1"​.
 +
 +Et voilà :-)
  
 +**Un grand merci à captnfab pour conseils avisés et toutes ses corrections.** ​
 =====INDEX ===== =====INDEX =====
 ====1) rappel des principaux caractères des expressions rationnelles ====  ====1) rappel des principaux caractères des expressions rationnelles ==== 
doc/programmation/shells/bash-vii-globs-etendus-regex.txt · Dernière modification: 22/10/2015 18:31 par milou

Pied de page des forums

Propulsé par FluxBB