logo Debian Debian Debian-France Debian-Facile Debian-fr.org Forum-Debian.fr Debian ? Communautés logo inclusivité

Debian-facile

Bienvenue sur Debian-Facile, site d'aide pour les nouveaux utilisateurs de Debian.

Vous n'êtes pas identifié(e).


L'icône rouge permet de télécharger chaque page du wiki visitée au format PDF et la grise au format ODT → ODT PDF Export

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
Prochaine révision
Révision précédente
Prochaine révision Les deux révisions suivantes
doc:programmation:shells:bash-vii-globs-etendus-regex [09/07/2014 10:44]
Hypathie [Rappel et contexte]
doc:programmation:shells:bash-vii-globs-etendus-regex [09/07/2014 11:59]
Hypathie [Correspondance de motifs avec les expressions rationnelles]
Ligne 63: Ligne 63:
 Notons l'​option shopt -s nocasematch (bash version 3.1) permet de retirer la sensibilité à la case. Notons l'​option shopt -s nocasematch (bash version 3.1) permet de retirer la sensibilité à la case.
  
-====Les globs étendus dans le terminal====  +====Les globs étendus dans le terminal==== 
-Par exemple, prenons ​un fichier de type répertoire nommé "​Test"​ contenant les fichiers : image.bmp ​ image.jpg ​ nom.txt+  
 +===Préparation=== 
 +<code user> 
 +mkdir Test && cd Test && touch image.bmp ​ image.jpg ​ nom.txt && cd .. 
 +</​code>​ 
 +>​Création d'un fichier de type répertoire nommé "​Test"​contenant les fichiers : image.bmp ​ image.jpg ​ nom.txt 
 + 
 +===Exercice===
  
 <code user> <code user>
 shopt -s extglob shopt -s extglob
 </​code>​ </​code>​
-Valider ensuite ​toujours dans le même terminal ​:+ 
 +>Pour les commandes qui suivent, il faut valider ​toujours dans le même terminal.
  
 <code user> <code user>
 ls ~/​Test/​!(*jpg|*bmp) ls ~/​Test/​!(*jpg|*bmp)
 </​code>​ </​code>​
 +
 +>Cela signifie : liste-moi le ou les fichiers dont le nom ne comporte pas (''​!''​)
 +>soit "zéro ou plein de caractères"​ (''​*''​) puis ''​jpg''​
 +>soit "zéro ou plein de caractères"​ (''​*''​) puis ''​bmp'' ​
 +
 <​code>​ <​code>​
 /​home/​hypathie/​Test/​nom.txt /​home/​hypathie/​Test/​nom.txt
 </​code>​ </​code>​
  
-Ou encore avec le même exemple :+>​C'​est ​le chemin absolu (nom complet) du (ou des) autre(s) fichiers que ceux finissant par ''​jpg''​ ou ''​bmp''​. 
 + 
 +  * à propos de cet exemple : 
 <code user> <code user>
  cd ~/Test/  cd ~/Test/
 </​code>​ </​code>​
-PUIS :+
 <code user> <code user>
-ls  +ls !(*jpg|*bmp)
-</​code>​ +
-Retour : +
-<​code>​ +
-image.bmp ​ image.jpg ​ nom.txt +
-</​code>​ +
-PUIS : +
-<code user> +
-echo !(*jpg|*bmp)+
 </​code>​ </​code>​
 +
 <​code>​ <​code>​
 nom.txt nom.txt
 </​code>​ </​code>​
 +
 +>​C'​est le nom simplifié
  
 ==== Les globs étendus dans les scripts==== ==== Les globs étendus dans les scripts====
Ligne 138: Ligne 149:
  
 =====Correspondance de motifs avec les expressions rationnelles===== =====Correspondance de motifs avec les expressions rationnelles=====
-==== L'​opérateur de correspondance =~ d'une expression rationnelle dans une expression de tests [[  ]] ====+==== L'​opérateur de correspondance =~ ====
  
-Certaines ​expressions régulières ​peuvent être utilisées avec bash, mais elles ne peuvent pas être utilisée comme modèle de comparaison avec des noms de fichier pour effectuer des recherches en ligne de commandes. Elles matchent ​des variables et s'​utilisent dans le cadres des scripts.\\ ​+Bash peut utiliser les expressions régulières mais de façon restreinte.\\ Elles ne peuvent pas être utilisée comme modèle de comparaison avec des noms de fichier ​ou pour effectuer des recherches en ligne de commandes.\\ Elles servent seulement à "​matcher" ​des variableset elles ne s'​utilisent ​que dans le cadres des scripts.\\ ​
  
-Les expressions régulières reconnues par Bash sont nommées ERE ("​expression régulière étendues"​).\\  +Depuis __Bash 3.0__, on peut pour se faire utiliser l'​opérateur ''​=~''​.\\ Cet opérateur ''​=~''​ permet ​
-Depuis __Bash 3.0__, on peut pour se faire utiliser l'​opérateur ''​=~''​.\\ Cet opérateur ''​=~''​ permet ​alors de vérifier la correspondre entre une chaîne (valeur d'une variable à gauche) et le modèle regex à droite.\\  +  * de vérifier la correspondre entre une chaîne (valeur d'une variable à gauche) et le modèle regex à droite ​; 
-Ou encore de vérifier la correspondance entre une variable constituée d'une chaîne de caractères littérales,​ et une variable constituée d'une regex.\\ +  * ou encore de vérifier la correspondance entre une variable ​(constituée d'une chaîne de caractères littérales), et une variable constituée d'une regex. 
-Voici quelques liens qui présentent la syntaxe et les caractères utilisables avec Bash sans les commandes grep, sed, awk.\\ ​+ 
 +Voici quelques liens qui présentent la syntaxe et les caractères utilisables avec Bash (sans les commandes ​''​grep''​''​sed''​''​awk''​).\\ 
   * [[http://​mywiki.wooledge.org/​RegularExpression]]\\ ​   * [[http://​mywiki.wooledge.org/​RegularExpression]]\\ ​
-  * [[https://​en.wikipedia.org/​wiki/​Regular_expression#​Standards]]\\ ​+ 
  
 +<​note>​
 +À savoir :\\
 Lorsque la chaîne correspond au motif, le code retour du test renvoie 0 pour vrai, sinon, il renvoie 1 pour faux.\\ ​ Lorsque la chaîne correspond au motif, le code retour du test renvoie 0 pour vrai, sinon, il renvoie 1 pour faux.\\ ​
 Si la syntaxe du pattern n'est pas valide le code de retour est 2.\\  Si la syntaxe du pattern n'est pas valide le code de retour est 2.\\ 
  
-Lorsqu'​une chaîne correspond, chacune des parties du motif sont disponibles dans la variable $BASH_REMATCH. +Lorsqu'​une chaîne correspond, chacune des parties du motif sont disponibles dans la variable ​''​$BASH_REMATCH''​
- +</​note>​ 
-==== Liste des caractères utilisés dans les expressions régulières étendues====+==== Tableau ​des caractères utilisés dans les expressions régulières étendues====
  
 **Voici les caractères utilisables :** **Voici les caractères utilisables :**
 ^ "​signes"​ regex ERE basique ​ ^ signification (comparez avec le tableau de l'​index) ​            ^ ^ "​signes"​ regex ERE basique ​ ^ signification (comparez avec le tableau de l'​index) ​            ^
-| ''​.''​ | Correspond à tout caractère unique. ​Dans expressions POSIX entre crochets, le caractère point correspond à un point littéral ​+| ''​.''​ | Correspond à tout caractère unique. ​ 
-| ''​[ ]''​ | Correspond à un seul caractère qui est contenue dans les parenthèses. On peut mélanger [abcx-z] correspond à "a""b""c""x""y" ​ou "z", de même que [a-cx-z]. Le caractère - est traité comme un caractère littéral si c'est le dernier ou le premier. ​ | +| ''​[ ]''​ | Correspond à un seul caractère qui est contenue dans ''​[ ]''​. On peut mélanger [abcx-z] correspond à ''​a''​''​b''​''​c''​''​x''​''​y'' ​ou ''​z''​, de même que ''​[a-cx-z]''​. Le caractère ​''​-'' ​est traité comme un caractère littéral si c'est le dernier ou le premier. ​ | 
-| ''​[^ ]''​ | Correspond à un seul caractère qui n'est pas contenu dans les parenthèses. Par exemple, ''​[^ abc]''​ correspond à tout caractère autre que "a""b" ​ou "c". |+| ''​[^ ]''​ | Correspond à un caractère qui n'est pas contenu dans les parenthèses. Par exemple, ''​[^abc]''​ correspond à tout caractère autre que a, b ou c. |
 | ''​^ '' ​ | Correspond à la position de départ dans la chaîne. | | ''​^ '' ​ | Correspond à la position de départ dans la chaîne. |
 | ''​$''​ | Correspond à la position de fin de la chaîne ou la position juste avant un saut de ligne de chaîne interminable. ​  | | ''​$''​ | Correspond à la position de fin de la chaîne ou la position juste avant un saut de ligne de chaîne interminable. ​  |
-| ''​( )''​ | Définit une sous-expression marquée. La chaîne correspondante entre parenthèses peut être rappelé plus tard (voir l'​entrée suivante, \ n). Une sous-expression marquée est aussi appelé un groupe de blocs ou de capturer. Mode BRE nécessite \ (\). | +| ''​( )''​ | Définit une sous-expression marquée. La chaîne correspondante entre parenthèses peut être rappelé plus tard (voir l'​entrée suivante, ​''​\ n''​). Une sous-expression marquée est aussi appelé un groupe de blocs ou de capturer. Mode BRE nécessite \ (\). | 
-| ''​\n''​ | Correspond au nombre n de sous-chaîne,​ où n est un chiffre de 1 à 9.\\ Écriture équivalente à {n}  |   +| ''​\n''​ | Correspond au nombre ​''​n'' ​de sous-chaîne,​ où ''​n'' ​est un chiffre de 1 à 9.\\ Écriture équivalente à ''​{n}'' ​ ​| ​  
-| ''​*''​ | Correspond à zéro ou plusieurs fois l'​élément précédent.\\ Par exemple, ''​ab * c''​ correspond à "​ac",​ "​abc",​ "​abbbc»,​ etc. Ou encore, ''​[xyz] *''​ correspond à " ", "x""y""z""zx""zyx""xyzzy ", et ainsi de suite. ''​(ab) *''​ correspond à ""​"b""abab""ababab", et ainsi de suite. | +| ''​*''​ | Correspond à zéro ou plusieurs fois l'​élément précédent.\\ Par exemple, ''​ab* c''​ correspond à "​ac",​ "​abc",​ "​abbbc»,​ etc. Ou encore, ''​[xyz]*''​ correspond à ''​x''​''​y''​''​z''​''​zx''​''​zyx''​''​xyzzy''​, et ainsi de suite. ''​(ab)*''​ correspond à ''​a''​''​b''​''​abab''​''​ababab''​, et ainsi de suite. | 
-| ''​{m,​n}''​ | Correspond ​au moins à m fois mais pas plus de n fois l'élément précédent.\\ Par exemple, ''​a{3,​5}''​ correspond uniquement ​"aaa", ou "aaaa", ou "aaaaa".  | +| ''​{m,​n}''​ | l'​élément précédent correspond ​au moins à ''​m'' ​foismais pas plus de ''​n'' fois .\\ Par exemple, ''​a{3,​5}''​ correspond uniquement ​''​aaa''​, ou ''​aaaa''​, ou ''​aaaaa''​.  | 
-| ''​{ }''​ | "​exactement trois fois" par exemple ''​a{3}''​ correspond aaa seulement(équivalent de  aaa d'​expression) ​|+| ''​{ }''​ | "​exactement trois fois" par exemple ''​a{3}''​ correspond ​strictement à ''​aaa'' ​. |
 | ''​{n,​}''​ | "​jusqu'​à trois fois". «trois fois ou plus». Par exemple, ''​{3,​}''​ correspond aaa ou aaaa, etc. (équivalent de ''​a*''​) | | ''​{n,​}''​ | "​jusqu'​à trois fois". «trois fois ou plus». Par exemple, ''​{3,​}''​ correspond aaa ou aaaa, etc. (équivalent de ''​a*''​) |
-| ''​{,​n}''​ | ''​a{,​3}''​ "​jusqu'​à trois fois". Correspond à la chaîne vide ou a ou aa ou aaa (équivalent de ''​a | aa | aaa''​.|+| ''​{,​n}''​ | ''​a{,​3}''​ "​jusqu'​à trois fois". Correspond à la ''​chaîne vide'' ​ou ''​a'' ​ou ''​aa'' ​ou ''​aaa'' ​(équivalent de ''​a|aa|aaa''​.|
 |POSIX extended | Bash avec correctif, sinon il faut \ devant parenthèse et crochet. ''​\( \)''​ et ''​\{ \}''​ | |POSIX extended | Bash avec correctif, sinon il faut \ devant parenthèse et crochet. ''​\( \)''​ et ''​\{ \}''​ |
 |autres caractères ​                 | signification ​   | |autres caractères ​                 | signification ​   |
-| ''?'' ​                   | Correspond zéro ou une fois à l'​élément précédent. Par exemple, ab? c correspond seulement ​"ac" ​ou "abc". | +| ''?'' ​                   | Correspond zéro ou une fois à l'​élément précédent. Par exemple, ​''​ab?c'' ​correspond seulement ​''​ac'' ​ou ''​abc''​. | 
-| ''​+'' ​                   | Correspond une ou plusieurs fois à l'​élément précédent. Par exemple, ab + c correspond à "abc""abbc""abbbc", et ainsi de suite, mais pas "​ac"​. | +| ''​+'' ​                   | Correspond une ou plusieurs fois à l'​élément précédent. Par exemple, ​''​ab+c'' ​correspond à ''​abc''​''​abbc''​''​abbbc''​, et ainsi de suite, mais pas "​ac"​. | 
-| ''​|'' ​      | Correspond à l'​expression d'​avant ​OU l'​expression d'​après l'​opérateur. Par exemple, ''​abc|def''​ correspond à "abc" ​ou "def". | +| ''​|'' ​      | Correspond à l'​expression d'​avant ​''​ou'' ​l'​expression d'​après l'​opérateur. Par exemple, ''​abc|def''​ correspond à ''​abc'' ​ou ''​def''​. | 
-| Et tous les caractères de [[doc:​programmation:​shell:​regexp#​les-ensembles-de-caracteres-possibles|les classes prédéfinies]]. ​ |''​[:​alnum:​] [:alpha:] [:blank:] [:cntrl:] [:digit:] [:graph:] [:lower:] [:print:] [:punct:] [:space:] [:upper:] [:​xdigit:​]'' ​   |+| Et toutes ​[[doc:​programmation:​shell:​regexp#​les-ensembles-de-caracteres-possibles|les classes prédéfinies]]. ​ |''​[:​alnum:​] [:alpha:] [:blank:] [:cntrl:] [:digit:] [:graph:] [:lower:] [:print:] [:punct:] [:space:] [:upper:] [:​xdigit:​]'' ​   |
  
 +  * Référence : 
 +    * [[https://​en.wikipedia.org/​wiki/​Regular_expression#​Standards]]
 +    * [[https://​en.wikipedia.org/​wiki/​Regular_expression#​Standards#​Uses]]
 +    * [[https://​en.wikipedia.org/​wiki/​Regular_expression#​Standards#​Character%20classes]]
    
 ==== Apprenons à construire une expression régulière==== ​ ==== Apprenons à construire une expression régulière==== ​
Ligne 199: Ligne 217:
 </​code>​ </​code>​
  
- +  * Ou encore :
-Ou encore :+
  
 <code bash> <code bash>
Ligne 237: Ligne 254:
 Le nom de l'​image correspond à l'​expression rationnelle. Le nom de l'​image correspond à l'​expression rationnelle.
 </​code>​ </​code>​
-===explication===+ 
 +  * Explication :
  
 > ''​ ^ ''​ : début de l'​expression > ''​ ^ ''​ : début de l'​expression
Ligne 272: Ligne 290:
  
 ====Un script pour s'​exercer au ER==== ====Un script pour s'​exercer au ER====
-Voici un script "​exp.reg1" ​; il a pour but de s'​exercer aux expressions régulières.\\ ​+  * Voici un script "​exp.reg1" ​
  
 <code bash> <code bash>
Ligne 317: Ligne 335:
 # ligne 33 (if) : $? (code de retour) -eq (égal à) zéro (pas d'​erreur de sortie, donc bonne correspondance) # ligne 33 (if) : $? (code de retour) -eq (égal à) zéro (pas d'​erreur de sortie, donc bonne correspondance)
 </​code>​ </​code>​
-Lancez-le comme ci-dessous, explications détaillées dans le retour :\\ +  * Lancez-le comme ci-dessous, explications détaillées dans le retour :\\ 
  
 <code user> <code user>
doc/programmation/shells/bash-vii-globs-etendus-regex.txt · Dernière modification: 22/10/2015 18:31 par milou

Pied de page des forums

Propulsé par FluxBB