logo Debian Debian Debian-France Debian-Facile Debian-fr.org Forum-Debian.fr Debian ? Communautés logo inclusivité

Debian-facile

Bienvenue sur Debian-Facile, site d'aide pour les nouveaux utilisateurs de Debian.

Vous n'êtes pas identifié(e).


L'icône rouge permet de télécharger chaque page du wiki visitée au format PDF et la grise au format ODT → ODT PDF Export

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
Prochaine révision
Révision précédente
Prochaine révision Les deux révisions suivantes
doc:programmation:shells:bash-vii-globs-etendus-regex [07/08/2014 09:40]
Hypathie [Rappel et contexte]
doc:programmation:shells:bash-vii-globs-etendus-regex [07/10/2015 18:04]
milou [Différents contextes, différentes significations, globs et regexp]
Ligne 1: Ligne 1:
-======Bash : globs étendus ​et regex======+======Bash : Variables, ​globs étendus, ERb, ERe======
  
   * Objet : suite de la série de wiki visant à maîtriser bash via les différents caractère spéciaux.   * Objet : suite de la série de wiki visant à maîtriser bash via les différents caractère spéciaux.
-  * Niveau requis : {{avisé}}+  * Niveau requis : {{tag>avisé}} 
 +  * Commentaires : FIXME
   * Débutant, à savoir : [[:​doc:​systeme:​commandes:​le_debianiste_qui_papillonne|Utiliser GNU/Linux en ligne de commande, tout commence là !.]] :-)   * Débutant, à savoir : [[:​doc:​systeme:​commandes:​le_debianiste_qui_papillonne|Utiliser GNU/Linux en ligne de commande, tout commence là !.]] :-)
-  * Suivi : {{à-placer}} ​ +  * Suivi : 
-    * Création par [[user>​Hypathie]] 10/​04/​2014 +    * Création par [[user>​Hypathie]] ​le 10/​04/​2014 
-    * Testé par <​Hypathiele <Avril 2014>+    * Testé par [[user>Hypathie]] ​Avril 2014
   * Commentaires sur le forum : [[:​url-invalide | Lien vers le forum concernant ce tuto]] ((N'​hésitez pas à y faire part de vos remarques, succès, améliorations ou échecs !))   * Commentaires sur le forum : [[:​url-invalide | Lien vers le forum concernant ce tuto]] ((N'​hésitez pas à y faire part de vos remarques, succès, améliorations ou échecs !))
  
  
  
-  * [[atelier:chantier:​bash-les-differents-caracteres-speciaux|Vision d'​ensemble]] +  * [[doc:programmation:​shells:​bash-les-differents-caracteres-speciaux|Vision d'​ensemble]] 
-  * [[atelier:chantier:​la-page-man-bash-les-caracteres-speciaux|Bash : Détail et caractères]] +  * [[docs:programmation:​shells:​la-page-man-bash-les-caracteres-speciaux|Bash : Détail et caractères]] 
-  * [[atelier:chantier:​la-page-man-bash-ii-les-operateurs-lexicographiques|Bash : les opérateurs lexicographiques]] +  * [[doc:programmation:​shells:​la-page-man-bash-ii-les-operateurs-lexicographiques|Bash : les opérateurs lexicographiques]] 
-  * [[atelier:chantier:​page-man-bash-iii-les-operateurs-de-comparaison-numerique|Bash : les opérateurs de comparaison numérique]] +  * [[doc:programmation:​shells:​page-man-bash-iii-les-operateurs-de-comparaison-numerique|Bash : les opérateurs de comparaison numérique]] 
-  * [[atelier:chantier:​page-man-bash-iv-symboles-dans-les-calculs-mathematiques|Bash : les symboles dans les calculs]] +  * [[doc:programmation:​shells:​page-man-bash-iv-symboles-dans-les-calculs-mathematiques|Bash : les symboles dans les calculs]] 
-  * [[atelier:chantier:​page-man-bash-v-les-tableaux|Bash : les tableaux]] +  * [[doc:programmation:​shells:​page-man-bash-v-les-tableaux|Bash : les tableaux]] 
-  * [[atelier:chantier:​man-bash-vi-les-caracteres-de-transformation-de-parametres|Bash : les caractères de transformation de parametres]]+  * [[doc:​programmation:shells:​man-bash-vi-les-caracteres-de-transformation-de-parametres|Bash : les caractères de transformation de parametres]]
   * ;-)   * ;-)
  
 +**Nota :** Contributeurs,​ les FIXME sont là pour vous aider, supprimez-les une fois le problème corrigé ou le champ rempli !
  
-=====Rappel et contexte===== 
  
-La "​représentation symbolique"​((en anglais : "​matching"​)) de caractères alpha-numériques par des "​métacaractères"​((termes employé là dans un sens général : [[http://​fr.wiktionary.org/​wiki/​m%C3%A9tacaract%C3%A8re]])) est de deux types. Et on peut distinguer ces deux types relativement à l'​utilisation que l'on en fait :\\ +=====Différents contextes, différentes significations,​ globs et regexp===== 
 + 
 +La "​représentation symbolique"​((en anglais : "​matching"​)) de caractères alpha-numériques par des "​métacaractères"​((termes employé là dans un sens général : [[http://​fr.wiktionary.org/​wiki/​m%C3%A9tacaract%C3%A8re]])) est de deux types.\\  
 +Et on peut distinguer ces deux types relativement à l'​utilisation que l'on en fait :\\ 
   - __sélectionner__ des noms de fichiers dans un répertoire ;\\    - __sélectionner__ des noms de fichiers dans un répertoire ;\\ 
   - __déterminer__ si une chaîne est conforme à un format désiré.\\ ​   - __déterminer__ si une chaîne est conforme à un format désiré.\\ ​
  
  
-===Rappel : === +====Rappel : les métacaractères==== 
-__Le premier type de représentation symbolique__ se fait avec [[doc:​programmation:​shell:​les-metacaracteres|les globs ou patterns simples]]((désignés aussi de "​caractères génériques"​)) ; ils servent aux recherches sur les chaînes de caractères et se font généralement en ligne de commandes.\\ Il a été donné un simple récapitulatif des caractères utilisés ici : [[atelier:chantier:​bash-les-differents-caracteres-speciaux#​definition-usuelle-de-metacaractere-et-detail|définition usuelle de métacaractère"​]].\\+__Le premier type de représentation symbolique__ se fait avec [[doc:​programmation:​shell:​les-metacaracteres|les globs ou patterns simples]]((désignés aussi de "​caractères génériques"​)) ; ils servent aux recherches sur les chaînes de caractères et se font généralement en ligne de commandes.\\ Il a été donné un simple récapitulatif des caractères utilisés ici : [[doc:​programmation:shells:​bash-les-differents-caracteres-speciaux#​definition-usuelle-de-metacaractere-et-detail|définition usuelle de métacaractère"​]].\\
  
-===Distinguer le "​globbing"​ étendu des expressions régulières === +====Distinguer le "​globbing"​ étendu des expressions régulières ​==== 
-__Le deuxième type de de représentation symbolique__ se fait (à partir de ''​bash 2.01''​) avec [[atelier:​chantier:​bash-vii-globs-etendus-regex#​les-globs-etendus|les globs étendus ]]((appelés aussi "​patterns longs" ; en anglais "​extended patterns"​)),​ étudiés ci-dessous ; on les utilise pour effectuer des tests de correspondances simples, en ligne de commandes ou dans des scripts, ou pour [[atelier:chantier:​man-bash-vi-les-caracteres-de-transformation-de-parametres|modifier les paramètres d'une variable]].\\ ​+__Le deuxième type de de représentation symbolique__ se fait (à partir de ''​bash 2.01''​) avec [[atelier:​chantier:​bash-vii-globs-etendus-regex#​les-globs-etendus|les globs étendus ]]((appelés aussi "​patterns longs" ; en anglais "​extended patterns"​)),​ étudiés ci-dessous ; on les utilise pour effectuer des tests de correspondances simples, en ligne de commandes ou dans des scripts, ou pour [[doc:programmation:​shells:​man-bash-vi-les-caracteres-de-transformation-de-parametres|modifier les paramètres d'une variable]].\\ ​
  
-===Distinguer les expressions régulières ​de Bash de celles d'​autres programmes=== +====Distinguer les expressions régulières ​utilisable avec le shell, ​de celles d'​autres programmes==== 
-  * __Ce deuxième type de représentation symbolique__ s'est développé avec ''​Bash 3.0''​ auquel il a été intégré la possibilité d'une utilisation restreinte des expressions régulières.\\ Mais attention, il ne s'​agit ​plus alors de recherches de noms de fichiers ou de mots, ni de modifications de paramètres.\\ ​ On s'en sert uniquement pour la correspondance entre une variable et une expression régulière,​ jamais pour la substitution telle que le permet ​l'​utilisation avancée des expressions régulières+  * __Ce deuxième type de représentation symbolique__ s'est développé avec ''​Bash 3.0''​ auquel il a été intégré la possibilité d'une utilisation restreinte des expressions régulières.\\ Mais attention, il ne s'​agit ​pas de recherches de noms de fichiers ou de mots (le contexte n'est plus la ligne de commandes), ni de modifications de paramètres.\\ ​ On s'en sert uniquement pour la correspondance entre une variable et une expression régulière,​ jamais pour la substitution ​ou la correspondance ​telle que le permet ​sed et awk
  
-  * On retrouve ce deuxième type de représentation symbolique avec __l'​usage avancé des expressions régulières__.\\ Mais elles permettent bien plus que ce que nous allons voir ici. En particulier,​ la substitution de caractères dans un fichier (exécutable ou non).\\ Il est nécessaire pour utiliser [[doc:​programmation:​shell:​regexp|les regexp]] d'en passer par __des programmes externes et spécifiques à l'​utilisation des expressions régulières__ (''​egrep'',​ ''​sed'',​ ''​awk''​ par exemple).\\ Ci-dessous [[atelier:​chantier:​bash-vii-globs-etendus-regex#​index-1caracteres-des-erb-et-ere-avec-grep-grep-e-sed-sed-r|l'​index 1]] donne un simple aperçu des caractères utilisables pour les //ERb// et //ERe// des différents programmes externes au shell Bash, et déborde donc du sujet, si ne n'est que le shell Bash permet de les installer puis de les lancer.\\ À voir :+  * On retrouve ce deuxième type de représentation symbolique avec __l'​usage avancé des expressions régulières__.\\ Mais elles permettent bien plus que ce que nous allons voir ici. En particulier,​ la substitution de caractères dans un fichier (exécutable ou non).\\ Il est nécessaire pour utiliser [[doc:​programmation:​shell:​regexp|les regexp]] d'en passer par __des programmes externes et spécifiques à l'​utilisation des expressions régulières__ (''​egrep'',​ ''​sed'',​ ''​awk''​ par exemple).\\ Ci-dessous [[atelier:​chantier:​bash-vii-globs-etendus-regex#​index-1caracteres-des-erb-et-ere-avec-grep-grep-e-sed-sed-r-et-awk|l'​index 1]] donne un simple aperçu des caractères utilisables pour les //ERb// et //ERe// des différents programmes externes au shell Bash, et déborde donc du sujet, si ne n'est que le shell Bash permet de les installer puis de les lancer.\\ À voir :
     * [[doc:​programmation:​shell:​les-metacaracteres]]     * [[doc:​programmation:​shell:​les-metacaracteres]]
     * [[doc:​systeme:​grep]]     * [[doc:​systeme:​grep]]
Ligne 43: Ligne 47:
    
  
->Nous allons développer dans cette page le deuxième type de de représentation symbolique, ce qui recouvrira l'​utilisation des globs étendus et l'​utilisation des expressions régulières ​(restreintes) ​spécifiques au shell Bash.+>**Nous allons développer dans cette page le deuxième type de de représentation symbolique, ce qui recouvrira l'​utilisation des globs étendus et l'​utilisation des expressions régulières spécifiques au shell Bash mais utilisables uniquement dans le contexte de la correspondance avec la chaîne d'une variable.**
  
 Puisque tout est bien clair, c'est parti ! 8-) Puisque tout est bien clair, c'est parti ! 8-)
Ligne 171: Ligne 175:
 </​note>​ </​note>​
 ==== Caractères servant aux expressions régulières de correspondance avec une variable==== ==== Caractères servant aux expressions régulières de correspondance avec une variable====
-Encore une fois, tous les caractères ci-dessous, ont la signification décrite ​pour le shell bash __uniquement__ dans ce contexte de correspondance de motif entre variable et //​ERb// ​et //​ERe//​.\\ ​  +Encore une fois, pour le shell bash, tous les caractères ci-dessous, ont la signification décrite __uniquement__ dans ce contexte de correspondance de motif entre variable et //​ERb// ​ou //​ERe//​.\\  ​ 
-Ne pas confondre la signification de certains des caractères présentés par ce tableau ​ ​qui ​ont une signification différentes ​pour le shell __dans le contexte de la ligne de commandes__.\\  + 
-Le tableau rappelle ​aussi la signification des caractères pour lesquels la confusion est possible.+Ne pas confondre la signification de certains des caractères présentés par ce tableau, avec celle qu'​ils ​ont pour le shell __dans le contexte de la ligne de commandes__.\\ ​ 
 + 
 +Le tableau rappelle ​pour cette raison, ​la signification des caractères pour lesquels la confusion est possible ​avec leur utilisation en ligne de commandes((avec echo, ls, rm, etc.)).
  
 **Voici les caractères utilisables :** **Voici les caractères utilisables :**
-^ "​signes"​ regex ERE basique ​ ^ significations (comparez avec le tableau de l'​index) ​            ​^+^ "​signes"​ regex ERE basique ​ ^ significations (comparez avec le tableau de [[atelier:​chantier:​bash-vii-globs-etendus-regex#​index-1caracteres-des-erb-et-ere-avec-grep-grep-e-sed-sed-r-et-awk|l'​index ​1]]       ^
 | **''​.''​** | Correspond à tout caractère unique.\\ (Attention en ligne de commandes le point représente le répertoire courant.) ​ | | **''​.''​** | Correspond à tout caractère unique.\\ (Attention en ligne de commandes le point représente le répertoire courant.) ​ |
 | **''​*''​** | Correspond à zéro ou plusieurs fois l'​élément précédent.\\ Par exemple, ''​ab* c''​ correspond à "​ac",​ "​abc",​ "​abbbc»,​ etc. Ou encore, ''​[xyz]*''​ correspond à ''​x'',​ ''​y'',​ ''​z'',​ ''​zx'',​ ''​zyx'',​ ''​xyzzy'',​ et ainsi de suite. ''​(ab)*''​ correspond à ''​a'',​ ''​b'',​ ''​abab'',​ ''​ababab'',​ et ainsi de suite.\\ (Attention en ligne de commandes, **''​*''​** signifie "​tout"​ : ''​rm blabla*''​ -> supprime tout ce qui commence par blabla dans le répertoire courant)| | **''​*''​** | Correspond à zéro ou plusieurs fois l'​élément précédent.\\ Par exemple, ''​ab* c''​ correspond à "​ac",​ "​abc",​ "​abbbc»,​ etc. Ou encore, ''​[xyz]*''​ correspond à ''​x'',​ ''​y'',​ ''​z'',​ ''​zx'',​ ''​zyx'',​ ''​xyzzy'',​ et ainsi de suite. ''​(ab)*''​ correspond à ''​a'',​ ''​b'',​ ''​abab'',​ ''​ababab'',​ et ainsi de suite.\\ (Attention en ligne de commandes, **''​*''​** signifie "​tout"​ : ''​rm blabla*''​ -> supprime tout ce qui commence par blabla dans le répertoire courant)|
Ligne 186: Ligne 192:
 | **''​[:​class:​]''​**\\ [[doc:​programmation:​shell:​regexp#​les-ensembles-de-caracteres-possibles|les classes prédéfinies]] ​ |''​[:​alnum:​] [:alpha:] [:blank:] [:cntrl:] [:digit:] [:graph:] [:lower:] [:print:] [:punct:] [:space:] [:upper:] [:​xdigit:​]'' ​   | | **''​[:​class:​]''​**\\ [[doc:​programmation:​shell:​regexp#​les-ensembles-de-caracteres-possibles|les classes prédéfinies]] ​ |''​[:​alnum:​] [:alpha:] [:blank:] [:cntrl:] [:digit:] [:graph:] [:lower:] [:print:] [:punct:] [:space:] [:upper:] [:​xdigit:​]'' ​   |
 |**''​\( \)''​** et **''​\{ \}''​** | Avec les ERb le caractère ''​\''​ donne un sens particulier aux parenthèses et accolades.\\ (anciennes versions de Bash)\\ Mais avec les ERe le caractère ''​\''​ échappe la signification spéciale des parenthèses et des crochets | |**''​\( \)''​** et **''​\{ \}''​** | Avec les ERb le caractère ''​\''​ donne un sens particulier aux parenthèses et accolades.\\ (anciennes versions de Bash)\\ Mais avec les ERe le caractère ''​\''​ échappe la signification spéciale des parenthèses et des crochets |
-|**Caractères des ERe**\\ Bash 3.0 les reconnaît dans le contexte des regroupement ​       ​| **Significations** ​   |+|**Caractères des ERe**\\ ​reconnus depuis ​Bash 3.0      | **Significations** ​   |
 | **''?''​** ​                   | Correspond zéro ou une fois à le regroupement précédent. Par exemple, ''​[er]?''​ correspond à la sous-chaîne "​er"​ pouvant être présente ou pas dans une chaîne.\\ (//​Attention en ligne de commandes **''?''​** signifie "un caractère quelconque et un seul"//​) | | **''?''​** ​                   | Correspond zéro ou une fois à le regroupement précédent. Par exemple, ''​[er]?''​ correspond à la sous-chaîne "​er"​ pouvant être présente ou pas dans une chaîne.\\ (//​Attention en ligne de commandes **''?''​** signifie "un caractère quelconque et un seul"//​) |
 | **''​+''​** ​                   | Correspond une ou plusieurs fois à le regroupement précédent. Par exemple, ''​[er]+''​ correspond à ''​er'',​ ''​erer'',​ ''​ererer'',​ et ainsi de suite, mais pas être absente. | | **''​+''​** ​                   | Correspond une ou plusieurs fois à le regroupement précédent. Par exemple, ''​[er]+''​ correspond à ''​er'',​ ''​erer'',​ ''​ererer'',​ et ainsi de suite, mais pas être absente. |
Ligne 193: Ligne 199:
 | **''​( )''​** | Regroupement | | **''​( )''​** | Regroupement |
 | **''​{m,​n}''​** | l'​élément précédent correspond au moins à ''​m''​ fois, mais pas plus de ''​n''​ fois .\\ Par exemple, ''​a{3,​5}''​ correspond uniquement ''​aaa'',​ ou ''​aaaa'',​ ou ''​aaaaa''​. ​ | | **''​{m,​n}''​** | l'​élément précédent correspond au moins à ''​m''​ fois, mais pas plus de ''​n''​ fois .\\ Par exemple, ''​a{3,​5}''​ correspond uniquement ''​aaa'',​ ou ''​aaaa'',​ ou ''​aaaaa''​. ​ |
-| **''​{ }''​** | "​exactement trois fois" le caractère ou le regroupement par exemple ''​a{3}''​ correspond strictement à ''​aaa''​ ; [er]{2} deux fois la er. |+| **''​{ }''​** | "​exactement trois fois" le caractère ou le regroupement par exemple ''​a{3}''​ correspond strictement à ''​aaa''​ ;\\ **''​[er]{2}''​** ​deux fois "er". |
 | **''​{n,​}''​** | "​n"​ fois ou plus, le caractère ou le regroupement précédent. Par exemple, ''​{3,​}''​ "trois fois ou plus" correspond aaa ou aaaa, etc. (équivalent de ''​a*''​) | | **''​{n,​}''​** | "​n"​ fois ou plus, le caractère ou le regroupement précédent. Par exemple, ''​{3,​}''​ "trois fois ou plus" correspond aaa ou aaaa, etc. (équivalent de ''​a*''​) |
 | **''​{,​n}''​** | au plus "​n"​ fois, le caractère ou le regroupement précédent. ''​[ER]{,​3}''​ "​jusqu'​à trois fois" groupe de ER. | | **''​{,​n}''​** | au plus "​n"​ fois, le caractère ou le regroupement précédent. ''​[ER]{,​3}''​ "​jusqu'​à trois fois" groupe de ER. |
Ligne 292: Ligne 298:
   * On retrouve dans ce contexte les caractères génériques (globs) basiques ''​*''​ ''?''​ mais avec un sens différent. ​   * On retrouve dans ce contexte les caractères génériques (globs) basiques ''​*''​ ''?''​ mais avec un sens différent. ​
   ​   ​
-  * On retrouve dans ce contexte les caractères génériques étendus ''​|'',​ ''​@'',​ ''​!'',​ ''​+'',​ ''​^''​\\ ​ (là aussi avec une nouvelle syntaxe). ​+  * On retrouve dans ce contexte les caractères génériques étendus ''​|'',​ ''​@'',​ ''​!'',​ ''​+'',​ ''​^''​\\ ​ (là avec un sens différent et une nouvelle syntaxe). ​
  
   * Les nouveaux caractères sont ''​+''​ , ''​|''​ , ''​[ - ]''​ , ''​{ , }''​ , ''​( )''​ , ''​\n'',​ ainsi que  ''​[ ]{n}''​ et ''​[:​class:​]''​. ​   * Les nouveaux caractères sont ''​+''​ , ''​|''​ , ''​[ - ]''​ , ''​{ , }''​ , ''​( )''​ , ''​\n'',​ ainsi que  ''​[ ]{n}''​ et ''​[:​class:​]''​. ​
Ligne 300: Ligne 306:
   * Elles s'​utilisent __uniquement pour la correspondance avec des variables__.   * Elles s'​utilisent __uniquement pour la correspondance avec des variables__.
   ​   ​
-  * Les caractères spécifiques aux expressions régulières (//ERb// et //ERe//) utilisées ici uniquement dans le contexte de correspondance avec une variable, sont identiques et ont une signification similaire lorsqu'​ils sont utilisés avec d'​autres programmes, grep, grep -E, sed, sed -r, awk, mais dans un contexte beaucoup plus large.\\ (comparez avec [[http://​wiki.debian-facile.org/​atelier:​chantier:​bash-vii-globs-etendus-regex?&#​index-1caracteres-regexp-sed|l'​index1]]).+  * Les caractères spécifiques aux expressions régulières (//ERb// et //ERe//) utilisées ici uniquement dans le contexte de correspondance avec une variable, sont identiques et ont une signification similaire lorsqu'​ils sont utilisés avec d'​autres programmes, grep, grep -E, sed, sed -r, awk, mais dans un contexte beaucoup plus large.\\ (comparez avec [[atelier:​chantier:​bash-vii-globs-etendus-regex#​index-1caracteres-des-erb-et-ere-avec-grep-grep-e-sed-sed-r|l'​index1]]).
 </​note>​ </​note>​
  
Ligne 359: Ligne 365:
  
 **Un grand merci à captnfab pour conseils avisés et toutes ses corrections.** ​ **Un grand merci à captnfab pour conseils avisés et toutes ses corrections.** ​
-=====INDEX 1 : caractères des ERb et ERe avec grep, grep -E, sed, sed -r=====+=====INDEX 1 : caractères des ERb et ERe avec grep, grep -E, sed, sed -r et awk===== 
 + 
 +Comparez ce qui suit avec [[atelier:​chantier:​bash-vii-globs-etendus-regex#​caracteres-servant-aux-expressions-regulieres-de-correspondance-avec-une-variable|]].\\  
 + 
 +====tableau ERb et ERE par commandes==== 
 + 
 +^ caractères ​ ^ [...] ^ .  ^ *  ^<​nowiki>​^</​nowiki>​ ^ $  ^ ? ^  +   ^ <​nowiki>​|</​nowiki> ​ ^( ) ^ <​nowiki>​[:​class:​]</​nowiki>​ ^ 
 +| grep      |  ok    |ok |ok |ok |ok |- |-  | -                  | -  | -                                           | 
 +| grep -E   ​| ​ ok    |ok | ok|ok |ok |ok|ok | ok                 ​|ok ​ | ok  <​nowiki>​[[:​class:​]]</​nowiki> ​           | 
 +| sed       ​| ​ ok    |ok |ok |ok |ok |- |-  | -                  | -  | -                                           | 
 +| sed -r    |  ok    |ok | ok|ok |ok |ok|ok | ok                 ​|ok ​ | ok  <​nowiki>​[[:​class:​]]</​nowiki> ​           | 
 +| awk       ​| ​ ok    |ok | ok|ok |ok |ok|ok | ok                 ​|ok ​ | ok  <​nowiki>​[:​class:​]</​nowiki> ​             | 
 + 
 +====détail des classes ==== 
 + 
 +  * Avec sed il faut l'​option -r, bien que les classes relèvent des //ERb//. 
 +  * Avec grep, elles ne nécessitent pas l'​option -R ou egrep. 
 + 
 +^                                 ​^ ​                             ^  
 +|''<​nowiki>​[[:​alnum:​]]</​nowiki>''​ | Alpha-numerique [a-z A-Z 0-9]| 
 +|''<​nowiki>​[[:​alpha:​]]</​nowiki>''​ | Alphabetic [a-z A-Z] | 
 +|''<​nowiki>​[[:​blank:​]]</​nowiki>''​ | Espaces ou tabulations | 
 +|''<​nowiki>​[[:​cntrl:​]]</​nowiki>''​ | Caractères de contrôle | 
 +|''<​nowiki>​[[:​digit:​]]</​nowiki>''​ | Nombres [0-9] | 
 +|''<​nowiki>​[[:​graph:​]]</​nowiki>''​ | Tous les caractères visibles (à l'​exclusion des espaces)| 
 +|''<​nowiki>​[[:​lower:​]]</​nowiki>''​ | Lettres minuscules [a-z] | 
 +|''<​nowiki>​[[:​print:​]]</​nowiki>''​ | Caractères imprimables (tous caractères sauf ceux de contrôle)| 
 +|''<​nowiki>​ 
 +[[:punct:]] </​nowiki>''​ | Les caractères de ponctuation | 
 +|''<​nowiki>​[[:​space:​]]</​nowiki>''​ | Les espaces | 
 +|''<​nowiki>​[[:​upper:​]]</​nowiki>''​ | Les lettres majuscules [A-Z] | 
 +|''<​nowiki>​[[:​xdigit:​]]</​nowiki>''​ | Chiffres hexadécimaux [0-9 a-f A-F] | 
 + 
 + 
 + 
 +[[http://​www.man-linux-magique.net/​man1/​grep.html|man grep fr]]\\ 
 + 
 +[[http://​heirloom.sourceforge.net/​man/​egrep.1.html|egrep en ]]\\ 
 + 
 +[[http://​manpagesfr.free.fr/​man/​man1/​sed.1.html |man sed fr ]]\\ 
 + 
 +[[http://​linux.about.com/​library/​cmd/​blcmdl1_awk.htm |man awk]] 
 + 
 + 
 +====ERb et ERe : tableaux récapitulatifs==== 
 +Récapitulatif selon deux types d'​expressions régulières :\\  
 + 
 +-les expressions régulière basiques ERb\\  
 +-les expressions régulières étendues ERe\\  
 + 
 +===caractères communs au ERb et ERe=== 
 + 
 +^expressions ^Modèles reconnus ^ 
 +|**c** ​ |  Tout non métacaractère c.| 
 +|**''<​nowiki>​\</​nowiki>''​** ​ |Échappement du caractère spécial.\\ Par exemple **''​\.''​** sélectionne un point littéral.| 
 +|**''<​nowiki>​^</​nowiki>''​** ​ |Test effectué au début de la chaîne.| 
 +|**''​$''​** ​ |Test effectué à la fin de la chaîne.| 
 +|**''​.''​** ​ |Tout caractère sauf une fin de ligne.| 
 +|**''<​nowiki>​ *</​nowiki>''​** ​ |Zéro à n chaînes consécutives validées par l’expression régulière r.| 
 +|**''<​nowiki>​ \< </​nowiki>''​** ​ |début d'un mot (caractères pouvant faire partie de <​nowiki>​[A-Z-z0-9]</​nowiki>​| 
 +|**''<​nowiki>​ \> </​nowiki>''​** ​ |Fin d'un mot| 
 +|**''<​nowiki>​[liste_de_caractères]</​nowiki>''​** ​  |Un caractère cité dans la liste | 
 +|**''<​nowiki>​[^liste_de_caractères]</​nowiki>''​** ​  |Un carcatère qui n'est pas dans la liste | 
 + 
 +  * Exemples : 
 + 
 +**''<​nowiki>​blabla</​nowiki>''​** : chaîne contenant "​blabla"​\\  
 + 
 +**''<​nowiki>​^blabla</​nowiki>''​** : chaîne commençant par "​blabla"​\\  
 + 
 +**''<​nowiki>​blabla$</​nowiki>''​** : chaîne finissant par "​blabla"​\\  
 + 
 +**''<​nowiki>​^[A-Z][5-8].$</​nowiki>''​** : chaîne composées de trois caractères,​ dans l'​ordre :\\ une majuscule, un chiffre compris entre 5 et 8, un caractère quelconque\\  
 + 
 +**''<​nowiki>​^$</​nowiki>''​** : chaîne vide\\  
 + 
 +**''<​nowiki>​^[ ​ ]*$</​nowiki>''​** : chaîne contenant zéro ou plusieurs espace(s) ou tabulation(s)\\  
 + 
 +**''<​nowiki>​\<​tout</​nowiki>''​** : mot commençant par "​tout",​ toutefois\\  
 + 
 +**''<​nowiki>​\<​tout\></​nowiki>''​** : le mot "​tout"​\\  
 + 
 +===Caractères spécifiques aux ERb=== 
 + 
 +^expressions ​                          ​^Modèles reconnus ​                            ^ 
 +|**''<​nowiki>​\{m\}</​nowiki>''​** ​       | m fois le caractère précédent ​              | 
 +|**''<​nowiki>​\{m,​\} </​nowiki>''​** ​     | au moins m fois le caractère précédent ​     | 
 +|**''<​nowiki>​\{m,​n\} </​nowiki>''​** ​    | entre m et n fois le caractère précédent ​   | 
 +|**''<​nowiki>​\(ERb\)</​nowiki>''​** ​     | mémorisation d'une ERb                      | 
 +|**''<​nowiki>​\1,​ \2, ...</​nowiki>''​** ​ | Rappel de mémorisation ​                     | 
 + 
 +-> Le caractère **''​\''​** donne une signification spéciale aux parenthèses et accolades, au lieu de les rendre littérales. 
 + 
 + 
 +===Caractères spécifiques aux expressions rationnelles étentues (ERe) === 
 + 
 +Excepté **''<​nowiki>​(er1)(er2)</​nowiki>''​** : 
 + 
 +  * Tous sont utilisables avec grep -E et egrep 
 +  * Tous sont utilisable avec awk 
 +  * Certains posent problème avec sed -r 
 + 
 +^expressions ​               ^ Modèles reconnus ​            ^ 
 +|**''?''​** | zéro ou une fois le caractère ou le regroupement précédent | 
 +|**''​+''​** |une à n fois le caractère ou regroupement précédent | 
 +|**''<​nowiki>​{m}</​nowiki>''​** |m fois le caractère précédent | 
 +|**''<​nowiki>​{m,​}</​nowiki>''​** | m fois le caractère précédent | 
 +|**''<​nowiki>​{m,​n}</​nowiki>''​** | entre m et n fois le caractère précédent | 
 +|**''<​nowiki>​( er1)</​nowiki>''​** | regroupement | 
 +|**''<​nowiki>​er1|er2|er3</​nowiki>''​** | alternative | 
 +|**''<​nowiki>​(er)+</​nowiki>''​**|Une ou plus de une chaîne(s) consécutive(s) validée(s) "​er"​.| 
 +|**''<​nowiki>​(er)*</​nowiki>''​**|zéro ou plus de zéro chaîne(s) consécutive(s) validée(s) par "​er"​ | 
 +|**''<​nowiki>​(er)?</​nowiki>''​**|une chaîne bulle ou toute chaîne validée par "​er"​.| 
 +|**''<​nowiki>​[c1c2...]</​nowiki>''​**|Tout caractère expressément listé entre les crochets.| 
 +|**''<​nowiki>​[^c1c2...]</​nowiki>''​**|Tout caractère excepté ceux qui sont expressément listés entre les crochets.| 
 +|**''<​nowiki>​[c1-c2]</​nowiki>''​**|Tout caractère appartenant à l’intervalle c1 c2, bornes comprises.| 
 +|**''<​nowiki>​er1|er2</​nowiki>''​**|Toute chaîne de caractères validée soit par er1 soit par er2.| 
 +|**''<​nowiki>​(er)(er)</​nowiki>''​**|Toute chaîne validée par l’expression er, chaîne vide exclue.| 
 +|**''<​nowiki>​(er1)(er2)</​nowiki>''​**|Toute chaîne de caractères de type AB, dans laquelle l’expression régulière er1 valide A et l’expression régulière er2 valide B.\\ Avec awk uniquement| 
 + 
 +===Les raccourcis ne sont pas posix=== 
 + 
 +  * __sed__ : 
 + 
 +^Séquences ​                  ​^Séquences ​                               ^ 
 +|**''<​nowiki>​\f</​nowiki>''​** | Produit ou correspond à un saut | 
 +|**''<​nowiki>​\n</​nowiki>''​** | Produit ou correspond à un retour à la ligne | 
 +|**''<​nowiki>​\t</​nowiki>''​** | Produit ou correspond à un onglet horizontal | 
 +|**''<​nowiki>​\v</​nowiki>''​** | Produit ou correspond à une tabulation verticale | 
 +|**''<​nowiki>​\w</​nowiki>''​** | Synonyme de **''<​nowiki>​[[:​alnum:​]]</​nowiki>''​** → correspond à un mot. | 
 +|**''<​nowiki>​\W</​nowiki>''​** | Synonyme de **''<​nowiki>​[^[:​alnum]]</​nowiki>''​** → ce qui autre qu'un mot. | 
 +|**''<​nowiki>​\b</​nowiki>''​** | Correspond à une chaîne vide (blanc) à l'​extrémité d'un mot | 
 + 
 + 
 + 
 + 
 +  * __awk__ : 
 + 
 +^Séquences ​                        ​^Séquences ​                                         ^ 
 +|**''<​nowiki>​\b </​nowiki>''​** ​     | backspace (supprime le dernier caractère d'une chaîne) | 
 +|**''<​nowiki>​\f </​nowiki>''​** ​     | formfeed ​ (nouvelle page)                              | 
 +|**''<​nowiki>​\r </​nowiki>''​** ​     | carriage return (retour à la ligne) ​                   | 
 +|**''<​nowiki>​\t </​nowiki>''​** ​     | tabulation (crée une tabulation de dix espaces) ​       | 
 +|**''<​nowiki>​\c </​nowiki>''​** ​     | tout caractère pris sous sa forme littérale\\ excepté **''<​nowiki>​\</​nowiki>''​** ​ | 
 + 
 + 
 +====Pour aller plus loin ==== 
 +Pour les PCRE (perl) supportée par egrep (grep  -E ; sed et et awk ) voir [[http://​www.unix.com/​man-page/​linux/​3/​pcresyntax/​|pcresyntax(3)]] et [[http://​manpages.courier-mta.org/​htmlman3/​pcresyntax.3.html|pcrepattern(3)]]\\  
 + 
 +Et en français [[http://​www.expreg.com/​pcre.php]] 
  
  
-=====INDEX 2 : REGEXP ​communs à Perl, Emacs, vim=====+=====INDEX 2 : REGEXP Perl=====
  
 Un petit rappel non exhaustif des caractères spéciaux qui leur sont communs. Un petit rappel non exhaustif des caractères spéciaux qui leur sont communs.
Ligne 413: Ligne 569:
 | 127 |    DEL    | | 127 |    DEL    |
  
-===tuto précédent :===+=====tuto précédent :=====
 [[atelier:​chantier:​man-bash-vi-les-caracteres-de-transformation-de-parametres|Bash : les caractères de transformation de parametres]] [[atelier:​chantier:​man-bash-vi-les-caracteres-de-transformation-de-parametres|Bash : les caractères de transformation de parametres]]
  
  
doc/programmation/shells/bash-vii-globs-etendus-regex.txt · Dernière modification: 22/10/2015 18:31 par milou

Pied de page des forums

Propulsé par FluxBB