logo Debian Debian Debian-France Debian-Facile Debian-fr.org Forum-Debian.fr Debian ? Communautés logo inclusivité

Debian-facile

Bienvenue sur Debian-Facile, site d'aide pour les nouveaux utilisateurs de Debian.

Vous n'êtes pas identifié(e).


L'icône rouge permet de télécharger chaque page du wiki visitée au format PDF et la grise au format ODT → ODT PDF Export

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
Prochaine révision
Révision précédente
Prochaine révision Les deux révisions suivantes
doc:programmation:shells:bash-vii-globs-etendus-regex [09/07/2014 11:59]
Hypathie [Correspondance de motifs avec les expressions rationnelles]
doc:programmation:shells:bash-vii-globs-etendus-regex [09/07/2014 23:44]
Hypathie [Rappel et contexte]
Ligne 23: Ligne 23:
 =====Rappel et contexte===== =====Rappel et contexte=====
  
-La "​représentation symbolique"​((en anglais : "​matching"​)) de caractères alpha-numériques par des "​métacaractères"​((termes employé là dans un sens général)) est de deux types. Et on peut distinguer ces deux types relativement à l'​utilisation que l'on en :\\ +La "​représentation symbolique"​((en anglais : "​matching"​)) de caractères alpha-numériques par des "​métacaractères"​((termes employé là dans un sens général)) est de deux types. Et on peut distinguer ces deux types relativement à l'​utilisation que l'on en fait :\\ 
   - __sélectionner__ des noms de fichiers dans un répertoire ;\\    - __sélectionner__ des noms de fichiers dans un répertoire ;\\ 
   - __déterminer__ si une chaîne est conforme à un format désiré.\\ ​   - __déterminer__ si une chaîne est conforme à un format désiré.\\ ​
Ligne 29: Ligne 29:
  
 ===Rappel : === ===Rappel : ===
-__Le premier type de représentation symbolique__ se fait avec [[doc:​programmation:​shell:​les-metacaracteres|les globs ou patterns simples]] ; ils servent aux recherches sur les chaînes de caractères et se font généralement en ligne de commandes.\\ Il a été donné simple récapitulatif des caractères utilisés ici : [[atelier:​chantier:​bash-les-differents-caracteres-speciaux#​metacaracteres-et-meta-caracteres|méta-caractères et métacaractères]].\\+__Le premier type de représentation symbolique__ se fait avec [[doc:​programmation:​shell:​les-metacaracteres|les globs ou patterns simples]] ; ils servent aux recherches sur les chaînes de caractères et se font généralement en ligne de commandes.\\ Il a été donné ​un simple récapitulatif des caractères utilisés ici : [[atelier:​chantier:​bash-les-differents-caracteres-speciaux#​metacaracteres-et-meta-caracteres|méta-caractères et métacaractères]].\\
  
 ===Distinguer le "​globbing"​ étendu des expressions régulières === ===Distinguer le "​globbing"​ étendu des expressions régulières ===
-__Le deuxième type de de représentation symbolique__ se fait (à partir de ''​bash 2.01''​) avec [[atelier:​chantier:​bash-vii-globs-etendus-regex#​les-globs-etendus|les globs étendus (ou patterns longs ; "​extended patterns"​),​ étudiés ci-dessous]] ; on les utilise pour effectuer des tests de correspondances simples, en ligne de commandes ou dans des scripts, ou pour [[atelier:​chantier:​man-bash-vi-les-caracteres-de-transformation-de-parametres|modifier les paramètres d'une variable]].\\ ​+__Le deuxième type de de représentation symbolique__ se fait (à partir de ''​bash 2.01''​) avec [[atelier:​chantier:​bash-vii-globs-etendus-regex#​les-globs-etendus|les globs étendus ​]]((appelés aussi "patterns longs" ​en anglais ​"​extended patterns"​)), étudiés ci-dessous ; on les utilise pour effectuer des tests de correspondances simples, en ligne de commandes ou dans des scripts, ou pour [[atelier:​chantier:​man-bash-vi-les-caracteres-de-transformation-de-parametres|modifier les paramètres d'une variable]].\\ ​
  
 ===Distinguer les expressions régulières de Bash de celles d'​autres programmes=== ===Distinguer les expressions régulières de Bash de celles d'​autres programmes===
-  * __Ce deuxième type de représentation symbolique__ s'est développé avec ''​Bash 3.0''​ auquel il a été intégré la possibilité d'une utilisation restreinte des expressions ​régulière.\\ Mais attention, il ne s'agit plus alors de recherches de noms de fichiers ou de mots, ni de modifications de paramètres.\\ ​ On s'en sert uniquement pour la correspondance entre une variable et une expression régulière,​ jamais pour la substitution tel que le permet l'​utilisation avancée des expressions régulières. ​+  * __Ce deuxième type de représentation symbolique__ s'est développé avec ''​Bash 3.0''​ auquel il a été intégré la possibilité d'une utilisation restreinte des expressions ​régulières.\\ Mais attention, il ne s'agit plus alors de recherches de noms de fichiers ou de mots, ni de modifications de paramètres.\\ ​ On s'en sert uniquement pour la correspondance entre une variable et une expression régulière,​ jamais pour la substitution tel que le permet l'​utilisation avancée des expressions régulières. ​
  
-  * On retrouve ce deuxième type de représentation symbolique avec __l'​usage avancé des expressions régulières__.\\ Mais elles permettent bien plus que ce que nous allons voir ici. En particulier,​ la substitution de caractères dans un fichier (exécutable ou non).\\ Il est nécessaire pour utiliser [[doc:​programmation:​shell:​regexp|les regexp]] d'en passer par __des programmes externes et spécifiques à l'​utilisation des expression ​régulières__ (''​egrep'',​ ''​sed'',​ ''​awk''​ par exemple).\\ [[atelier:​chantier:​bash-vii-globs-etendus-regex#​index|L'index ci-dessous]] donne un simple aperçu des caractères utilisables ​par de ces différents programmes externes au shell Bash, et déborde du sujet, si ne n'est que le shell Bash permet de les installer puis de les lancer.\\ À voir :+  * On retrouve ce deuxième type de représentation symbolique avec __l'​usage avancé des expressions régulières__.\\ Mais elles permettent bien plus que ce que nous allons voir ici. En particulier,​ la substitution de caractères dans un fichier (exécutable ou non).\\ Il est nécessaire pour utiliser [[doc:​programmation:​shell:​regexp|les regexp]] d'en passer par __des programmes externes et spécifiques à l'​utilisation des expressions ​régulières__ (''​egrep'',​ ''​sed'',​ ''​awk''​ par exemple).\\ ​Ci-dessous, l'[[atelier:​chantier:​bash-vii-globs-etendus-regex?&#index-1|index ​1]] donne un simple aperçu des caractères utilisables ​avec ces différents programmes externes au shell Bash, et déborde du sujet, si ne n'est que le shell Bash permet de les installer puis de les lancer.\\ À voir :
     * [[doc:​systeme:​grep]]     * [[doc:​systeme:​grep]]
     * [[doc:​systeme:​sed]]     * [[doc:​systeme:​sed]]
Ligne 156: Ligne 156:
   * de vérifier la correspondre entre une chaîne (valeur d'une variable à gauche) et le modèle regex à droite ;   * de vérifier la correspondre entre une chaîne (valeur d'une variable à gauche) et le modèle regex à droite ;
   * ou encore de vérifier la correspondance entre une variable (constituée d'une chaîne de caractères littérales),​ et une variable constituée d'une regex.   * ou encore de vérifier la correspondance entre une variable (constituée d'une chaîne de caractères littérales),​ et une variable constituée d'une regex.
- 
-Voici quelques liens qui présentent la syntaxe et les caractères utilisables avec Bash (sans les commandes ''​grep'',​ ''​sed'',​ ''​awk''​).\\ ​ 
-  * [[http://​mywiki.wooledge.org/​RegularExpression]]\\ ​ 
-  
  
 <​note>​ <​note>​
Ligne 191: Ligne 187:
 | Et toutes [[doc:​programmation:​shell:​regexp#​les-ensembles-de-caracteres-possibles|les classes prédéfinies]]. ​ |''​[:​alnum:​] [:alpha:] [:blank:] [:cntrl:] [:digit:] [:graph:] [:lower:] [:print:] [:punct:] [:space:] [:upper:] [:​xdigit:​]'' ​   | | Et toutes [[doc:​programmation:​shell:​regexp#​les-ensembles-de-caracteres-possibles|les classes prédéfinies]]. ​ |''​[:​alnum:​] [:alpha:] [:blank:] [:cntrl:] [:digit:] [:graph:] [:lower:] [:print:] [:punct:] [:space:] [:upper:] [:​xdigit:​]'' ​   |
  
-  * Référence : +  * Référence ​(ce tableau résume le contenu de ces trois liens) ​
     * [[https://​en.wikipedia.org/​wiki/​Regular_expression#​Standards]]     * [[https://​en.wikipedia.org/​wiki/​Regular_expression#​Standards]]
     * [[https://​en.wikipedia.org/​wiki/​Regular_expression#​Standards#​Uses]]     * [[https://​en.wikipedia.org/​wiki/​Regular_expression#​Standards#​Uses]]
     * [[https://​en.wikipedia.org/​wiki/​Regular_expression#​Standards#​Character%20classes]]     * [[https://​en.wikipedia.org/​wiki/​Regular_expression#​Standards#​Character%20classes]]
 +  * Autre référence : [[http://​mywiki.wooledge.org/​RegularExpression]] ​
    
 ==== Apprenons à construire une expression régulière==== ​ ==== Apprenons à construire une expression régulière==== ​
Ligne 345: Ligne 342:
  
 **Un grand merci à captnfab pour conseils avisés et toutes ses corrections.** ​ **Un grand merci à captnfab pour conseils avisés et toutes ses corrections.** ​
-=====INDEX ===== +=====INDEX ​1===== 
-====1) rappel ​des principaux caractères des expressions rationnelles ====  +==== Rappel ​des principaux caractères des expressions rationnelles ====  
-Avec grep, sed, awk, perl\\ ​+Un petit rappel non exhaustif des caractères spéciaux relatifs aux expressions rationnelles et communs à ''​grep''​''​sed''​''​awk''​''​perl''​.\\ 
  
 Pour une initiation aux expressions régulières ou rationnelles,​ voir :\\  Pour une initiation aux expressions régulières ou rationnelles,​ voir :\\ 
-http://​www.unixmail.fr/​une-initiation-aux-expressions-rationnelles/​\\  +  * http://​www.unixmail.fr/​une-initiation-aux-expressions-rationnelles/​\\  
-http://​http://​culot.org/​public/​Docs/​regexp.html\\ ​+  ​* ​http://​http://​culot.org/​public/​Docs/​regexp.html\\ ​
  
-Un petit rappel non exhaustif ​des caractères ​spéciaux relatifs aux expressions rationnelles ​:+^ ^ ^ 
 +|Correspondance : | ''​m/​motif/''​\\ ''/​motif/''​ | 
 +|Substitution :   | ''​s/​motif/​chaîne/'' ​       | 
 +|Correspondance entre regex et variable : | ''​ =~ ''​\\ $v =~ m/toto/\\ $v =~ s/​toto/​titi/​ | 
 +|Les caractères spéciaux : | ''​\''​ ''​|''​ ''​( )''​ ''​[ ]''​ ''​{ }''​ ''​^''​ ''​$''​ ''​*''​ ''​+''​ ''?''​ ''​.''​ | 
 +|Pour représenter saut de ligne :  | ''​\n''​ | 
 +|Pour représenter retour chariot : | ''​\r''​ | 
 +|Pour représenter tabulation :    | ''​\t''​ | 
 +|Pour représenter saut de page :  | ''​ \f''​| 
 +|Pour représenter échappement :   | ''​\e''​ | 
 +|Le point représente n'​importe quel caractère. ​  | ''​.'' ​ | 
 +|La paire de crochet "​matche"​ l'un des caractères entre crochet | ''​[ ]'' ​ | 
 +|Intervalle :\\ ''​ ''​\\ Tout intervalle est envisageable,​\\ par exemple ''​u-w''​ ou toute autre combinaison tant que\\ le numéro ''​ASCII''​ du premier caractère est inférieur à celui du second.\\ ​Un intervalle peut prendre place au milieu d'un motif quelconque.\\ Pour rechercher un ''​-''​ littéral, le mettre en dernier dans un intervalle. ​                      | \\ ''​ ''​\\ ''​ ''​\\ ''​[a-z]''​ (l'une des lettres minuscules de l'​alphabet)\\ ''​[A-Z]''​ (l'une des lettres majuscules de l'​alphabet)\\ ''​[0-9]''​ (un des caractères ​numériques) | 
 +|Raccourcis pour des ensembles courants\\ | ''​\d''​ qui correspond à ''​[0-9]''​\\ ''​\D''​ qui correspond à ''​[cfl0-9]''​\\ ''​\w''​ qui correspond à ''​[a-zA-Z0-9_]''​\\ ''​\W''​ qui correspond à ''​[cfla-zA-Z0-9_]''​\\ ''​\t''​ qui correspond à une tabulation\\ ''​\n''​ qui correspond à un saut de ligne\\ ''​\n''​ qui correspond à un saut de ligne\\ ''​\r''​ qui correspond à un retour chariot\\ ''​\s''​ qui correspond à un espace blanc\\ ''​\S''​ qui correspond à n'est pas un espace blanc | 
 +|Quantificateurs :\\ ''​ ''​\\ 0 fois ou plus\\ 1 fois ou plus\\ 0 ou 1 fois\\ n fois exactement | ''​ ''​\\ ''​ ''​\\ ''​*''​\\ ''​+''​\\ ''?''​\\ ''​{n}''​ | 
 +|Mémorisation : \\ de variables $1 $2 ...| ''​( )'' ​ ''​( )''​ ... | 
 +|Exemple:\\ ''​ ''​\\ ''​prenom.nom@domaine.ext''​\\ (\w+) : $1\\ (\w+) : $2 | \\ ''​ ''​\\ ''/​\b(\w+)\.(\w+)@\w+\.w{2,​4}\b/''​ | 
 +|Substitution de variables : | ''​$s = "​toto";''​\\ ''​if( $v =~ m/$s/ ) { ... }''​ | 
 +|Options : | ''​i''​ : Rend le motif insensible à la case (minuscules/​majuscules)\\ ''​ ''​ l'​expression régulière ''​m/​toto/​i''​\\ ''​g''​ : Permet d'​effectuer toutes les substitutions,​\\ ''​ ''​ et pas que la première.\\ ''​e''​ : Évalue le membre de droite comme une expression Perl.\\ ''​o'' ​La compilation a lieu une seule fois lors de la première exécution. |
  
-<​code>​ 
-Syntaxe correspondance ​             :      m/​motif/ ​  ​ou ​  /​motif/​ 
-Syntaxe substitution ​               :      s/​motif/​chaîne/​ 
-Lier une variable à une regex       : ​     =~  
-                                        $v =~ m/toto/ 
-                                        $v =~ s/​toto/​titi/​ 
-Les caractères spéciaux ​            : ​ \    | ( ) [ ] { } ^ $ * + ? . 
- 
-pour représenter saut de ligne      :  \n 
-pour représenter retour chariot ​    : ​ \r 
-pour représenter tabulation ​        : ​ \t 
-pour représenter saut de page       : ​ \f 
-pour représenter échappement ​       :  \e 
- 
-Le point                            : . n'​importe quel caractère 
- 
-La paire de crochet ​                : [ ] matche l'un des caractères entre crochet 
- 
-Intervalle ​                         : [a-z] l'une des lettres minuscules de l'​alphabet 
-                                    : [A-Z] l'une des lettres majusculs de l'​alphabet 
-                                    : [0-9] un des caractères numériques 
-                             Tout intervalle est envisageable,​ 
-                             par exemple u-w ou toute autre combinaison tant que  
-                             le numéro ASCII du premier caractère est inférieur à celui du second. 
-                              
-                             Un intervalle peut prendre place au milieu d'un motif quelconque. 
-                              
-                             Pour rechercher un - littéral, le mettre en dernier dans un intervalle. 
-                              
-Raccourcis pour des ensembles courants :  
-     ​(motifs abrégés) ​                 : \d qui correspond à [0-9]                        
-                                       : \D qui correspond à [cfl0-9] ​                     
-                                       : \w qui correspond à [a-zA-Z0-9_] ​                 
-                                       : \W qui correspond à [cfla-zA-Z0-9_] ​             ​ 
-                                       : \t qui correspond à une tabulation ​               
-                                       : \n qui correspond à un saut de ligne              
-                                       : \n qui correspond à un saut de ligne            ​ 
-                                       : \r qui correspond à un retour chariot ​           ​ 
-                                       : \s qui correspond à un espace blanc              ​ 
-                                       : \S qui correspond à N’EST PAS un espace blanc 
- 
-Quantificateurs ​                       ​ 
-  0 fois ou plus                      :  * 
-  1 fois ou plus                      :  + 
-  0 ou 1 fois                         : ​ ? 
-  n fois exactement ​                  : {n} 
- 
-Mémorisation ​                         : ( )  ( ) 
-                                         ​^ ​   ^ 
-                                      : $1    $2 
-                                        ​ 
-                                      : prenom.nom@domaine.ext 
-                                      : /​\b(\w+)\.(\w+)@\w+\.w{2,​4}\b/​ 
-                                      :     ​$1 ​     $2 
- 
-Substitution de variables ​            : $s = "​toto";​ 
-                                      : if( $v =~ m/$s/ ) { ... } 
-                                      ​ 
-Options ​                              : i  Rend le motif insensible à la case (minuscules/​majuscules) 
-                                             ​l'​expression régulière m/​toto/​i  ​ 
-                                      : g  Permet d'​effectuer toutes les substitutions, ​ 
-                                             pas que la première. 
-                                      : e  Évalue le membre de droite comme une expression 
-                                             Perl. 
-                                      : o  La compilation a lieu une seule fois lors de la première 
-                                             ​exécution. ​                       ​ 
-</​code>​ 
  
-====2) ASCII====+=====INDEX ​2 ====
 +Voici l'​ordre des caractères ASCII :
  
 ^ ordre  ^ caractère ^ ordre   ^ caractère ^ ordre    ^ caractère ^ ordre ^ caractère ^     ordre ^ caractère ^ ordre ^ caractère ^ ^ ordre  ^ caractère ^ ordre   ^ caractère ^ ordre    ^ caractère ^ ordre ^ caractère ^     ordre ^ caractère ^ ordre ^ caractère ^
doc/programmation/shells/bash-vii-globs-etendus-regex.txt · Dernière modification: 22/10/2015 18:31 par milou

Pied de page des forums

Propulsé par FluxBB