logo Debian Debian Debian-France Debian-Facile Debian-fr.org Forum-Debian.fr Debian ? Communautés logo inclusivité

Debian-facile

Bienvenue sur Debian-Facile, site d'aide pour les nouveaux utilisateurs de Debian.

Vous n'êtes pas identifié(e).


L'icône rouge permet de télécharger chaque page du wiki visitée au format PDF et la grise au format ODT → ODT PDF Export

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
Prochaine révision
Révision précédente
Prochaine révision Les deux révisions suivantes
doc:programmation:shells:bash-vii-globs-etendus-regex [09/07/2014 13:03]
Hypathie [INDEX]
doc:programmation:shells:bash-vii-globs-etendus-regex [19/07/2014 18:55]
Hypathie [INDEX 3]
Ligne 23: Ligne 23:
 =====Rappel et contexte===== =====Rappel et contexte=====
  
-La "​représentation symbolique"​((en anglais : "​matching"​)) de caractères alpha-numériques par des "​métacaractères"​((termes employé là dans un sens général)) est de deux types. Et on peut distinguer ces deux types relativement à l'​utilisation que l'on en :\\ +La "​représentation symbolique"​((en anglais : "​matching"​)) de caractères alpha-numériques par des "​métacaractères"​((termes employé là dans un sens général ​: [[http://​fr.wiktionary.org/​wiki/​m%C3%A9tacaract%C3%A8re]])) est de deux types. Et on peut distinguer ces deux types relativement à l'​utilisation que l'on en fait :\\ 
   - __sélectionner__ des noms de fichiers dans un répertoire ;\\    - __sélectionner__ des noms de fichiers dans un répertoire ;\\ 
   - __déterminer__ si une chaîne est conforme à un format désiré.\\ ​   - __déterminer__ si une chaîne est conforme à un format désiré.\\ ​
Ligne 29: Ligne 29:
  
 ===Rappel : === ===Rappel : ===
-__Le premier type de représentation symbolique__ se fait avec [[doc:​programmation:​shell:​les-metacaracteres|les globs ou patterns simples]] ; ils servent aux recherches sur les chaînes de caractères et se font généralement en ligne de commandes.\\ Il a été donné simple récapitulatif des caractères utilisés ici : [[atelier:​chantier:​bash-les-differents-caracteres-speciaux#​metacaracteres-et-meta-caracteres|méta-caractères ​et métacaractères]].\\+__Le premier type de représentation symbolique__ se fait avec [[doc:​programmation:​shell:​les-metacaracteres|les globs ou patterns simples]]((désignés aussi de "​caractères génériques"​)) ​; ils servent aux recherches sur les chaînes de caractères et se font généralement en ligne de commandes.\\ Il a été donné ​un simple récapitulatif des caractères utilisés ici : [[atelier:​chantier:​bash-les-differents-caracteres-speciaux#​definition-usuelle-de-metacaractere-et-detail|définition usuelle de métacaractère"​]].\\
  
 ===Distinguer le "​globbing"​ étendu des expressions régulières === ===Distinguer le "​globbing"​ étendu des expressions régulières ===
-__Le deuxième type de de représentation symbolique__ se fait (à partir de ''​bash 2.01''​) avec [[atelier:​chantier:​bash-vii-globs-etendus-regex#​les-globs-etendus|les globs étendus (ou patterns longs ; "​extended patterns"​),​ étudiés ci-dessous]] ; on les utilise pour effectuer des tests de correspondances simples, en ligne de commandes ou dans des scripts, ou pour [[atelier:​chantier:​man-bash-vi-les-caracteres-de-transformation-de-parametres|modifier les paramètres d'une variable]].\\ ​+__Le deuxième type de de représentation symbolique__ se fait (à partir de ''​bash 2.01''​) avec [[atelier:​chantier:​bash-vii-globs-etendus-regex#​les-globs-etendus|les globs étendus ​]]((appelés aussi "patterns longs" ​en anglais ​"​extended patterns"​)), étudiés ci-dessous ; on les utilise pour effectuer des tests de correspondances simples, en ligne de commandes ou dans des scripts, ou pour [[atelier:​chantier:​man-bash-vi-les-caracteres-de-transformation-de-parametres|modifier les paramètres d'une variable]].\\ ​
  
 ===Distinguer les expressions régulières de Bash de celles d'​autres programmes=== ===Distinguer les expressions régulières de Bash de celles d'​autres programmes===
-  * __Ce deuxième type de représentation symbolique__ s'est développé avec ''​Bash 3.0''​ auquel il a été intégré la possibilité d'une utilisation restreinte des expressions ​régulière.\\ Mais attention, il ne s'agit plus alors de recherches de noms de fichiers ou de mots, ni de modifications de paramètres.\\ ​ On s'en sert uniquement pour la correspondance entre une variable et une expression régulière,​ jamais pour la substitution ​tel que le permet l'​utilisation avancée des expressions régulières. ​+  * __Ce deuxième type de représentation symbolique__ s'est développé avec ''​Bash 3.0''​ auquel il a été intégré la possibilité d'une utilisation restreinte des expressions ​régulières.\\ Mais attention, il ne s'agit plus alors de recherches de noms de fichiers ou de mots, ni de modifications de paramètres.\\ ​ On s'en sert uniquement pour la correspondance entre une variable et une expression régulière,​ jamais pour la substitution ​telle que le permet l'​utilisation avancée des expressions régulières. ​
  
-  * On retrouve ce deuxième type de représentation symbolique avec __l'​usage avancé des expressions régulières__.\\ Mais elles permettent bien plus que ce que nous allons voir ici. En particulier,​ la substitution de caractères dans un fichier (exécutable ou non).\\ Il est nécessaire pour utiliser [[doc:​programmation:​shell:​regexp|les regexp]] d'en passer par __des programmes externes et spécifiques à l'​utilisation des expression ​régulières__ (''​egrep'',​ ''​sed'',​ ''​awk''​ par exemple).\\ [[atelier:​chantier:​bash-vii-globs-etendus-regex#​index|L'index ci-dessous]] donne un simple aperçu des caractères utilisables ​par de ces différents programmes externes au shell Bash, et déborde du sujet, si ne n'est que le shell Bash permet de les installer puis de les lancer.\\ À voir :+  * On retrouve ce deuxième type de représentation symbolique avec __l'​usage avancé des expressions régulières__.\\ Mais elles permettent bien plus que ce que nous allons voir ici. En particulier,​ la substitution de caractères dans un fichier (exécutable ou non).\\ Il est nécessaire pour utiliser [[doc:​programmation:​shell:​regexp|les regexp]] d'en passer par __des programmes externes et spécifiques à l'​utilisation des expressions ​régulières__ (''​egrep'',​ ''​sed'',​ ''​awk''​ par exemple).\\ ​Ci-dessous ​[[atelier:​chantier:​bash-vii-globs-etendus-regex#​index-1caracteres-regexp-sed|INDEX 1]] et [[atelier:​chantier:​bash-vii-globs-etendus-regex#​index-2caracteres-regexp-egrep |INDEX 2]]donnent ​un simple aperçu des caractères utilisables ​pour REGEXP des différents programmes externes au shell Bash, et déborde ​donc du sujet, si ne n'est que le shell Bash permet de les installer puis de les lancer.\\ À voir :
     * [[doc:​systeme:​grep]]     * [[doc:​systeme:​grep]]
     * [[doc:​systeme:​sed]]     * [[doc:​systeme:​sed]]
Ligne 143: Ligne 143:
  
   - Contrairement à la correspondance simple rappelée au-dessus les doubles crochets sont obligatoires. C'est eux qui enclenchent le mécanisme de comparaison. On peut mettre un double égal, pour plus de clarté.\\   - Contrairement à la correspondance simple rappelée au-dessus les doubles crochets sont obligatoires. C'est eux qui enclenchent le mécanisme de comparaison. On peut mettre un double égal, pour plus de clarté.\\
-  - Le "méta-caractère" ou glob simple * signifie "un nombre quelconque de caractères"​ et le ? signifie "un seul caractère",​ comme pour les globs simples.\\ ​+  - Le "métacaractère" ou glob simple ​''​*'' ​signifie "un nombre quelconque de caractères"​ et le ''​?'' ​signifie "un seul caractère",​ comme pour les globs simples.\\ ​
   - CES SIGNIFICATIONS SONT CONSERVÉES lors de l'​emploi des globs étendus, et leurs significations et conservée mais s'​applique à une syntaxe différentes dans les expressions régulières.\\   - CES SIGNIFICATIONS SONT CONSERVÉES lors de l'​emploi des globs étendus, et leurs significations et conservée mais s'​applique à une syntaxe différentes dans les expressions régulières.\\
-  - Ne surtout pas mettre de " " autour de * : le shell chercherait alors les chaînes dont le premier caractère est une *, ni dans les cas simples, ni lorsqu'​on utilise les motifs étendus.+  - Ne surtout pas mettre de ''​" "'' ​autour de ''​*'' ​: le shell chercherait alors les chaînes dont le premier caractère est une ''​*''​, ni dans les cas simples, ni lorsqu'​on utilise les motifs étendus.
 </​note>​ </​note>​
  
Ligne 151: Ligne 151:
 ==== L'​opérateur de correspondance =~ ==== ==== L'​opérateur de correspondance =~ ====
  
-Bash peut utiliser les expressions régulières mais de façon restreinte.\\ Elles ne peuvent pas être utilisée comme modèle de comparaison avec des noms de fichier ou pour effectuer des recherches en ligne de commandes.\\ Elles servent seulement à "​matcher"​ des variables, et elles ne s'​utilisent que dans le cadres des scripts.\\ ​+Bash peut utiliser les expressions régulières mais de façon restreinte ​;  
 +  * elles ne peuvent pas être utilisée comme modèle de comparaison avec des noms de fichier ou pour effectuer des recherches en ligne de commandes. 
 +  * elles ne peuvent pas servir à modifier le contenu d'un fichier.  
 +Elles servent seulement à "​matcher"​ des variables, et elles ne s'​utilisent que dans le cadres des scripts.\\ ​
  
-Depuis __Bash 3.0__, on peut pour se faire utiliser l'​opérateur ''​=~''​.\\ Cet opérateur ''​=~''​ permet :+Depuis __Bash 3.0__, on peut pour se faire utiliser l'​opérateur ''​=~''​.\\ ​ 
 + 
 +Cet opérateur ''​=~''​ permet :
   * de vérifier la correspondre entre une chaîne (valeur d'une variable à gauche) et le modèle regex à droite ;   * de vérifier la correspondre entre une chaîne (valeur d'une variable à gauche) et le modèle regex à droite ;
   * ou encore de vérifier la correspondance entre une variable (constituée d'une chaîne de caractères littérales),​ et une variable constituée d'une regex.   * ou encore de vérifier la correspondance entre une variable (constituée d'une chaîne de caractères littérales),​ et une variable constituée d'une regex.
Ligne 191: Ligne 196:
     * [[https://​en.wikipedia.org/​wiki/​Regular_expression#​Standards#​Uses]]     * [[https://​en.wikipedia.org/​wiki/​Regular_expression#​Standards#​Uses]]
     * [[https://​en.wikipedia.org/​wiki/​Regular_expression#​Standards#​Character%20classes]]     * [[https://​en.wikipedia.org/​wiki/​Regular_expression#​Standards#​Character%20classes]]
-  * Autre référence : [[http://​mywiki.wooledge.org/​RegularExpression]] ​+  * Autre référence :\\ [[http://​mywiki.wooledge.org/​RegularExpression]] \\ [[http://​en.wikibooks.org/​wiki/​Regular_Expressions/​Posix_Basic_Regular_Expressions|Regular Expressions/​POSIX]]
    
 ==== Apprenons à construire une expression régulière==== ​ ==== Apprenons à construire une expression régulière==== ​
Ligne 269: Ligne 274:
 >puis ''​$''​ qui signifie fin de l'​expression. >puis ''​$''​ qui signifie fin de l'​expression.
  
->Le tout entre ''​ " " ''​ et sans espace autour du égal qui affecte la variable "​regex"​ par la RE.+>Le tout entre ''​ " " ''​ et sans espace autour du égal qui affecte la variable "​regex"​ par la //​ERE//​((expression rationnelle étendue)).
  
-Et voilà comment avec le shell bash, on peut dresser une expression rationnelle fonctionnant dans les tests !   :-P+Et voilà comment avec le shell bash, on peut dresser une expression rationnelle ​étendue ​fonctionnant dans les tests !   :-P
  
 <​note>​ <​note>​
 Pour résumer :\\  Pour résumer :\\ 
  
-  * Les expressions régulières utilisées avec le shell Bash nécessitent l'​opérateur ''​=~''​+  * Les //expressions régulières// utilisées avec le shell Bash nécessitent l'​opérateur ''​=~''​
   * On y retrouve ceux des caractères génériques (globs) basiques ''​*'',​ ''​[ ]'',​ ''?''​.\\ (avec sens voisin mais étendus par une syntaxe particulière). ​   * On y retrouve ceux des caractères génériques (globs) basiques ''​*'',​ ''​[ ]'',​ ''?''​.\\ (avec sens voisin mais étendus par une syntaxe particulière). ​
   * On y retrouve ceux des caractères génériques étendus ''​|'',​ ''​@'',​ ''​!'',​ ''​+'',​ ''​^''​\\ ​ (là aussi avec une nouvelle syntaxe). ​   * On y retrouve ceux des caractères génériques étendus ''​|'',​ ''​@'',​ ''​!'',​ ''​+'',​ ''​^''​\\ ​ (là aussi avec une nouvelle syntaxe). ​
Ligne 283: Ligne 288:
   * Elles ne s'​utilisent pas avec la syntaxe de correspondance ou de substitution de type : ''<​nowiki>​$var/​.../​...</​nowiki>''​ ou ''<​nowiki>​$var//​.../​...</​nowiki>''​   * Elles ne s'​utilisent pas avec la syntaxe de correspondance ou de substitution de type : ''<​nowiki>​$var/​.../​...</​nowiki>''​ ou ''<​nowiki>​$var//​.../​...</​nowiki>''​
   * Ce sont les ER d'​autres programmes qui recourent à une syntaxe ressemblante\\ (voir index correspondance et substitution). ​   * Ce sont les ER d'​autres programmes qui recourent à une syntaxe ressemblante\\ (voir index correspondance et substitution). ​
-  * Beaucoup de ces métacaractères sont identiques à ceux des ER d'​autres programmes\\ (comparez avec l'​index).+  * Beaucoup de ces métacaractères sont identiques à ceux des expressions régulières ​d'​autres programmes\\ (comparez avec l'​index).
 </​note>​ </​note>​
  
-====Un script pour s'​exercer au ER====+====Un script pour s'​exercer au "ER"====
   * Voici un script "​exp.reg1" ​   * Voici un script "​exp.reg1" ​
  
Ligne 342: Ligne 347:
  
 **Un grand merci à captnfab pour conseils avisés et toutes ses corrections.** ​ **Un grand merci à captnfab pour conseils avisés et toutes ses corrections.** ​
-=====INDEX 1===== +=====INDEX 1 : caractères regexp sed=====
-==== Rappel des principaux caractères des expressions rationnelles ====  +
-Un petit rappel non exhaustif des caractères spéciaux relatifs aux expressions rationnelles communs à ''​grep'',​ ''​sed'',​ ''​awk'',​ ''​perl''​.\\ ​+
  
-Pour une initiation aux expressions régulières ou rationnelles,​ voir :\\  +[[utilisateurs:hypathie:tutos:​accueil?&#​les-caracteres-utilises-pour-creer-des-regexp-avec-sed|Les caractères utilisés pour créer des regexp avec sed]] 
-  * http://​www.unixmail.fr/​une-initiation-aux-expressions-rationnelles/​\\ ​ + 
-  * http://http://​culot.org/​public/​Docs/​regexp.html\\ ​+=====INDEX 2 caractères ​regexp ​egrep ===== 
 +=====INDEX 3 : REGEXP communs à Perl, PHP, JavaScript, MySQL===== 
 + 
 +Un petit rappel non exhaustif des caractères spéciaux relatifs aux expressions rationnelles utilisable avec Perl, PHP, JavaScript, MySQL.
  
 ^ ^ ^ ^ ^ ^
Ligne 355: Ligne 361:
 |Correspondance entre regex et variable : | ''​ =~ ''​\\ $v =~ m/toto/\\ $v =~ s/​toto/​titi/​ | |Correspondance entre regex et variable : | ''​ =~ ''​\\ $v =~ m/toto/\\ $v =~ s/​toto/​titi/​ |
 |Les caractères spéciaux : | ''​\''​ ''​|''​ ''​( )''​ ''​[ ]''​ ''​{ }''​ ''​^''​ ''​$''​ ''​*''​ ''​+''​ ''?''​ ''​.''​ | |Les caractères spéciaux : | ''​\''​ ''​|''​ ''​( )''​ ''​[ ]''​ ''​{ }''​ ''​^''​ ''​$''​ ''​*''​ ''​+''​ ''?''​ ''​.''​ |
-|Pour représenter saut de ligne :  | ''​\n''​ | 
-|Pour représenter retour chariot : | ''​\r''​ | 
-|Pour représenter tabulation :    | ''​\t''​ | 
-|Pour représenter saut de page :  | ''​ \f''​| 
-|Pour représenter échappement :   | ''​\e''​ | 
 |Le point représente n'​importe quel caractère. ​  | ''​.'' ​ | |Le point représente n'​importe quel caractère. ​  | ''​.'' ​ |
 |La paire de crochet "​matche"​ l'un des caractères entre crochet | ''​[ ]'' ​ | |La paire de crochet "​matche"​ l'un des caractères entre crochet | ''​[ ]'' ​ |
 |Intervalle :\\ ''​ ''​\\ Tout intervalle est envisageable,​\\ par exemple ''​u-w''​ ou toute autre combinaison tant que\\ le numéro ''​ASCII''​ du premier caractère est inférieur à celui du second.\\ Un intervalle peut prendre place au milieu d'un motif quelconque.\\ Pour rechercher un ''​-''​ littéral, le mettre en dernier dans un intervalle. ​                      | \\ ''​ ''​\\ ''​ ''​\\ ''​[a-z]''​ (l'une des lettres minuscules de l'​alphabet)\\ ''​[A-Z]''​ (l'une des lettres majuscules de l'​alphabet)\\ ''​[0-9]''​ (un des caractères numériques) | |Intervalle :\\ ''​ ''​\\ Tout intervalle est envisageable,​\\ par exemple ''​u-w''​ ou toute autre combinaison tant que\\ le numéro ''​ASCII''​ du premier caractère est inférieur à celui du second.\\ Un intervalle peut prendre place au milieu d'un motif quelconque.\\ Pour rechercher un ''​-''​ littéral, le mettre en dernier dans un intervalle. ​                      | \\ ''​ ''​\\ ''​ ''​\\ ''​[a-z]''​ (l'une des lettres minuscules de l'​alphabet)\\ ''​[A-Z]''​ (l'une des lettres majuscules de l'​alphabet)\\ ''​[0-9]''​ (un des caractères numériques) |
-|Raccourcis pour des ensembles courants\\ | ''​\d''​ qui correspond à ''​[0-9]''​\\ ''​\D''​ qui correspond à ''​[cfl0-9]''​\\ ''​\w''​ qui correspond à ''​[a-zA-Z0-9_]''​\\ ''​\W''​ qui correspond à ''​[cfla-zA-Z0-9_]''​\\ ''​\t''​ qui correspond à une tabulation\\ ''​\n''​ qui correspond à un saut de ligne\\ ''​\n''​ qui correspond à un saut de ligne\\ ''​\r''​ qui correspond à un retour chariot\\ ''​\s''​ qui correspond à un espace blanc\\ ''​\S''​ qui correspond à n'est pas un espace blanc |+|Raccourcis pour des ensembles courants\\ | ''​\d''​ qui correspond à ''​[0-9]''​\\ ''​\D''​ qui correspond à ''​[cfl0-9]''​\\ ''​\w''​ qui correspond à ''​[a-zA-Z0-9_]''​\\ ''​\W''​ qui correspond à ''​[cfla-zA-Z0-9_]''​\\ ''​\t''​ qui correspond à une tabulation\\ ''​\n''​ qui correspond à un saut de ligne\\ ''​\n''​ qui correspond à un saut de ligne\\ ''​\r''​ qui correspond à un retour chariot\\ ''​\s''​ qui correspond à un espace blanc\\ ''​\S''​ qui correspond à n'est pas un espace blanc\\ ''​\t''​ qui représente une tabulation\\ ''​\f''​ qui représente un saut de page\\ ''​\e''​ qui représente un échappement ​|
 |Quantificateurs :\\ ''​ ''​\\ 0 fois ou plus\\ 1 fois ou plus\\ 0 ou 1 fois\\ n fois exactement | ''​ ''​\\ ''​ ''​\\ ''​*''​\\ ''​+''​\\ ''?''​\\ ''​{n}''​ | |Quantificateurs :\\ ''​ ''​\\ 0 fois ou plus\\ 1 fois ou plus\\ 0 ou 1 fois\\ n fois exactement | ''​ ''​\\ ''​ ''​\\ ''​*''​\\ ''​+''​\\ ''?''​\\ ''​{n}''​ |
 |Mémorisation : \\ de variables $1 $2 ...| ''​( )'' ​ ''​( )''​ ... | |Mémorisation : \\ de variables $1 $2 ...| ''​( )'' ​ ''​( )''​ ... |
Ligne 370: Ligne 371:
 |Options : | ''​i''​ : Rend le motif insensible à la case (minuscules/​majuscules)\\ ''​ ''​ l'​expression régulière ''​m/​toto/​i''​\\ ''​g''​ : Permet d'​effectuer toutes les substitutions,​\\ ''​ ''​ et pas que la première.\\ ''​e''​ : Évalue le membre de droite comme une expression Perl.\\ ''​o''​ : La compilation a lieu une seule fois lors de la première exécution. | |Options : | ''​i''​ : Rend le motif insensible à la case (minuscules/​majuscules)\\ ''​ ''​ l'​expression régulière ''​m/​toto/​i''​\\ ''​g''​ : Permet d'​effectuer toutes les substitutions,​\\ ''​ ''​ et pas que la première.\\ ''​e''​ : Évalue le membre de droite comme une expression Perl.\\ ''​o''​ : La compilation a lieu une seule fois lors de la première exécution. |
  
- +  * Référence :\\ [[http://​oreilly.com/​php/​excerpts/​php-mysql-javascript/​regex-in-php-javascript.html]] 
-====INDEX 2 ==== +  * Apprendre à utiliser les expressions régulières sous perl :\\ [[http://​perldoc.perl.org/​perlrequick.html]]\\ [[http://​perldoc.perl.org/​perlre.html]] 
-Voici l'​ordre des caractères ASCII :+=====INDEX 4 : l'​ordre des caractères ASCII ===== 
 +Voici  ​:
  
 ^ ordre  ^ caractère ^ ordre   ^ caractère ^ ordre    ^ caractère ^ ordre ^ caractère ^     ordre ^ caractère ^ ordre ^ caractère ^ ^ ordre  ^ caractère ^ ordre   ^ caractère ^ ordre    ^ caractère ^ ordre ^ caractère ^     ordre ^ caractère ^ ordre ^ caractère ^
doc/programmation/shells/bash-vii-globs-etendus-regex.txt · Dernière modification: 22/10/2015 18:31 par milou

Pied de page des forums

Propulsé par FluxBB