logo Debian Debian Debian-France Debian-Facile Debian-fr.org Forum-Debian.fr Debian ? Communautés logo inclusivité

Debian-facile

Bienvenue sur Debian-Facile, site d'aide pour les nouveaux utilisateurs de Debian.

Vous n'êtes pas identifié(e).


L'icône rouge permet de télécharger chaque page du wiki visitée au format PDF et la grise au format ODT → ODT PDF Export

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
Prochaine révision
Révision précédente
Prochaine révision Les deux révisions suivantes
doc:programmation:shells:bash-vii-globs-etendus-regex [10/07/2014 08:35]
Hypathie [Rappel et contexte]
doc:programmation:shells:bash-vii-globs-etendus-regex [07/08/2014 07:59]
Hypathie [Correspondance de motifs avec les expressions rationnelles]
Ligne 37: Ligne 37:
   * __Ce deuxième type de représentation symbolique__ s'est développé avec ''​Bash 3.0''​ auquel il a été intégré la possibilité d'une utilisation restreinte des expressions régulières.\\ Mais attention, il ne s'agit plus alors de recherches de noms de fichiers ou de mots, ni de modifications de paramètres.\\ ​ On s'en sert uniquement pour la correspondance entre une variable et une expression régulière,​ jamais pour la substitution telle que le permet l'​utilisation avancée des expressions régulières. ​   * __Ce deuxième type de représentation symbolique__ s'est développé avec ''​Bash 3.0''​ auquel il a été intégré la possibilité d'une utilisation restreinte des expressions régulières.\\ Mais attention, il ne s'agit plus alors de recherches de noms de fichiers ou de mots, ni de modifications de paramètres.\\ ​ On s'en sert uniquement pour la correspondance entre une variable et une expression régulière,​ jamais pour la substitution telle que le permet l'​utilisation avancée des expressions régulières. ​
  
-  * On retrouve ce deuxième type de représentation symbolique avec __l'​usage avancé des expressions régulières__.\\ Mais elles permettent bien plus que ce que nous allons voir ici. En particulier,​ la substitution de caractères dans un fichier (exécutable ou non).\\ Il est nécessaire pour utiliser [[doc:​programmation:​shell:​regexp|les regexp]] d'en passer par __des programmes externes et spécifiques à l'​utilisation des expressions régulières__ (''​egrep'',​ ''​sed'',​ ''​awk''​ par exemple).\\ Ci-dessous, l'[[atelier:​chantier:​bash-vii-globs-etendus-regex?&#index-1|index 1]] donne un simple aperçu des caractères utilisables ​avec ces différents programmes externes au shell Bash, et déborde du sujet, si ne n'est que le shell Bash permet de les installer puis de les lancer.\\ À voir :+  * On retrouve ce deuxième type de représentation symbolique avec __l'​usage avancé des expressions régulières__.\\ Mais elles permettent bien plus que ce que nous allons voir ici. En particulier,​ la substitution de caractères dans un fichier (exécutable ou non).\\ Il est nécessaire pour utiliser [[doc:​programmation:​shell:​regexp|les regexp]] d'en passer par __des programmes externes et spécifiques à l'​utilisation des expressions régulières__ (''​egrep'',​ ''​sed'',​ ''​awk''​ par exemple).\\ Ci-dessous [[atelier:​chantier:​bash-vii-globs-etendus-regex#​index-1caracteres-regexp-sed|INDEX 1]] et [[atelier:​chantier:​bash-vii-globs-etendus-regex#​index-2caracteres-regexp-egrep |INDEX 2]]donnent ​un simple aperçu des caractères utilisables ​pour REGEXP des différents programmes externes au shell Bash, et déborde ​donc du sujet, si ne n'est que le shell Bash permet de les installer puis de les lancer.\\ À voir :
     * [[doc:​systeme:​grep]]     * [[doc:​systeme:​grep]]
     * [[doc:​systeme:​sed]]     * [[doc:​systeme:​sed]]
Ligne 151: Ligne 151:
 ==== L'​opérateur de correspondance =~ ==== ==== L'​opérateur de correspondance =~ ====
  
-Bash peut utiliser les expressions régulières mais de façon restreinte.\\ Elles ne peuvent pas être utilisée comme modèle de comparaison avec des noms de fichier ou pour effectuer des recherches en ligne de commandes.\\ Elles servent seulement à "​matcher"​ des variables, et elles ne s'​utilisent que dans le cadres des scripts.\\ ​+Bash peut utiliser les expressions régulières mais de façon restreinte ​;  
 +  * elles ne peuvent pas être utilisée comme modèle de comparaison avec des noms de fichier ou pour effectuer des recherches en ligne de commandes. 
 +  * elles ne peuvent pas servir à modifier le contenu d'un fichier.  
 +Elles servent seulement à "​matcher"​ des variables, et elles ne s'​utilisent que dans le cadres des scripts.\\ ​
  
-Depuis __Bash 3.0__, on peut pour se faire utiliser l'​opérateur ''​=~''​.\\ Cet opérateur ''​=~''​ permet :+Depuis __Bash 3.0__, on peut pour se faire utiliser l'​opérateur ​**''​=~''​**.\\  
 + 
 +Cet opérateur ​**''​=~''​** permet :
   * de vérifier la correspondre entre une chaîne (valeur d'une variable à gauche) et le modèle regex à droite ;   * de vérifier la correspondre entre une chaîne (valeur d'une variable à gauche) et le modèle regex à droite ;
   * ou encore de vérifier la correspondance entre une variable (constituée d'une chaîne de caractères littérales),​ et une variable constituée d'une regex.   * ou encore de vérifier la correspondance entre une variable (constituée d'une chaîne de caractères littérales),​ et une variable constituée d'une regex.
Ligne 167: Ligne 172:
  
 **Voici les caractères utilisables :** **Voici les caractères utilisables :**
-^ "​signes"​ regex ERE basique ​ ^ signification ​(comparez avec le tableau de l'​index) ​            ^ +^ "​signes"​ regex ERE basique ​ ^ significations ​(comparez avec le tableau de l'​index) ​            ^ 
-| ''​.''​ | Correspond à tout caractère unique. ​ | +**''​.''​** | Correspond à tout caractère unique. ​ | 
-| ''​[ ]''​ | Correspond à un seul caractère qui est contenue dans ''​[ ]''​. On peut mélanger [abcx-z] correspond à ''​a'',​ ''​b'',​ ''​c'',​ ''​x'',​ ''​y''​ ou ''​z'',​ de même que ''​[a-cx-z]''​. Le caractère ''​-''​ est traité comme un caractère littéral si c'est le dernier ou le premier. ​ | +**''​*''​** | Correspond à zéro ou plusieurs fois l'​élément précédent.\\ Par exemple, ''​ab* c''​ correspond à "​ac",​ "​abc",​ "​abbbc»,​ etc. Ou encore, ​''​[xyz]*'' ​correspond à ''​x'',​ ''​y'',​ ''​z'',​ ''​zx'',​ ''​zyx'',​ ''​xyzzy'',​ et ainsi de suite. ''​(ab)*''​ correspond à ''​a'',​ ''​b'',​ ''​abab'',​ ''​ababab'',​ et ainsi de suite.| 
-| ''​[^ ]''​ | Correspond à un caractère qui n'est pas contenu dans les parenthèses. Par exemple, ''​[^abc]''​ correspond à tout caractère autre que a, b ou c. | +| **''​\''​** | Échappement du caractère spécial.\\ Par exemple **''​\''​**. sélectionne un point littéral.| 
-| ''​'' ​ | Correspond à la position ​de départ dans la chaîne. ​| +| **''​^ ''​** ​ | Correspond à la position de départ dans la chaîne. | 
-| ''​$'' ​| Correspond à la position de fin de la chaîne ou la position juste avant un saut de ligne de chaîne interminable. ​  +| **''​$''​** | Correspond à la position de fin de la chaîne ou la position juste avant un saut de ligne de chaîne interminable. ​  | 
-| ''​( )'' ​| Définit une sous-expression marquée. La chaîne correspondante entre parenthèses peut être rappelé plus tard (voir l'​entrée suivante, ​''​\ ​n''​). Une sous-expression marquée est aussi appelé un groupe de blocs ou de capturer. Mode BRE nécessite \ (\). | +| **''​[ ]''​** ​| Correspond à un seul caractère qui est contenue dans ''​[ ]''​. On peut mélanger [abcx-z] correspond à ''​a'',​ ''​b'',​ ''​c'',​ ''​x'',​ ''​y''​ ou ''​z'',​ de même que ''​[a-cx-z]''​. Le caractère ''​-''​ est traité comme un caractère littéral si c'est le dernier ou le premier. ​ | 
-| ''​\n'' ​| Correspond au nombre ''​n''​ de sous-chaîne,​ où ''​n''​ est un chiffre de 1 à 9.\\ Écriture équivalente à ''​{n}'' ​ |   +**''​[^ ]''​** | Correspond à un caractère qui n'est pas contenu dans les parenthèses. Par exemple, ''​[^abc]''​ correspond à tout caractère autre que a, b ou c. | 
-| ''​*''​ | Correspond ​à zéro ou plusieurs ​fois l'​élément précédent.\\ Par exemple, ''​abc''​ correspond ​à "​ac",​ "​abc",​ "​abbbc»,​ etc. Ou encore, ​''​[xyz]*'' ​correspond à ''​x''​''​y'',​ ''​z''​''​zx'',​ ''​zyx'',​ ''​xyzzy'',​ et ainsi de suite. ''​(ab)*'' ​correspond à ''​a'',​ ''​b''​''​abab''​''​ababab''​, et ainsi de suite. | +**''​[:class:]''​**\\ [[doc:​programmation:​shell:​regexp#​les-ensembles-de-caracteres-possibles|les classes prédéfinies]]  ​|''​[:alnum:] [:alpha:] [:blank:] [:cntrl:] [:digit:] [:graph:] [:lower:] [:print:] [:punct:] [:space:] [:upper:] [:xdigit:]'' ​   
-| ''​{m,​n}''​ | l'​élément précédent correspond au moins à ''​m''​ fois, mais pas plus de ''​n''​ fois .\\ Par exemple, ''​a{3,​5}''​ correspond uniquement ''​aaa'',​ ou ''​aaaa'',​ ou ''​aaaaa''​. ​ | +|''​\\)'' ​et ''​\{ \}''​ | Avec les ERb le caractère ​''​\'' ​donne un sens particulier aux parenthèses et crochets.\\ (anciennes versions de Bash)\\ Mais avec les ERe ''​\'' ​devant parenthèses et crochets les échappe ​ | 
-| ''​{ }''​ | "​exactement trois fois" par exemple ''​a{3}''​ correspond strictement à ''​aaa''​ . | +|**Caractères des ERe**                | **Significations** ​   | 
-| ''​{n,​}''​ | "​jusqu'​à trois fois". «trois fois ou plus». Par exemple, ''​{3,​}''​ correspond aaa ou aaaa, etc. (équivalent de ''​a*''​) | +| **''​?''​**                    ​| Correspond zéro ou une fois à l'​élément précédent. Par exemple, ''​ab?c''​ correspond ​seulement ​''​ac'' ​ou ''​abc''​. | 
-| ''​{,​n}''​ | ''​a{,​3}''​ "​jusqu'​à trois fois". Correspond à la ''​chaîne vide''​ ou ''​a''​ ou ''​aa''​ ou ''​aaa''​ (équivalent de ''​a|aa|aaa''​.| +| **''​+''​**                    | Correspond une ou plusieurs fois à l'​élément précédent. Par exemple, ''​ab+c'' ​correspond à ''​abc'',​ ''​abbc'',​ ''​abbbc'',​ et ainsi de suite, mais pas "​ac"​
-|POSIX extended | Bash avec correctif, sinon il faut \ devant parenthèse et crochet. ''​\( \)''​ et ''​\{ \}''​ | +| **''​|''​**       | Alternative ​''​er1|er2|er3''​.\\ Par exemple, ''​abc|def'' ​correspond à ''​abc'' ​ou ''​def''​. | 
-|autres caractères ​                 | signification ​   | +|**Caractères ERe pouvant servir à élaborer des sous-chaînes** | **Significations** | 
-| ''?'' ​                   | Correspond zéro ou une fois à l'​élément précédent. Par exemple, ''​ab?​c''​ correspond seulement ''​ac''​ ou ''​abc''​. | +| **''​( )''​** | Regroupement | 
-| ''​+'' ​                   | Correspond une ou plusieurs fois à l'​élément précédent. Par exemple, ''​ab+c''​ correspond à ''​abc'',​ ''​abbc'',​ ''​abbbc'',​ et ainsi de suite, mais pas "​ac"​. | +| **''​{m,​n}''​** | l'​élément précédent correspond au moins à ''​m''​ fois, mais pas plus de ''​n''​ fois .\\ Par exemple, ''​a{3,​5}''​ correspond uniquement ''​aaa'',​ ou ''​aaaa'',​ ou ''​aaaaa''​. ​ | 
-| ''​|'' ​      | Correspond à l'​expression d'​avant ''​ou''​ l'​expression d'​après l'​opérateur. Par exemple, ''​abc|def''​ correspond à ''​abc''​ ou ''​def''​. | +**''​{ }''​** | "​exactement trois fois" par exemple ''​a{3}''​ correspond strictement à ''​aaa''​ . | 
-| Et toutes [[doc:​programmation:​shell:​regexp#​les-ensembles-de-caracteres-possibles|les classes prédéfinies]]. ​ |''​[:​alnum:​] [:alpha:] [:blank:] [:cntrl:] [:digit:] [:graph:] [:lower:] [:print:] [:punct:] [:space:] [:upper:] [:​xdigit:​]'' ​   |+**''​{n,​}''​** | "​jusqu'​à trois fois". «trois fois ou plus». Par exemple, ''​{3,​}''​ correspond aaa ou aaaa, etc. (équivalent de ''​a*''​) | 
 +**''​{,​n}''​** | ''​a{,​3}''​ "​jusqu'​à trois fois". Correspond à la ''​chaîne vide''​ ou ''​a''​ ou ''​aa''​ ou ''​aaa''​ (équivalent de ''​a|aa|aaa''​.| 
 + 
  
   * Référence (ce tableau résume le contenu de ces trois liens) :    * Référence (ce tableau résume le contenu de ces trois liens) : 
Ligne 191: Ligne 199:
     * [[https://​en.wikipedia.org/​wiki/​Regular_expression#​Standards#​Uses]]     * [[https://​en.wikipedia.org/​wiki/​Regular_expression#​Standards#​Uses]]
     * [[https://​en.wikipedia.org/​wiki/​Regular_expression#​Standards#​Character%20classes]]     * [[https://​en.wikipedia.org/​wiki/​Regular_expression#​Standards#​Character%20classes]]
-  * Autre référence : [[http://​mywiki.wooledge.org/​RegularExpression]] ​+  * Autre référence :\\ [[http://​mywiki.wooledge.org/​RegularExpression]] \\ [[http://​en.wikibooks.org/​wiki/​Regular_Expressions/​Posix_Basic_Regular_Expressions|Regular Expressions/​POSIX]]
    
 ==== Apprenons à construire une expression régulière==== ​ ==== Apprenons à construire une expression régulière==== ​
Ligne 342: Ligne 350:
  
 **Un grand merci à captnfab pour conseils avisés et toutes ses corrections.** ​ **Un grand merci à captnfab pour conseils avisés et toutes ses corrections.** ​
-=====INDEX 1===== +=====INDEX 1 : caractères regexp sed=====
-==== Rappel des principaux caractères des expressions rationnelles ====  +
-Un petit rappel non exhaustif des caractères spéciaux relatifs aux expressions rationnelles et communs à ''​grep'',​ ''​sed'',​ ''​awk'',​ ''​perl''​.\\ ​+
  
-Pour une initiation aux expressions régulières ou rationnelles,​ voir :\\  +[[utilisateurs:hypathie:tutos:​accueil?&#​les-caracteres-utilises-pour-creer-des-regexp-avec-sed|Les caractères utilisés pour créer des regexp avec sed]] 
-  * http://​www.unixmail.fr/​une-initiation-aux-expressions-rationnelles/​\\ ​ + 
-  * http://​http://​culot.org/​public/​Docs/​regexp.html\\ ​+ 
 +=====INDEX 2 REGEXP communs à Perl, Emacs, vim===== 
 + 
 +Un petit rappel non exhaustif des caractères spéciaux qui leur sont communs.
  
 ^ ^ ^ ^ ^ ^
Ligne 355: Ligne 364:
 |Correspondance entre regex et variable : | ''​ =~ ''​\\ $v =~ m/toto/\\ $v =~ s/​toto/​titi/​ | |Correspondance entre regex et variable : | ''​ =~ ''​\\ $v =~ m/toto/\\ $v =~ s/​toto/​titi/​ |
 |Les caractères spéciaux : | ''​\''​ ''​|''​ ''​( )''​ ''​[ ]''​ ''​{ }''​ ''​^''​ ''​$''​ ''​*''​ ''​+''​ ''?''​ ''​.''​ | |Les caractères spéciaux : | ''​\''​ ''​|''​ ''​( )''​ ''​[ ]''​ ''​{ }''​ ''​^''​ ''​$''​ ''​*''​ ''​+''​ ''?''​ ''​.''​ |
-|Pour représenter saut de ligne :  | ''​\n''​ | 
-|Pour représenter retour chariot : | ''​\r''​ | 
-|Pour représenter tabulation :    | ''​\t''​ | 
-|Pour représenter saut de page :  | ''​ \f''​| 
-|Pour représenter échappement :   | ''​\e''​ | 
 |Le point représente n'​importe quel caractère. ​  | ''​.'' ​ | |Le point représente n'​importe quel caractère. ​  | ''​.'' ​ |
 |La paire de crochet "​matche"​ l'un des caractères entre crochet | ''​[ ]'' ​ | |La paire de crochet "​matche"​ l'un des caractères entre crochet | ''​[ ]'' ​ |
 |Intervalle :\\ ''​ ''​\\ Tout intervalle est envisageable,​\\ par exemple ''​u-w''​ ou toute autre combinaison tant que\\ le numéro ''​ASCII''​ du premier caractère est inférieur à celui du second.\\ Un intervalle peut prendre place au milieu d'un motif quelconque.\\ Pour rechercher un ''​-''​ littéral, le mettre en dernier dans un intervalle. ​                      | \\ ''​ ''​\\ ''​ ''​\\ ''​[a-z]''​ (l'une des lettres minuscules de l'​alphabet)\\ ''​[A-Z]''​ (l'une des lettres majuscules de l'​alphabet)\\ ''​[0-9]''​ (un des caractères numériques) | |Intervalle :\\ ''​ ''​\\ Tout intervalle est envisageable,​\\ par exemple ''​u-w''​ ou toute autre combinaison tant que\\ le numéro ''​ASCII''​ du premier caractère est inférieur à celui du second.\\ Un intervalle peut prendre place au milieu d'un motif quelconque.\\ Pour rechercher un ''​-''​ littéral, le mettre en dernier dans un intervalle. ​                      | \\ ''​ ''​\\ ''​ ''​\\ ''​[a-z]''​ (l'une des lettres minuscules de l'​alphabet)\\ ''​[A-Z]''​ (l'une des lettres majuscules de l'​alphabet)\\ ''​[0-9]''​ (un des caractères numériques) |
-|Raccourcis pour des ensembles courants\\ | ''​\d''​ qui correspond à ''​[0-9]''​\\ ''​\D''​ qui correspond à ''​[cfl0-9]''​\\ ''​\w''​ qui correspond à ''​[a-zA-Z0-9_]''​\\ ''​\W''​ qui correspond à ''​[cfla-zA-Z0-9_]''​\\ ''​\t''​ qui correspond à une tabulation\\ ''​\n''​ qui correspond à un saut de ligne\\ ''​\n''​ qui correspond à un saut de ligne\\ ''​\r''​ qui correspond à un retour chariot\\ ''​\s''​ qui correspond à un espace blanc\\ ''​\S''​ qui correspond à n'est pas un espace blanc |+|Raccourcis pour des ensembles courants\\ | ''​\d''​ qui correspond à ''​[0-9]''​\\ ''​\D''​ qui correspond à ''​[cfl0-9]''​\\ ''​\w''​ qui correspond à ''​[a-zA-Z0-9_]''​\\ ''​\W''​ qui correspond à ''​[cfla-zA-Z0-9_]''​\\ ''​\t''​ qui correspond à une tabulation\\ ''​\n''​ qui correspond à un saut de ligne\\ ''​\n''​ qui correspond à un saut de ligne\\ ''​\r''​ qui correspond à un retour chariot\\ ''​\s''​ qui correspond à un espace blanc\\ ''​\S''​ qui correspond à n'est pas un espace blanc\\ ''​\t''​ qui représente une tabulation\\ ''​\f''​ qui représente un saut de page\\ ''​\e''​ qui représente un échappement ​|
 |Quantificateurs :\\ ''​ ''​\\ 0 fois ou plus\\ 1 fois ou plus\\ 0 ou 1 fois\\ n fois exactement | ''​ ''​\\ ''​ ''​\\ ''​*''​\\ ''​+''​\\ ''?''​\\ ''​{n}''​ | |Quantificateurs :\\ ''​ ''​\\ 0 fois ou plus\\ 1 fois ou plus\\ 0 ou 1 fois\\ n fois exactement | ''​ ''​\\ ''​ ''​\\ ''​*''​\\ ''​+''​\\ ''?''​\\ ''​{n}''​ |
 |Mémorisation : \\ de variables $1 $2 ...| ''​( )'' ​ ''​( )''​ ... | |Mémorisation : \\ de variables $1 $2 ...| ''​( )'' ​ ''​( )''​ ... |
Ligne 370: Ligne 374:
 |Options : | ''​i''​ : Rend le motif insensible à la case (minuscules/​majuscules)\\ ''​ ''​ l'​expression régulière ''​m/​toto/​i''​\\ ''​g''​ : Permet d'​effectuer toutes les substitutions,​\\ ''​ ''​ et pas que la première.\\ ''​e''​ : Évalue le membre de droite comme une expression Perl.\\ ''​o''​ : La compilation a lieu une seule fois lors de la première exécution. | |Options : | ''​i''​ : Rend le motif insensible à la case (minuscules/​majuscules)\\ ''​ ''​ l'​expression régulière ''​m/​toto/​i''​\\ ''​g''​ : Permet d'​effectuer toutes les substitutions,​\\ ''​ ''​ et pas que la première.\\ ''​e''​ : Évalue le membre de droite comme une expression Perl.\\ ''​o''​ : La compilation a lieu une seule fois lors de la première exécution. |
  
- +  * Référence :\\ [[http://​oreilly.com/​php/​excerpts/​php-mysql-javascript/​regex-in-php-javascript.html]] 
-=====INDEX ​===== +  * Apprendre à utiliser les expressions régulières sous perl :\\  [[https://​ensiwiki.ensimag.fr/​index.php/​Expressions_r%C3%A9guli%C3%A8res]]\\ ​ [[http://​perldoc.perl.org/​perlrequick.html]]\\ [[http://​perldoc.perl.org/​perlre.html]] 
-Voici l'​ordre des caractères ASCII :+=====INDEX ​3 : l'​ordre des caractères ASCII ===== 
 +Voici  :
  
 ^ ordre  ^ caractère ^ ordre   ^ caractère ^ ordre    ^ caractère ^ ordre ^ caractère ^     ordre ^ caractère ^ ordre ^ caractère ^ ^ ordre  ^ caractère ^ ordre   ^ caractère ^ ordre    ^ caractère ^ ordre ^ caractère ^     ordre ^ caractère ^ ordre ^ caractère ^
doc/programmation/shells/bash-vii-globs-etendus-regex.txt · Dernière modification: 22/10/2015 18:31 par milou

Pied de page des forums

Propulsé par FluxBB