logo Debian Debian Debian-France Debian-Facile Debian-fr.org Forum-Debian.fr Debian ? Communautés logo inclusivité

Debian-facile

Bienvenue sur Debian-Facile, site d'aide pour les nouveaux utilisateurs de Debian.

Vous n'êtes pas identifié(e).


L'icône rouge permet de télécharger chaque page du wiki visitée au format PDF et la grise au format ODT → ODT PDF Export

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
Prochaine révision
Révision précédente
Prochaine révision Les deux révisions suivantes
doc:programmation:shells:bash-vii-globs-etendus-regex [19/07/2014 18:46]
Hypathie [INDEX 1]
doc:programmation:shells:bash-vii-globs-etendus-regex [07/08/2014 09:35]
Hypathie [INDEX 1 : caractères regexp sed]
Ligne 37: Ligne 37:
   * __Ce deuxième type de représentation symbolique__ s'est développé avec ''​Bash 3.0''​ auquel il a été intégré la possibilité d'une utilisation restreinte des expressions régulières.\\ Mais attention, il ne s'agit plus alors de recherches de noms de fichiers ou de mots, ni de modifications de paramètres.\\ ​ On s'en sert uniquement pour la correspondance entre une variable et une expression régulière,​ jamais pour la substitution telle que le permet l'​utilisation avancée des expressions régulières. ​   * __Ce deuxième type de représentation symbolique__ s'est développé avec ''​Bash 3.0''​ auquel il a été intégré la possibilité d'une utilisation restreinte des expressions régulières.\\ Mais attention, il ne s'agit plus alors de recherches de noms de fichiers ou de mots, ni de modifications de paramètres.\\ ​ On s'en sert uniquement pour la correspondance entre une variable et une expression régulière,​ jamais pour la substitution telle que le permet l'​utilisation avancée des expressions régulières. ​
  
-  * On retrouve ce deuxième type de représentation symbolique avec __l'​usage avancé des expressions régulières__.\\ Mais elles permettent bien plus que ce que nous allons voir ici. En particulier,​ la substitution de caractères dans un fichier (exécutable ou non).\\ Il est nécessaire pour utiliser [[doc:​programmation:​shell:​regexp|les regexp]] d'en passer par __des programmes externes et spécifiques à l'​utilisation des expressions régulières__ (''​egrep'',​ ''​sed'',​ ''​awk''​ par exemple).\\ Ci-dessous, l'[[atelier:​chantier:​bash-vii-globs-etendus-regex?&#index-1|index 1]] donne un simple aperçu des caractères utilisables ​avec ces différents programmes externes au shell Bash, et déborde du sujet, si ne n'est que le shell Bash permet de les installer puis de les lancer.\\ À voir :+  * On retrouve ce deuxième type de représentation symbolique avec __l'​usage avancé des expressions régulières__.\\ Mais elles permettent bien plus que ce que nous allons voir ici. En particulier,​ la substitution de caractères dans un fichier (exécutable ou non).\\ Il est nécessaire pour utiliser [[doc:​programmation:​shell:​regexp|les regexp]] d'en passer par __des programmes externes et spécifiques à l'​utilisation des expressions régulières__ (''​egrep'',​ ''​sed'',​ ''​awk''​ par exemple).\\ Ci-dessous [[atelier:​chantier:​bash-vii-globs-etendus-regex#​index-1caracteres-regexp-sed|INDEX 1]] et [[atelier:​chantier:​bash-vii-globs-etendus-regex#​index-2caracteres-regexp-egrep |INDEX 2]]donnent ​un simple aperçu des caractères utilisables ​pour REGEXP des différents programmes externes au shell Bash, et déborde ​donc du sujet, si ne n'est que le shell Bash permet de les installer puis de les lancer.\\ À voir :
     * [[doc:​systeme:​grep]]     * [[doc:​systeme:​grep]]
     * [[doc:​systeme:​sed]]     * [[doc:​systeme:​sed]]
Ligne 156: Ligne 156:
 Elles servent seulement à "​matcher"​ des variables, et elles ne s'​utilisent que dans le cadres des scripts.\\ ​ Elles servent seulement à "​matcher"​ des variables, et elles ne s'​utilisent que dans le cadres des scripts.\\ ​
  
-Depuis __Bash 3.0__, on peut pour se faire utiliser l'​opérateur ''​=~''​.\\ ​+Depuis __Bash 3.0__, on peut pour se faire utiliser l'​opérateur ​**''​=~''​**.\\ 
  
-Cet opérateur ''​=~''​ permet :+Cet opérateur ​**''​=~''​** permet :
   * de vérifier la correspondre entre une chaîne (valeur d'une variable à gauche) et le modèle regex à droite ;   * de vérifier la correspondre entre une chaîne (valeur d'une variable à gauche) et le modèle regex à droite ;
   * ou encore de vérifier la correspondance entre une variable (constituée d'une chaîne de caractères littérales),​ et une variable constituée d'une regex.   * ou encore de vérifier la correspondance entre une variable (constituée d'une chaîne de caractères littérales),​ et une variable constituée d'une regex.
Ligne 169: Ligne 169:
 Lorsqu'​une chaîne correspond, chacune des parties du motif sont disponibles dans la variable ''​$BASH_REMATCH''​. Lorsqu'​une chaîne correspond, chacune des parties du motif sont disponibles dans la variable ''​$BASH_REMATCH''​.
 </​note>​ </​note>​
-==== Tableau des caractères utilisés dans les expressions régulières ​étendues====+==== Caractères servant aux expressions régulières ​de correspondance avec une variable==== 
 +Encore une fois, tous les caractères ci-dessous, ont la signification décrite pour le shell bash __uniquement__ dans ce contexte de correspondance de motif entre variable et //ERb// et //​ERe//​.\\ ​  
 +Ne pas confondre la signification de certains des caractères présentés par ce tableau ​ qui ont une signification différentes pour le shell __dans le contexte de la ligne de commandes__.\\  
 +Le tableau rappelle aussi la signification des caractères pour lesquels la confusion est possible.
  
 **Voici les caractères utilisables :** **Voici les caractères utilisables :**
-^ "​signes"​ regex ERE basique ​ ^ signification ​(comparez avec le tableau de l'​index) ​            ^ +^ "​signes"​ regex ERE basique ​ ^ significations ​(comparez avec le tableau de l'​index) ​            ^ 
-| ''​.''​ | Correspond à tout caractère unique. ​ | +**''​.''​** | Correspond à tout caractère unique.\\ (Attention en ligne de commandes le point représente le répertoire courant.) ​ | 
-| ''​[ ]''​ | Correspond à un seul caractère qui est contenue dans ''​[ ]''​. On peut mélanger [abcx-z] correspond à ''​a'',​ ''​b'',​ ''​c'',​ ''​x'',​ ''​y''​ ou ''​z'',​ de même que ''​[a-cx-z]''​. Le caractère ''​-''​ est traité comme un caractère littéral si c'est le dernier ou le premier. ​ | +**''​*''​** | Correspond à zéro ou plusieurs fois l'​élément précédent.\\ Par exemple, ''​ab* c''​ correspond à "​ac",​ "​abc",​ "​abbbc»,​ etc. Ou encore, ​''​[xyz]*'' ​correspond à ''​x'',​ ''​y'',​ ''​z'',​ ''​zx'',​ ''​zyx'',​ ''​xyzzy'',​ et ainsi de suite. ''​(ab)*''​ correspond à ''​a'',​ ''​b'',​ ''​abab'',​ ''​ababab'',​ et ainsi de suite.\\ (Attention en ligne de commandes, **''​*''​** signifie "​tout"​ : ''​rm blabla*''​ -> supprime tout ce qui commence par blabla dans le répertoire courant)| 
-| ''​[^ ]''​ | Correspond à un caractère qui n'est pas contenu dans les parenthèses. Par exemple, ''​[^abc]''​ correspond à tout caractère autre que a, b ou c. | +| **''​\''​** | Échappement du caractère spécial.\\ Par exemple **''​\''​**. sélectionne un point littéral.\\ (Attention en ligne de commandes, **''​\''​** permet de couper les longues commandes et signifie "la ligne de commandes se termine à la ligne suivante"​.) | 
-| ''​'' ​ | Correspond à la position ​de départ dans la chaîne. ​| +| **''​^ ''​** ​ | Correspond à la position de départ dans la chaîne. | 
-| ''​$'' ​| Correspond à la position de fin de la chaîne ou la position juste avant un saut de ligne de chaîne interminable. ​  +| **''​$''​** | Correspond à la position de fin de la chaîne ou la position juste avant un saut de ligne de chaîne interminable. ​  | 
-| ''​( )'' ​| Définit une sous-expression marquée. La chaîne correspondante entre parenthèses peut être rappelé plus tard (voir l'entrée suivante, ​''​\ ​n''​). Une sous-expression marquée est aussi appelé ​un groupe de blocs ou de capturerMode BRE nécessite ​(\). | +| **''​[ ]''​** ​| Correspond à un seul caractère qui est contenue dans ''​[ ]''​. On peut mélanger [abcx-z] correspond à ''​a'',​ ''​b'',​ ''​c'',​ ''​x'',​ ''​y''​ ou ''​z'',​ de même que ''​[a-cx-z]''​. Le caractère ''​-''​ est traité comme un caractère littéral si c'est le dernier ou le premier.\\ (Même signification ici que **''​[ ]''​** et **''​[ - ]''​** en tant que métacaractère d'une ligne de commandes.) ​ | 
-| ''​\n''​ | Correspond ​au nombre ​''​n'' ​de sous-chaîne, où ''​n''​ est un chiffre de 1 à 9.\\ Écriture équivalente à ''​{n}'' ​   +**''​[^ ]''​** | Correspond à un caractère qui n'est pas contenu dans les parenthèses. Par exemple, ''​[^abc]''​ correspond à tout caractère autre que a, b ou c. | 
-| ''​*''​ | Correspond ​à zéro ou plusieurs fois l'​élément ​précédent.\\ Par exemple, ''​ab* c''​ correspond à "​ac",​ "​abc",​ "​abbbc»,​ etc. Ou encore, ''​[xyz]*''​ correspond à ''​x'',​ ''​y'',​ ''​z'', ​''​zx''​, ''​zyx''​''​xyzzy''​, et ainsi de suite. ''​(ab)*''​ correspond à ''​a''​''​b''​''​abab''​, ''​ababab'',​ et ainsi de suite. ​+**''​[:class:]''​**\\ [[doc:​programmation:​shell:​regexp#​les-ensembles-de-caracteres-possibles|les classes prédéfinies]]  ​|''​[:alnum:] [:alpha:] [:blank:] [:cntrl:] [:digit:] [:graph:] [:lower:] [:print:] [:punct:] [:space:] [:upper:] [:xdigit:]'' ​   
-| ''​{m,​n}''​ | l'​élément précédent correspond au moins à ''​m''​ fois, mais pas plus de ''​n''​ fois .\\ Par exemple, ''​a{3,​5}''​ correspond uniquement ''​aaa'',​ ou ''​aaaa'',​ ou ''​aaaaa''​. ​ | +|**''​\\)''​** et **''\{ \}''​** | Avec les ERb le caractère ​''​\'' ​donne un sens particulier aux parenthèses et accolades.\\ (anciennes versions de Bash)\\ Mais avec les ERe le caractère ''​\''​ échappe la signification spéciale des parenthèses et des crochets | 
-| ''​{ }''​ | "​exactement trois fois" par exemple ''​a{3}''​ correspond strictement à ''​aaa''​ . | +|**Caractères des ERe**\\ Bash 3.0 les reconnaît dans le contexte des regroupement ​       | **Significations** ​   ​
-| ''​{n,​}''​ | "jusqu'​à trois fois". «trois ​fois ou plus». Par exemple, ''​{3,​}''​ correspond aaa ou aaaa, etc. (équivalent de ''​a*''​) | +**''​?''​**                    ​| Correspond ​zéro ou une fois à le regroupement précédent. Par exemple, ​''​[er]?'' ​correspond à la sous-chaîne ​"​er"​ pouvant être présente ou pas dans une chaîne.\\ (//​Attention en ligne de commandes **''​?''​** signifie "un caractère quelconque et un seul"//​) ​
-| ''​{,​n}''​ | ''​a{,​3}''​ "​jusqu'​à trois fois". Correspond à la ''​chaîne vide''​ ou ''​a''​ ou ''​aa''​ ou ''​aaa''​ (équivalent ​de ''​a|aa|aaa''​.| +**''​+''​**                    ​| Correspond ​une ou plusieurs fois à le regroupement ​précédent. Par exemple, ''​[er]+''​ correspond à ''​er'',​ ''​erer'',​ ''​ererer'', ​et ainsi de suitemais pas être absente. | 
-|POSIX extended | Bash avec correctif, sinon il faut \ devant parenthèse et crochet. ''​\( \)''​ et ''​\{ \}''​ | +| **''​|''​**       | Alternative ​''​er1|er2|er3''​.\\ Par exemple, ​''​abc|def''​ correspond à ''​abc'' ​ou ''​def''​. | 
-|autres caractères ​                 | signification ​   | +|**Caractères ERe pouvant servir à élaborer des sous-chaînes** | **Significations** | 
-| ''?'' ​                   | Correspond zéro ou une fois à l'​élément précédent. Par exemple, ''​ab?​c''​ correspond seulement ''​ac''​ ou ''​abc''​. | +| **''​( )''​** | Regroupement ​
-| ''​+'' ​                   | Correspond une ou plusieurs fois à l'​élément précédent. Par exemple, ''​ab+c''​ correspond à ''​abc'',​ ''​abbc'',​ ''​abbbc'',​ et ainsi de suite, mais pas "​ac"​. | +**''​{m,​n}''​** | l'​élément précédent correspond au moins à ''​m''​ fois, mais pas plus de ''​n''​ fois .\\ Par exemple, ''​a{3,​5}''​ correspond uniquement ''​aaa'',​ ou ''​aaaa'',​ ou ''​aaaaa''​. ​ | 
-| ''​|'' ​      | Correspond à l'​expression d'​avant ''​ou''​ l'​expression d'​après l'​opérateur. Par exemple, ''​abc|def''​ correspond à ''​abc''​ ou ''​def''​. | +**''​{ }''​** | "​exactement trois fois" ​le caractère ou le regroupement ​par exemple ''​a{3}''​ correspond strictement à ''​aaa'' ​; [er]{2} deux fois la er. | 
-| Et toutes [[doc:​programmation:​shell:​regexp#​les-ensembles-de-caracteres-possibles|les classes prédéfinies]]. ​ |''​[:​alnum:​] [:alpha:] [:blank:] [:cntrl:] [:digit:] [:graph:] [:lower:] [:print:] [:punct:] [:space:] [:upper:] [:​xdigit:​]'' ​   |+**''​{n,​}''​** | "n" fois ou plus, le caractère ou le regroupement précédent. Par exemple, ''​{3,​}'' ​"trois fois ou plus" ​correspond aaa ou aaaa, etc. (équivalent de ''​a*''​) | 
 +**''​{,​n}''​** au plus "​n"​ fois, le caractère ou le regroupement précédent. ​''​[ER]{,​3}''​ "​jusqu'​à trois fois" ​groupe ​de ER. | 
 + 
  
   * Référence (ce tableau résume le contenu de ces trois liens) :    * Référence (ce tableau résume le contenu de ces trois liens) : 
Ligne 279: Ligne 285:
  
 <​note>​ <​note>​
-Pour résumer :\\ +**Pour résumer** :\\ 
  
   * Les //​expressions régulières//​ utilisées avec le shell Bash nécessitent l'​opérateur ''​=~''​   * Les //​expressions régulières//​ utilisées avec le shell Bash nécessitent l'​opérateur ''​=~''​
-  ​* On retrouve ​ceux des caractères génériques (globs) basiques ''​*''​, ''​[ ]'', ​''?''​.\\ (avec sens voisin mais étendus par une syntaxe particulière).  +  
-  * On retrouve ​ceux des caractères génériques étendus ''​|'',​ ''​@'',​ ''​!'',​ ''​+'',​ ''​^''​\\ ​ (là aussi avec une nouvelle syntaxe). ​+  ​* On retrouve ​dans ce contexte les caractères génériques (globs) basiques ''​*''​ ''?'' ​mais avec un sens différent 
 +  ​ 
 +  * On retrouve ​dans ce contexte les caractères génériques étendus ''​|'',​ ''​@'',​ ''​!'',​ ''​+'',​ ''​^''​\\ ​ (là aussi avec une nouvelle syntaxe).  
 + 
 +  * Les nouveaux caractères sont ''​+''​ , ''​|''​ , ''​[ - ]''​ , ''​{ , }''​ , ''​( )''​ , ''​\n'',​ ainsi que  ''​[ ]{n}''​ et ''​[:​class:​]''​.  
 +   
 +  * Elles ne s'​utilisent __jamais__ avec la syntaxe de correspondance ou de substitution de type : ''<​nowiki>​$var/​.../​...</​nowiki>''​ ou ''<​nowiki>​$var//​.../​...</​nowiki>''​.
  
-  ​* Les nouveaux caractères sont ''​{ , }''​ , ''​( )''​ , ''​\n'',​ ainsi que l'​enchâssement de crochets simples ''​[ ]''​.  +  * Elles s'​utilisent ​__uniquement pour la correspondance ​avec des variables__. 
-  ​* Elles ne s'​utilisent ​pas avec la syntaxe de correspondance ​ou de substitution de type : ''<​nowiki>​$var/​.../...</nowiki>''​ ou ''<​nowiki>​$var//.../...</nowiki>''​ +   
-  * Ce sont les ER d'​autres programmes qui recourent à une syntaxe ressemblante\\ (voir index correspondance et substitution).  +  * Les caractères spécifiques aux expressions régulières (//ERb// et //ERe//) utilisées ici uniquement dans le contexte ​de correspondance avec une variable, ​sont identiques ​et ont une signification similaire lorsqu'​ils sont utilisés avec d'​autres programmes, grep, grep -E, sed, sed -r, awk, mais dans un contexte beaucoup plus large.\\ (comparez avec [[http://​wiki.debian-facile.org/​atelier:​chantier:​bash-vii-globs-etendus-regex?&#​index-1caracteres-regexp-sed|l'index1]]).
-  * Beaucoup ​de ces métacaractères ​sont identiques ​à ceux des expressions régulières ​d'​autres programmes\\ (comparez avec l'index).+
 </​note>​ </​note>​
  
Ligne 347: Ligne 358:
  
 **Un grand merci à captnfab pour conseils avisés et toutes ses corrections.** ​ **Un grand merci à captnfab pour conseils avisés et toutes ses corrections.** ​
-=====INDEX 1 : caractères ​regexp ​sed=====+=====INDEX 1 : caractères ​des ERb et ERe avec grep, grep -E, sed, sed -r===== 
  
-[[utilisateurs:hypathie:​tutos:​accueil?&#​les-caracteres-utilises-pour-creer-des-regexp-avec-sed|Les caractères utilisés pour créer des regexp avec sed]]+=====INDEX 2 REGEXP communs à Perl, Emacs, vim=====
  
-=====INDEX 2 : caractères regexp egrep ===== +Un petit rappel non exhaustif des caractères spéciaux ​qui leur sont communs.
-=====INDEX 3===== +
-==== Rappel des principaux caractères des expressions rationnelles ====  +
-Un petit rappel non exhaustif des caractères spéciaux ​relatifs aux expressions rationnelles utilisable avec Perl, PHP, JavaScript, MySQL.\\ +
  
 ^ ^ ^ ^ ^ ^
Ligne 372: Ligne 381:
  
   * Référence :\\ [[http://​oreilly.com/​php/​excerpts/​php-mysql-javascript/​regex-in-php-javascript.html]]   * Référence :\\ [[http://​oreilly.com/​php/​excerpts/​php-mysql-javascript/​regex-in-php-javascript.html]]
-  * Apprendre à utiliser les expressions régulières sous perl :\\ [[http://​perldoc.perl.org/​perlrequick.html]]\\ [[http://​perldoc.perl.org/​perlre.html]] +  * Apprendre à utiliser les expressions régulières sous perl :\\  ​[[https://​ensiwiki.ensimag.fr/​index.php/​Expressions_r%C3%A9guli%C3%A8res]]\\  ​[[http://​perldoc.perl.org/​perlrequick.html]]\\ [[http://​perldoc.perl.org/​perlre.html]] 
-=====INDEX ​: l'​ordre des caractères ASCII =====+=====INDEX ​: l'​ordre des caractères ASCII =====
 Voici  : Voici  :
  
doc/programmation/shells/bash-vii-globs-etendus-regex.txt · Dernière modification: 22/10/2015 18:31 par milou

Pied de page des forums

Propulsé par FluxBB