logo Debian Debian Debian-France Debian-Facile Debian-fr.org Forum-Debian.fr Debian ? Communautés logo inclusivité

Debian-facile

Bienvenue sur Debian-Facile, site d'aide pour les nouveaux utilisateurs de Debian.

Vous n'êtes pas identifié(e).


L'icône rouge permet de télécharger chaque page du wiki visitée au format PDF et la grise au format ODT → ODT PDF Export

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
Prochaine révision
Révision précédente
Prochaine révision Les deux révisions suivantes
utilisateurs:hypathie:tutos:erb-et-ere-par-le-contexte-des-commandes [12/08/2014 12:02]
Hypathie [Les caractères spécifiques aux ERb]
utilisateurs:hypathie:tutos:erb-et-ere-par-le-contexte-des-commandes [14/08/2014 06:12]
Hypathie [Introduction]
Ligne 1: Ligne 1:
 ======Les expressions rationnelles sous le jour des commandes ====== ======Les expressions rationnelles sous le jour des commandes ======
  
-  * Objet : maîtriser les expressions rationnelles, ERb et ERe+  * Objet : maîtriser les expressions rationnelles ​basiques ​et étendues ainsi que les classes POSIX
   * Niveau requis : {{avisé}}   * Niveau requis : {{avisé}}
-  * Commentaires : utiliser les expressions rationnelles basiques ​et étendues avec grep, find, locate, expr, sed, awk.+  * Commentaires : utiliser les expressions rationnelles basiquesétendues, les classes ​avec grep, grep -E, find, locate, expr, vised et awk.
  
 **NOTA**\\ ​ **NOTA**\\ ​
-Il s'​agira de distinguer ERb et ERe et de savoir les utiliser ​en fonction des commandes ​qui les utilisent pour effectuer des recherches ​de fichiers, des recherches dans le contenu des fichiers, ​et pour les commandes ​d'​édition, des modifications (ajout, suppression dans le contenu) ​de fichiers. +Il s'​agira de distinguer ​les différents usages des ERbERe et des classes ​en fonction des commandes de recherche ​et d'​édition de fichiers ​GNU/linux.
- +
  
 =====Introduction ===== =====Introduction =====
-Pour apprendre à utiliser les expressions rationnelles,​ il faut en passer par l'​exercice.\\ ​ 
-Mais pour être en mesure d'en passer par l'​exercice,​ il faut nécessairement en passer par les programmes utilisant les expressions rationnelles. C'est là que les choses se compliquent pour le néophyte.\\ ​ 
    
 Il faut savoir en effet que : Il faut savoir en effet que :
  
-  ​* la configuration locale affecte la façon dont les expressions rationnelles sont interprétées((Voir Variables d'​environnement,​ pour une description de la façon dont la configuration de votre environnement local influe sur l'​interprétation des expressions rationnelles)). +  * qu'il y a plusieurs types d'​expressions rationnelles,​ celles reposant sur [[http://​fr.wikipedia.org/​wiki/​Biblioth%C3%A8que_logicielle|la bibliothèque]] REGEX, celles reposant sur la bibliothèque [[http://​fr.wikipedia.org/​wiki/​PCRE|PCRE]].
- +
-  ​* qu'il y a également ​plusieurs types d'​expressions rationnelles,​ celles reposant sur [[http://​fr.wikipedia.org/​wiki/​Biblioth%C3%A8que_logicielle|la bibliothèque]] REGEX, celles reposant sur la bibliothèque [[http://​fr.wikipedia.org/​wiki/​PCRE|PCRE]].+
  
   * qu'il y a différents programmes qui utilisent soit l'une, soit l'​autre bibliothèque par exemple grep,  expr, awk, Perl, Tcl, Python... Je ne parlerai que de ceux pouvant utiliser la bibliothèque REGEX.   * qu'il y a différents programmes qui utilisent soit l'une, soit l'​autre bibliothèque par exemple grep,  expr, awk, Perl, Tcl, Python... Je ne parlerai que de ceux pouvant utiliser la bibliothèque REGEX.
Ligne 25: Ligne 20:
   * La syntaxe d'​utilisation des //ER// n'est pas la même d'un programme à l'​autre. C'est ce qui motive la rédaction de cette page. Il faut forcément maîtriser la manière d'​utiliser les //ER// pour chacun des programmes pour pouvoir les utiliser. Mettre ces différences en avant démystifiera la difficulté attribuée à l'​usage des expressions rationnelles.   * La syntaxe d'​utilisation des //ER// n'est pas la même d'un programme à l'​autre. C'est ce qui motive la rédaction de cette page. Il faut forcément maîtriser la manière d'​utiliser les //ER// pour chacun des programmes pour pouvoir les utiliser. Mettre ces différences en avant démystifiera la difficulté attribuée à l'​usage des expressions rationnelles.
  
-  * Enfin, les différents programmes susceptibles d'​utiliser toutes les //ER// de la bibliothèque REGEX, vi, expr, grep, egrep, find, locate, sed, awk, etc., bien que pouvant tous utiliser la norme POSIX, __transforment le contexte d'​utilisation de l'//​ER//​ et par conséquent,​ l'​utilisation d'une même //ER// n'a plus le même effet d'un programme à l'​autre__.\\ C'est là un point crucial, rarement mis en avant et qu'il est pourtant nécessaire de soulever, pour des raisons pédagogiques,​ mais aussi pour des raisons philosophiques que je ne développerai pas.\\ Le fondement en est simplement la conviction que toute moquerie ​envers la diversité, tandis qu'un méta-langage est par définition l'​unité cachée derrière tout genre de multiple, est une tentative qui s'​ignore de ramener le méta-langage lui-même à une simple symbolisation du langage, et par conséquent,​ une tentative intéressée d'​instrumentaliser la raison. ​+  * Enfin, les différents programmes susceptibles d'​utiliser toutes les //ER// de la bibliothèque REGEX, vi, expr, grep, egrep, find, locate, sed, awk, etc., bien que pouvant tous utiliser la norme POSIX, __transforment le contexte d'​utilisation de l'//​ER//​ et par conséquent,​ l'​utilisation d'une même //ER// n'a plus le même effet d'un programme à l'​autre__.\\ C'est là un point crucial, rarement mis en avant et qu'il est pourtant nécessaire de soulever, pour des raisons pédagogiques,​ mais aussi pour des raisons philosophiques que je ne développerai pas.\\ Le fondement en est simplement la conviction que le dédain ​envers la diversité, tandis qu'un méta-langage est par définition l'​unité cachée derrière tout genre de multiple, est une tentative qui s'​ignore de ramener le méta-langage lui-même à une simple symbolisation du langage, et par conséquent,​ une tentative intéressée d'​instrumentaliser la raison. ​
  
-Le contexte de cet apprentissage,​ se limitera donc à l'​__utilisation ​des expressions rationnelles au moyen des commandes de gestion des fichiers__, et appréhendera ​seulement les expressions rationnelles POSIX qui reposent sur la bibliothèque ​regex, et qui s'​utilisent en ligne de commandes ou dans des scripts shell.+**Cette présentation ​des expressions rationnelles ​montera comment les utiliser ​au moyen des commandes de recherches et d'​édition de fichiers, et cela, en appréhendant ​seulement les expressions rationnelles POSIX de la bibliothèque ​REGEX.\\ 
  
-==== Panorama exhaustif des programmes concernés ​====+En bref, il s'​agira de présenter les types de //ER// qui s'​utilisent en ligne de commandes ou dans des scripts shell GNU/​linux.** 
 + 
 +====Les types de ER ==== 
 +Il y en a trois : 
 + 
 +  * expression rationnelle basique (ERb); appelées aussi "Basic Regular Expression"​ (BRE) 
 + 
 +  * expression rationnelle étendue (ERe); appelées aussi "​Extended Regular Expression"​ (ERE) 
 + 
 +  * les classes POSIX (considérer soit comme ERb, soit comme ERe selon les programmes 
 + 
 +Les raccourcis (par exemples, retour à la ligne ''​\n'',​ tabulation ''​\t''​) étant particuliers aux programmes, seront listés en complément. 
 + 
 +==== Panorama exhaustif des programmes ​GNU/​Linux ​concernés ​par les expressions rationnelles===
  
   * **expr** : **ERb**\\ pour la correspondance de chaîne de caractères avec une expression régulière.   * **expr** : **ERb**\\ pour la correspondance de chaîne de caractères avec une expression régulière.
Ligne 39: Ligne 47:
   * **sed** : **ERb**\\ par exemple, sélectionne,​ modifie les chaînes d'un fichier ou de l'​affichage ​ en se basant sur les colonnes. La //ER// permet de sélectionner quelle(s) colonne(s) est (sont) concernée(s).   * **sed** : **ERb**\\ par exemple, sélectionne,​ modifie les chaînes d'un fichier ou de l'​affichage ​ en se basant sur les colonnes. La //ER// permet de sélectionner quelle(s) colonne(s) est (sont) concernée(s).
   * **sed -r** : **ERe**\\ même usage que sed.   * **sed -r** : **ERe**\\ même usage que sed.
-  * **awk** : **ERe**\\ sélectionne les colonnes, lignes, mots d'un fichier, et modifie l'​affichage,​ le fichier, etc. en utilisant la //ER// comme condition de l'​action qu'on choisit+  * **awk**((c'​est-à-dire **gawk**\\ ''​whereis awk''​\\ awk: /​usr/​bin/​awk\\ ''​ls -l /​usr/​bin/​awk''​\\ lrwxrwxrwx 1 root root 21 juin   8 18:43 /​usr/​bin/​awk -> /​etc/​alternatives/​awk\\ ''​ls -l /​etc/​alternatives/​awk''​\\ lrwxrwxrwx 1 root root 13 juil. 13 18:41 /​etc/​alternatives/​awk -> /​usr/​bin/​**gawk**)) ​: **ERe**\\ sélectionne les colonnes, lignes, mots d'un fichier, et modifie l'​affichage,​ le fichier, etc. en utilisant la //ER// comme condition de l'​action qu'on choisit.
- +
-//On peut aussi combiner, par exemple, **find** et **grep** permettent de rechercher une chaîne et le fichier contenant cette chaîne en une ligne de commande avec un pipe.// Mais, concernant tous ces programmes, je n'​entrerai pas dans les combinaisons possibles que le shell permet entre eux et je me limiterai strictement à leur utilisation par rapport aux //ER//+
  
-Dans un premier temps, je donnerai ​la liste des caractères ERb et ERepuis je montrerai comment les utiliser avec chacun de ces programmes.+Concernant chacun de ces programmes, je n'​entrerai ni dans les combinaisons possibles entre eux, ni n'​approfondirai chacun d'eux en détail. Voir pour cela la documentation à leur sujet.\\  
 +Les concernant, je me limiterai strictement à leur utilisation des //ER//
  
 ====Avant de commencer un rappel des métacaractères du shell==== ====Avant de commencer un rappel des métacaractères du shell====
Ligne 171: Ligne 178:
 </​note>​ </​note>​
  
-Puisque tout est bien clair, nous pouvons aller plus loin 8-)+**Puisque tout est bien clair, nous pouvons aller plus loin, et présenter comment utiliser les programmes GNU/Linux avec chacun des trois types d'​expression rationnelles** ​8-)
  
-=====Les expressions rationnelles basiques ​selon les commandes=====+=====Les expressions rationnelles basiques ​et les commandes ​GNU/Linux=====
 ====Caractères communs aux ERb et ERe==== ====Caractères communs aux ERb et ERe====
 +<note tip>
 +  * Certains caractères sont communs au ERb et ERe.\\ Pour ne pas avoir à les répéter, il est préférable de les regrouper. D'​autant plus que les commandes qui permettent de se servir des expressions rationnelles,​ reconnaissent tous les caractères communs aux ERb et ERe.
  
-Certains caractères sont communs au ERb et ERe, pour ne pas avoir à les répéter, ​il est préférable de les regrouper. D'autant plus que les commandes qui permettent ​de se servir des ER en général, reconnaissent tous les caractères communs aux ERb et ERe, excepté pour les classes+  * Certaines commandes utilisent soit les ERb soit les ERe en fonction d'​option :\\ il s'agit de **''​grep''​** ; **''​sed''​** ; **''​locate''​** ; et **''​find''​**.
  
 +  * **''​awk''​** (gawk) utilise les ERe.
 +
 +  * **''​vi''​** (vim) et **''​expr''​** n'​utilisent que les ERb.
 +
 +</​note>​
  
 ^expressions ^Modèles reconnus ^ ^expressions ^Modèles reconnus ^
Ligne 192: Ligne 206:
  
  
 +====La commande grep et les caractères communs aux ERb et ERe====
 +<note tip>
 +Sans option ou avec l'​option -G, grep utilise les expressions rationnelles basiques.
  
-Certaines commandes utilisent soit les ERb soit les ERe en fonction d'​option : il s'agit de grep ; sed ; locate ; et find.\\ ​ +<code man grep> 
-Awk utilise les ERe.\\ ​ +-G, --basic-regexp 
-Je les présente ici, parce qu'elles utilisent toutes les caractères communs aux ERb et ERe.+    ​Interpréter le MOTIF comme  une  expression ​ rationnelle ​ simple 
 +    C'est le comportement par défaut.
  
-Je présenterai les commandes qui utilisent seulement les ERb dans le chapitre concernant les caractères spécifiques aux ERb. Les caractères communs aux ERb et ERe étant alors suffisamment exemplifiés. De plus, les caractères spécifiques aux ERb servent à composer des expressions rationnelles plus complexes, utilisant ces caractères communs aux ERb et ERe.+</​code>​
  
-====la commande ​grep et les caractères communs ​aux ERb et ERe==== +Voir ci-dessous pour l'​utilisation de grep (grep -G) avec [[utilisateurs:​hypathie:​tutos:​erb-et-ere-par-le-contexte-des-commandes?&#​grep-ou-grep-g-et-les-caracteres-specifiques-aux-erb|les caractères spécifiques aux ERb]]. 
-Sans l'​option ​-E, grep fonctionne avec les ERb.+</​note>​
  
   * Soit le fichier "​liste1-nom"​ :   * Soit le fichier "​liste1-nom"​ :
Ligne 319: Ligne 337:
  
 ====La commande find et les caractères communs aux ERb et ERe==== ====La commande find et les caractères communs aux ERb et ERe====
 +<code man find>
 +-regextype type
 +        Définir la syntaxe des expressions rationnelles des tests -regex
 +        et -iregex qui seront indiqués plus loin sur la  ligne  de  com‐
 +        mande. Les  types actuellement implémentés sont emacs (type par
 +        défaut), posix-awk, posix-basic,​ posix-egrep et posix-extended.
 +
 +</​code>​
  
 <note tip> <note tip>
-Les types de //ER// actuellement implémentés sont emacs.\\  +Avec find il faut toujours une option pour utiliser une //ER//.\\ 
-Pour utiliser les ERb il faut utiliser l'option ​-regextype posix-basic ​pour définir le type de ER qu'on souhaite utiliser.\\ +
-Mais aussi l'une des options prévenant find, qu'on va utiliser une ER, de même qu'on prévient qu'on cherche un motif en respectant la casse avec -name : +
-  * ''​-regex motif''​ : Nom de fichier correspondant à l'​expression ​ rationnelle ​ '​motif'​.\\ Il  s'agit d'une correspondance sur le chemin complet, pas d'​une\\ recherche. Par exemple, pour mettre en correspondance un fichier\\ nommé « ./fubar3 », vous pouvez utiliser les expressions rationnelles « .*bar. » ou « .*b.*3 », mais pas « f.*r3 ».\\ +
  
-  * ''​-iregex motif''​ : Semblable à -regex, ​mais sans différencier les majuscules et les\\ minuscules.+  ​* Pour une expression rationnelle basique :\\  
 +<​code>​ 
 +find -regextype "​posix-basic"​ -regex "​son-expression-rationnelle-basique"​ 
 +</​code>​ 
 + 
 +  * Pour une expression rationnelle étendue :\\ 
 +<​code>​ 
 +find -regextype "​posix-extended"​ -regex "​son-expression-rationnelle-étendue"​ 
 +</​code>​  
 + 
 +  * Il faut aussi prévenir find, qu'on va utiliser une ER avec :((de même qu'on prévient qu'on cherche un motif en respectant la casse avec ''​-name''​)) 
 +    * **''​-regex ER''​** 
 +    * **''​-iregex motif''​** : Semblable à -regex, ​pour ne pas tenir compte de la casse (ne pas différencier les majuscules et les minuscules). 
 + 
 +  * Il  s'agit d'une correspondance sur __le chemin complet__.\\ Pour représenter un chemin absolu quelque soit-il, il faut ajouter en début d'​expression **''​.*''​**.  
 + 
 +Je ne donnerai ici quelques exemples d'​utilisation des caractères communs aux ERb et ERe, en tant que caractères ERb, afin d'​illustrer l'​utilisation de find avec l'​option ''​-regextype "​posix-basic''​.\\  
 + 
 +Pour l'​utilisation des caractères spécifiques aux ERb avec find, voir : [[utilisateurs:​hypathie:​tutos:​erb-et-ere-par-le-contexte-des-commandes?&#​find-et-les-caracteres-specifiques-aux-erb|find et les caractères spécifiques aux ERb]]\\  
 + 
 +Pour l'​illustration de find avec les ERe voir :
 </​note>​ </​note>​
  
-Je ne donnerai que quelques exemples, puisque tous les caractères de ERb sont utilisables. \\ Je m'​attacherai surtout à la syntaxe de find pour ce faire. 
  
   * Soit le __répertoire parent__ des fichiers listés ci-dessous :   * Soit le __répertoire parent__ des fichiers listés ci-dessous :
Ligne 349: Ligne 391:
 >Le premier groupe de ''​.*''​ décrit le chemin du ou des fichiers dont le nom correspond à une chaîne commençant par "​li",​ suivi de plusieurs caractères (deuxième groupe ''​.*''​),​ puis d'un "​m"​. >Le premier groupe de ''​.*''​ décrit le chemin du ou des fichiers dont le nom correspond à une chaîne commençant par "​li",​ suivi de plusieurs caractères (deuxième groupe ''​.*''​),​ puis d'un "​m"​.
  
->Attention la même commande lancée depuis le répertoire personnel de l'​utilisateur ​par exemple ​et non depuis le répertoire parent des fichiers :+>La même commande lancée ​depuis un répertoire plus en amont dans la hiérarchie,​ par exemple, ​depuis le répertoire personnel de l'​utilisateur,et non depuis le répertoire parent des fichiers :
  
 <​code>​find -regextype "​posix-basic"​ -regex "​.*/​li.*m"</​code>​ <​code>​find -regextype "​posix-basic"​ -regex "​.*/​li.*m"</​code>​
Ligne 374: Ligne 416:
  
 ====La commande locate et les caractères communs aux ERb et ERe==== ====La commande locate et les caractères communs aux ERb et ERe====
 +
 <note tip> <note tip>
-Pour utiliser les ERb, il faut utiliser ​l'option ​:+Pour utiliser les //ER// avec locate, il faut dans tous les cas une option.\\  
 +Les caractères communs aux ERb et ERe, peuvent être utilisés avec l'une ou l'​autre de ces options ​:
  
-<​code>​--regexp</​code> ​+  * __Pour utiliser les ERb, il faut utiliser l'​option__ :
  
-Sinon, ​locate ​reconnaît le caractère ''​*''​ comme un métacaractère du shell.\\ +<code man locate
 +--regexp REGEXP 
 +      Search for a basic regexp REGEXP. ​ No PATTERNs ​ are  allowed ​ if 
 +      this  option ​ is used, but this option can be specified multiple 
 +      times. 
 +</​code>​
  
-Contrairement à find, il n'est pas nécessaire que la ER corresponde au chemin absolu d'​un ​fichier.\\  +  * __Pour utiliser ces mêmes caractères en tant que ERe il faut utiliser l'​option__ : 
-Mais la quantité de réponses peut être très élevée, si on a une idée du répertoire dans lequel se trouve le fichier recherché, il peut plus confortable de le préciser.\\ ​+<code man locate>​ 
 +--regex 
 +       ​Interpret all PATTERNs as extended regexps 
 +</​code>​ 
 + 
 +Sans l'une ou l'​autre de ces options, locate reconnaît le caractère ''​*''​ comme un métacaractère du shell.\\  
 + 
 +=> Cela a une conséquence par rapport aux caractères ERb qui ne sont pas communs aux ERe.\\  
 +Autrement dit, si on choisit d'​utiliser les ERb, il faudra un antislash pour utiliser [[utilisateurs:​hypathie:​tutos:​erb-et-ere-par-le-contexte-des-commandes?&#​caracteres-specifiques-aux-erb|les caractères spécifiques aux ERb]] et ce sera inutile si on choisit les ERe. 
 + 
 +Voir l'​utilisation de [[utilisateurs:​hypathie:​tutos:​erb-et-ere-par-le-contexte-des-commandes?&#​locate-et-les-caracteres-specifiques-aux-erb|locate avec les caractères spécifiques aux ERb]]. 
 + 
 + 
 +  *Contrairement à find, __il n'est pas nécessaire que la ER corresponde au chemin absolu d'​un ​fichier__.\\  
 +Mais la quantité de réponses peut être très élevée, ​et si l'on a une idée du répertoire dans lequel se trouve le fichier recherché, il peut plus confortable de le préciser.\\ ​
 On peut aussi filtrer le retour avec grep.\\ ​ On peut aussi filtrer le retour avec grep.\\ ​
-Néanmoins, l'​utilisation des ERe règle ce problème. (Voir plus bas) 
  
-Enfin, avec l'​utilisation de locate, ​on n'aura guère l'​occasion d'​utiliser les caractères ​début (^) et fin de ligne ($).\\  +  * Enfin, avec l'​utilisation de locate, ​le caractère ​début (^) est inusité.\\  
-En effet, avec une commande qui cherche ​des noms de fichiers en fonction d'une chaîne contenu dans ce nomon ne peut utiliser que '' '​^/'​ '', c'est-à-dire, ​le début du chemin absolu, ce qui demande d'​allonger inutilement l'​expression régulière !+ 
 +En effet, avec une commande qui recherche ​des noms de fichierla seule possibilité serait **''​^/''​**. Or locate permet justement de ne pas avoir à donner ​le chemin absolu ​du fichier recherché. L'​utiliser ne ferait qu'​allonger inutilement l'​expression régulière !
 </​note>​ </​note>​
  
   * Étoile et point   * Étoile et point
 <code user>​locate --regexp '/​home.*[Tt]o.*'</​code>​ <code user>​locate --regexp '/​home.*[Tt]o.*'</​code>​
->Donne un retour de plusieurs pages par exemple en cas d'une grande quantité de photo dans un des répertoires de l'​utilisateur. 
  
 +>Donne un retour de plusieurs pages.
  
 <code user>​locate --regexp '/​home.*[Tt]o.*'​ | grep "/​Dossier/"</​code>​ <code user>​locate --regexp '/​home.*[Tt]o.*'​ | grep "/​Dossier/"</​code>​
Ligne 402: Ligne 465:
 /​home/​hypathie/​ERetCMD/​Dossier/​toto /​home/​hypathie/​ERetCMD/​Dossier/​toto
 /​home/​hypathie/​ERetCMD/​Dossier/​toto. /​home/​hypathie/​ERetCMD/​Dossier/​toto.
 +</​code>​
 +
 +  * caractère fin de ligne $ :
 +<code user>​locate --regexp '/​home.*/​Dossier/​[Tt]o.*\.txt$'</​code>​
 +<​code>​
 +/​home/​hypathie/​ERetCMD/​Dossier/​Toto.txt
 +/​home/​hypathie/​ERetCMD/​Dossier/​Toto1.txt
 </​code>​ </​code>​
  
Ligne 605: Ligne 675:
 toutefois toutefois
 </​code>​ </​code>​
- 
- 
- 
- 
- 
- 
- 
- 
-=====Caractères spécifiques aux ERb  ===== 
-^expressions ​                          ​^Modèles reconnus ​                            ^ 
-|**''<​nowiki>​\{m\}</​nowiki>''​** ​       | m fois le caractère précédent ​              | 
-|**''<​nowiki>​\{m,​\} </​nowiki>''​** ​     | au moins m fois le caractère précédent ​     | 
-|**''<​nowiki>​\{m,​n\} </​nowiki>''​** ​    | entre m et n fois le caractère précédent ​   | 
-|**''<​nowiki>​\(ERb\)</​nowiki>''​** ​     | mémorisation d'une ERb                      | 
-|**''<​nowiki>​\1,​ \2, ...</​nowiki>''​** ​ | Rappel de mémorisation ​                     | 
- 
--> Le caractère **''​\''​** donne une signification spéciale aux parenthèses et accolades, au lieu de les rendre littérales.\\ ​ 
-Mais il permet de rendre littéraux les autres caractères des ERb, par exemple ''​\.''​ permet de sélectionner un point. 
- 
-<note tip> 
-Je présenterai ici les commandes "​spécifiques"​ aux ERb, c'​est-à-dire,​ celles qui n'ont pas la possibilité d'​utiliser les ERE,  vi (vim) et expr.\\ ​ 
-Elles utilisent bien sûr tous les caractères ERb et pas seulement les caractères spécifiques aux ERb. 
-</​note>​ 
  
 ====La commande expr n'​utilise que ERb==== ====La commande expr n'​utilise que ERb====
Ligne 639: Ligne 686:
 abc2356.99 abc2356.99
 73000|Savoie 73000|Savoie
 +123456
 +1234567
 index-tel|04|Rhône-Alpe index-tel|04|Rhône-Alpe
 -15 +36 5687 {15} exemple{36} -15 +36 5687 {15} exemple{36}
 il y a un truc et un truc et encore un truc et une chose il y a un truc et un truc et encore un truc et une chose
-chose et truc ne font pas bon ménage+choses ​et trucs ne font pas bon ménage
 123.3456.abc 123.3456.abc
-trucchosetruc +trucschosetruc 
-tructructruc+tructructrucs
 chosechosechose chosechosechose
 </​code>​ </​code>​
Ligne 654: Ligne 703:
 <note tip> <note tip>
   * La commande expr utilise l'​opérateur **'':''​** pour mettre en correspondance une chaîne de caractères avec une //ER//.   * La commande expr utilise l'​opérateur **'':''​** pour mettre en correspondance une chaîne de caractères avec une //ER//.
-  * Si le nombre de caractères de la chaîne correspond à l'ERb, alors expr affiche à l'​écran ​l'​expression régulière basique.+  * Si le nombre de caractères de la chaîne correspond à l'ERb, alors expr affiche ​ce nombre ​à l'​écran.
   * Si la correspondance décrite ci-dessus est vraie, le code de retour est 0 (zéro).   * Si la correspondance décrite ci-dessus est vraie, le code de retour est 0 (zéro).
   * Si elle est fausse, expr retourne 0 (zéro) pour "zéro correspondance) et le code de retour est 1 (un).   * Si elle est fausse, expr retourne 0 (zéro) pour "zéro correspondance) et le code de retour est 1 (un).
   * L'​expression rationnelle est comparée par rapport au début de la variable, le caractère **''​^''​** est toujours implicite.   * L'​expression rationnelle est comparée par rapport au début de la variable, le caractère **''​^''​** est toujours implicite.
   * Si une partie de l'​expression rationnelle est mémorisée avec **''​\( \)''​** la commande expr affiche dans le terminal la partie correspondante.   * Si une partie de l'​expression rationnelle est mémorisée avec **''​\( \)''​** la commande expr affiche dans le terminal la partie correspondante.
 +
 +
 </​note>​ </​note>​
  
Ligne 703: Ligne 754:
  
 >​Demander le code de retour est inutile, la ER est forcément juste, s'il y a affichage de la sous-chaîne correspondante. À moins d'en avoir besoin lors d'une utilisation de expr dans un script shell s'en servant pour un test. >​Demander le code de retour est inutile, la ER est forcément juste, s'il y a affichage de la sous-chaîne correspondante. À moins d'en avoir besoin lors d'une utilisation de expr dans un script shell s'en servant pour un test.
- 
-  * sous-chaîne et quantificateur accolades : 
- 
-<code user>​var=123.456.</​code>​ 
-<code user>​expr "​$var"​ : '​\([0-9]\{3\}.\)\{2\}'</​code>​ 
-<​code>​ 
-456. 
-</​code>​ 
- 
-> expr affiche la sous-chaîne "​456."​ 
- 
- 
-  *Le caractère **''​*''​** est gourmand : 
-<code user>​var="​hypathie|00 rue Debian-facile|01011|ici"</​code>​ 
-<code user>​expr "​$var"​ : '​\(.*\)|'</​code>​ 
-<​code>​ 
-hypathie|00 rue Debian-facile|01011 
-</​code>​ 
- 
  
  
 +====L'​éditeur de texte vi n'​utilise aussi que les ERb ====
  
-====L'​éditeur de texte vi n'​utilise que les ERb ==== 
 ===Préparation === ===Préparation ===
 <code user>cat liste4-vim</​code>​ <code user>cat liste4-vim</​code>​
Ligne 744: Ligne 776:
  
 <note tip> <note tip>
-Rappel des modes\\ +Modes utilisés dans ce qui suit :\\ 
  
  
Ligne 754: Ligne 786:
  
   * Pour tester ce qui suit si vous ne connaissez pas vi ou vim :\\    * Pour tester ce qui suit si vous ne connaissez pas vi ou vim :\\ 
-    *Après installation de vim, créer un fichier, par exemple "​liste4-vim"​ : ''​ vim liste4-vim ''​ +    *Après ​[[doc:​editeurs:​vim:​vim#​installation|installation de vim]], créer un fichier, par exemple "​liste4-vim"​ : ''​ vim liste4-vim ''​ 
-    *Copier le contenu de "​liste4-vim"​ ci-dessus ; +    * Copier le contenu de "​liste4-vim"​ ci-dessus ; 
-    *coller dans le fichier "​liste4-vim"​ édité avec vim en faisant ​+    * Pour coller dans le fichier "​liste4-vim"​ édité avec vim : 
     * touche <​majuscule de droite> + touche <​inser>​ (cela fait que l'on est en mode insertion)     * touche <​majuscule de droite> + touche <​inser>​ (cela fait que l'on est en mode insertion)
     * sortir du mode insertion : touche "​Échap"​     * sortir du mode insertion : touche "​Échap"​
-    * enregistrez ​: ''​ :wq ''​ et touche <​entrée>​ +    * enregistrer et sortir ​: ''​ :wq ''​ et touche <​entrée>​ 
- +  * Pour apprendre les rudiments ​de l'​utilisation de vim (et donc de vi), après l'​installation de vim :
-  * Pour apprendre les rudiment ​de l'​utilisation de vim (et donc de vi), après l'​installation de vim :+
  
   vimtutor   vimtutor
- 
  
 -> Pour y ajouter l'​utilisation des //ER//, suivre ce qui suit. -> Pour y ajouter l'​utilisation des //ER//, suivre ce qui suit.
 </​note>​ </​note>​
  
 +  * Éditer le fichier "​liste4-vim"​ :
 +  * Pour éditer le fichier avec vi ou vim :
 +
 +<code user>vi liste4-vim</​code>​
 +ou 
 +<code user>vim liste4-vim</​code>​
 +
 +{{http://​pix.toile-libre.org/​upload/​original/​1407922486.png?​400}}
  
 ===Syntaxe d'​utilisation des ER=== ===Syntaxe d'​utilisation des ER===
Ligne 799: Ligne 837:
   *i - drapeau - ignorer la casse (prend en compte toutes les occurrences de la chaîne en majuscules ou en minuscules)   *i - drapeau - ignorer la casse (prend en compte toutes les occurrences de la chaîne en majuscules ou en minuscules)
 </​note>​ </​note>​
- 
- 
- 
  
 ===Exemples de recherches === ===Exemples de recherches ===
Ligne 819: Ligne 854:
 On valide avec entrée, et ''​nohlsearch''​ pour effacer On valide avec entrée, et ''​nohlsearch''​ pour effacer
  
-  * sous-chaîne avec parenthèses et accolades : +
-<​code>​ +
-\([0-9]\{3\}.\)\{2\} +
-</​code>​ +
-Vi ou vim surligne à la ligne 9 (comportant "​123.3456.abc"​) la sous-chaîne **''​123.3456.''​**.+
  
 ===Exemples de substitution=== ===Exemples de substitution===
Ligne 840: Ligne 871:
 </​code>​ </​code>​
  
->"​1,​$"​ est l'​adressage qui signifie de la première ligne à la fin+>"​1,​$"​ est l'​adressage qui signifie de la première ligne à la fin
 + 
 +  * sous-chaîne avec parenthèses et accolades : 
 +<​code>​ 
 +/​\([0-9]\{3\}.\)\{2\} 
 +</​code>​ 
 +Vi ou vim surligne à la ligne 9 (comportant "​123.3456.abc"​) la sous-chaîne **''​123.3456.''​**. 
 + 
 + 
 + 
 +=====Caractères spécifiques aux ERb et ERe ===== 
 + 
 +<note tip> 
 +Je présenterai ici les commandes qui utilisent uniquement les ERb, c'​est-à-dire,​ celles qui n'ont pas besoin d'une option pour utiliser les expressions rationnelles et qui n'​utilisent que les expressions rationnelles basiques, et donc forcément les caractères spécifiques aux ERb.\\  
 +Il s'agit de **''​expr''​** et **''​vi''​**.\\  
 + 
 +Elles utilisent bien sûr tous [[utilisateurs:​hypathie:​tutos:​erb-et-ere-par-le-contexte-des-commandes?&#​caracteres-communs-aux-erb-et-ere|les caractères communs aux ERb et ERe]], leur utilisation avec ces caractères apparaîtra en à côté de l'​utilisation des caractères spécifiques aux ERb qui permettent de décrire des motifs plus complexes. 
 + 
 +Pour les commandes "à option"​ qui utilisent tous les caractères spécifiques aux ERb, mais qui peuvent aussi utiliser ces mêmes caractères((parenthèses,​ accolades, +, ? et |)) sans antislash avec les ERe, je présenterai rapidement leur utilisation des ERb dans le chapitre sur les caractères spécifiques aux ERe.  
 +</​note>​ 
 + 
 +====Caractères spécifiques aux ERb ==== 
 + 
 +Toutes les commandes utilisant les expressions rationnelles basiques utilisent les caractères énumérés ci-dessous.\\ 
 +  
 +La commande **''​expr''​** n'​utilise que ceux-ci.\\  
 + 
 +^expressions ​                          ​^Modèles reconnus ​                            ^ 
 +|**''<​nowiki>​\{m\}</​nowiki>''​** ​       | m fois le caractère précédent ​              | 
 +|**''<​nowiki>​\{m,​\} </​nowiki>''​** ​     | au moins m fois le caractère précédent ​     | 
 +|**''<​nowiki>​\{m,​n\} </​nowiki>''​** ​    | entre m et n fois le caractère précédent ​   | 
 +|**''<​nowiki>​\(ERb\)</​nowiki>''​** ​     | mémorisation d'une ERb                      | 
 +|**''<​nowiki>​\1,​ \2, ...</​nowiki>''​** ​ | Rappel de mémorisation ​                     | 
 + 
 +Les commandes **''​grep''​** (ou **''​grep -G''​**) ; **''​find -regextype "​posix-basic"​ ''​** ;  
 +**''​locate --regexp''​** ; **''​sed''​**;​ **''​vi''​** utilisent en plus ces caractères ci-dessous : 
 + 
 +^                            ^                                      ^ 
 +|**''<​nowiki>​\?</​nowiki>''​** | zéro ou une fois l'​élément précédent | 
 +|**''<​nowiki>​\+</​nowiki>''​** | une ou plusieurs fois l'​élément précédent | 
 +|**''<​nowiki>​\|</​nowiki>''​** | alternative | 
 + 
 +-> Le caractère **''​\''​** donne une signification spéciale aux parenthèses et accolades, ?, +, | au lieu de les rendre littérales.\\  
 +Mais il permet de rendre littéraux les autres caractères des ERb, par exemple ''​\.''​ permet de sélectionner un point. 
 + 
 + 
 +====Caractères spécifiques aux ERe ==== 
 + 
 +Les caractères spécifiques aux ERe sont utilisables avec les commandes : 
 + 
 +**''​grep -E''​** ; (ou **''​egrep''​**) ; **''​find -regextype "​posix-extended"​ ''​** ;  
 +**''​locate --regex''​** ; **''​sed -r''​** et **''​awk''​**((alias gawk)).\\  
 + 
 +Bien évidemment tous [[utilisateurs:​hypathie:​tutos:​erb-et-ere-par-le-contexte-des-commandes?&#​caracteres-communs-aux-erb-et-ere|les caractères communs aux ERb et ERe]] sont utilisables avec ces commandes et ces options. 
 + 
 +^expressions ​               ^ Modèles reconnus ​            ^ 
 +|**''?''​** | zéro ou une fois le caractère ou le regroupement précédent | 
 +|**''​+''​** |une à n fois le caractère ou regroupement précédent | 
 +|**''<​nowiki>​{m}</​nowiki>''​** |m fois le caractère précédent | 
 +|**''<​nowiki>​{m,​}</​nowiki>''​** | m fois le caractère précédent | 
 +|**''<​nowiki>​{m,​n}</​nowiki>''​** | entre m et n fois le caractère précédent | 
 +|**''<​nowiki>​( er1)</​nowiki>''​** | regroupement | 
 +|**''<​nowiki>​er1|er2|er3</​nowiki>''​** | alternative | 
 +|**''<​nowiki>​(er)+</​nowiki>''​**|Une ou plus de une chaîne(s) consécutive(s) validée(s) "​er"​.| 
 +|**''<​nowiki>​(er)*</​nowiki>''​**|zéro ou plus de zéro chaîne(s) consécutive(s) validée(s) par "​er"​ | 
 +|**''<​nowiki>​(er)?</​nowiki>''​**|une chaîne bulle ou toute chaîne validée par "​er"​.| 
 +|**''<​nowiki>​[c1c2...]</​nowiki>''​**|Tout caractère expressément listé entre les crochets.| 
 +|**''<​nowiki>​[^c1c2...]</​nowiki>''​**|Tout caractère excepté ceux qui sont expressément listés entre les crochets.| 
 +|**''<​nowiki>​[c1-c2]</​nowiki>''​**|Tout caractère appartenant à l’intervalle c1 c2, bornes comprises.| 
 +|**''<​nowiki>​er1|er2</​nowiki>''​**|Toute chaîne de caractères validée soit par er1 soit par er2.| 
 +|**''<​nowiki>​(er)(er)</​nowiki>''​**|Toute chaîne validée par l’expression er, chaîne vide exclue.| 
 +|**''<​nowiki>​(er1)(er2)</​nowiki>''​**|Toute chaîne de caractères de type AB, dans laquelle l’expression régulière er1 valide A et l’expression régulière er2 valide B.\\ Avec awk uniquement| 
 + 
 +=====Les commandes expr et vi et les caractères spécifiques aux ERb ===== 
 + 
 +====La commande expr n'​utilise que ERb==== 
 +__ 
 +**Rappel :**__\\  
 + 
 +  * Soit le fichier "<​nowiki>​liste4-spec</​nowiki>"​ : 
 + 
 +<code user>cat liste4-spec</​code>​ 
 +<​code>​ 
 +gdd:​a:​aa:​aaa:​aaaa:​aaaaaa:​aaaaaaaa 
 +T5c Kc5 T5 c E2* abcd 7 9Abcd 
 +7 1AAA.AAA.bcdef aBcd6a 123* 
 +abc2356.99 
 +73000|Savoie 
 +123456 
 +1234567 
 +index-tel|04|Rhône-Alpe 
 +-15 +36 5687 {15} exemple{36} 
 +il y a un truc et un truc et encore un truc et une chose 
 +choses et trucs ne font pas bon ménage 
 +123.3456.abc 
 +trucschosetruc 
 +tructructrucs 
 +chosechosechose 
 +</​code>​ 
 + 
 +  * Syntaxe : 
 + 
 +  expr chaîne-de-caractères : expression-rationnelle-basique 
 + 
 +<note tip> 
 + 
 +  * **''​expr''​** utilise tous les [[utilisateurs:​hypathie:​tutos:​erb-et-ere-par-le-contexte-des-commandes?&#​caracteres-communs-aux-erb-et-ere|caractères communs aux ERb et ERe]] 
 +  * mais elle n'​utilise que les caractères spécifiques aux ERb ci-dessous : 
 + 
 +|**''<​nowiki>​\{m\}</​nowiki>''​** ​       | m fois le caractère précédent ​              | 
 +|**''<​nowiki>​\{m,​\} </​nowiki>''​** ​     | au moins m fois le caractère précédent ​     | 
 +|**''<​nowiki>​\{m,​n\} </​nowiki>''​** ​    | entre m et n fois le caractère précédent ​   | 
 +|**''<​nowiki>​\(ERb\)</​nowiki>''​** ​     | mémorisation d'une ERb                      | 
 +|**''<​nowiki>​\1,​ \2, ...</​nowiki>''​** ​ | Rappel de mémorisation ​                     | 
 + 
 +</​note>​ 
 + 
 +===Exemple === 
 + 
 +  * sous-chaîne et quantificateur accolades : 
 + 
 +<code user>​var=123.456.</​code>​ 
 +<code user>​expr "​$var"​ : '​\([0-9]\{3\}.\)\{2\}'</​code>​ 
 +<​code>​ 
 +456. 
 +</​code>​ 
 + 
 +> expr affiche la sous-chaîne "​456."​ 
 + 
 + 
 +  *Le caractère **''​*''​** est gourmand : 
 +<code user>​var="​hypathie|00 rue Debian-facile|01011|ici"</​code>​ 
 +<code user>​expr "​$var"​ : '​\(.*\)|'</​code>​ 
 +<​code>​ 
 +hypathie|00 rue Debian-facile|01011 
 +</​code>​ 
 + 
 + 
 +====L'​éditeur de texte vi et les caractères spécifiques aux ERb==== 
 + 
 +<note tip> 
 + ​**''​ vi''​** (vim) utilise tous [[utilisateurs:​hypathie:​tutos:​erb-et-ere-par-le-contexte-des-commandes?&#​caracteres-communs-aux-erb-et-ere|les caractères communs aux ERb et ERe]], tous [[utilisateurs:​hypathie:​tutos:​erb-et-ere-par-le-contexte-des-commandes?&#​caracteres-specifiques-aux-erb|les caractères spécifiques aux ERb]], y compris ceux ci-dessous (comme "les commandes à option"​ permettant de choisir le type //ER//): 
 + 
 +|**''<​nowiki>​\?</​nowiki>''​** | zéro ou une fois l'​élément précédent | 
 +|**''<​nowiki>​\+</​nowiki>''​** | une ou plusieurs fois l'​élément précédent | 
 +|**''<​nowiki>​\|</​nowiki>''​** | alternative | 
 + 
 +</​note>​ 
 + 
 +  * Reprise du fichier "​liste4-vim"​ : 
 +<code user>vi liste4-vim</​code>​ 
 +ou  
 +<code user>vim liste4-vim</​code>​ 
 + 
 +{{http://​pix.toile-libre.org/​upload/​original/​1407922486.png?​400}} 
 + 
 + 
 +===utilisation de \| === 
 +<​code>/​c\|t</​code>​ 
 + 
 +->Une image vaut mieux qu'une description :\\ 
 +{{http://​pix.toile-libre.org/​upload/​original/​1407937898.png?​400}} 
 + 
 +===Utilisation de \? === 
 +<​code>/​\.[0-9]\?</​code>​ 
 + 
 +-> Là aussi :\\  
 +{{http://​pix.toile-libre.org/​upload/​original/​1407857157.png?​400}} 
 + 
 +===Utilisation de \+ === 
 +<​code>/​[A-Z]\+</​code>​ 
 +-> Là aussi :\\  
 +{{http://​pix.toile-libre.org/​upload/​original/​1407856299.png?​400}}
  
 <​note>​ <​note>​
Ligne 855: Ligne 1058:
 </​note>​ </​note>​
  
-===== grep, sed, find, locate et les caractères spécifiques aux ERb =====+===== grep, sed, find, locate, awk et les caractères spécifiques aux ERe  ​=====
  
-Les commandes grep et sed sans option, et les commandes locate et locate avec option utilisent les caractères spécifiques aux ERb.\\ Puisqu'​il est plus pratique de les utiliser avec les ERe qui sont plus lisibles, je n'en donnerai que quelques exemples.+===Préparation===
  
-==== grep ====+  * Soit le fichier "<​nowiki>​liste4-spec</​nowiki>":​ 
 +<​code>​ 
 +gdd:​a:​aa:​aaa:​aaaa:​aaaaaa:​aaaaaaaa 
 +T5c Kc5 T5 c E2* abcd 7 9Abcd 
 +7 1AAA.AAA.bcdef aBcd6a 123* 
 +abc2356.99 
 +73000|Savoie 
 +123456 
 +1234567 
 +index-tel|04|Rhône-Alpe 
 +-15 +36 5687 {15} exemple{36} 
 +il y a un truc et un truc et encore un truc et une chose 
 +choses et trucs ne font pas bon ménage 
 +123.3456.abc 
 +trucschosetruc 
 +tructructrucs 
 +chosechosechose 
 +</​code>​
  
-  * les accolades avec antislash ​(le caractère précédent un nombre exact de fois) :+==== grep -E (egrepet les caractères spécifiques aux ERe==== 
 +Avec l'​option -E grep utilisent les expressions rationnelles étendues.\\  
 +La commande egrep et un équivalent. 
 + 
 +<note tip> 
 +Pour les caractères : **''​ <​nowiki>​[</​nowiki> ​ <​nowiki>​]</​nowiki>​ <​nowiki>​{</​nowiki>​ <​nowiki>​}</​nowiki>​ ?  +  |''​**\\  
 + 
 +il possible avec grep d'​utiliser aussi les caractères spécifiques aux ERb.\\  
 +Par exemple ​:\\ 
 <code user>​grep "​1A\{3\}\.A\{3\}\..*"​ liste4-spec</​code>​ <code user>​grep "​1A\{3\}\.A\{3\}\..*"​ liste4-spec</​code>​
 +ou
 +
 +<code user>​grep -G "​1A\{3\}\.A\{3\}\..*"​ liste4-spec</​code>​
 +
 <​code>​ <​code>​
 7 1AAA.AAA.bcdef aBcd6a 123* 7 1AAA.AAA.bcdef aBcd6a 123*
 </​code>​ </​code>​
  
-  * le caractère précédent ​à partir ​de "​n"​ à "​m"​ fois : +-> mais ne pas oublier l'​antislash devant les accolades !\\  
-<code user>​grep "[0-9]\{1,3\}" liste4-spec</​code>​+</​note>​ 
 + 
 +===Parenthèses === 
 + 
 +<code user>​grep -E "( [0-9]{4})"​ liste4-spec</​code>​ 
 +<​code>​ 
 +-15 +36 5687 {15} exemple{36} 
 +</​code>​ 
 + 
 +===le caractère précédent de "​n"​ à "​m"​ fois :=== 
 +<code user>​grep ​-E "​[0-9]{1,​3}"​ liste4-spec</​code>​
 <​code>​ <​code>​
 T5c Kc5 T5 c E2* abcd 7 9Abcd T5c Kc5 T5 c E2* abcd 7 9Abcd
Ligne 874: Ligne 1116:
 abc2356.99 abc2356.99
 73000|Savoie 73000|Savoie
 +123456
 +1234567
 index-tel|04|Rhône-Alpe index-tel|04|Rhône-Alpe
 -15 +36 5687 {15} exemple{36} -15 +36 5687 {15} exemple{36}
Ligne 879: Ligne 1123:
 </​code>​ </​code>​
  
-  * le caractère précédent au moins "​n"​ fois : +===Les accolades (le caractère précédent un nombre exact de fois) : === 
-<code user>​grep "[0-9]\{4,\}" liste4-spec</​code>​+<code user>​grep -E "​1A{3}\.A{3}\..*"​ liste4-spec</​code>​ 
 +<​code>​ 
 +7 1AAA.AAA.bcdef aBcd6a 123* 
 +</​code>​ 
 + 
 +===Le caractère précédent au moins "​n"​ fois :=== 
 +<code user>​grep ​-E "​[0-9]{4,​}"​ liste4-spec</​code>​
 <​code>​ <​code>​
 abc2356.99 abc2356.99
Ligne 888: Ligne 1138:
 </​code>​ </​code>​
  
-  * parenthèses avec antislash ​et mémorisation :+===Le caractère + et parenthèses ===
  
-<code user>​grep "\[0-9]\{4\}\)" liste4-spec</​code>​+<code user>​grep ​-E "(1A{3}\.)+.*" liste4-spec</​code>​
 <​code>​ <​code>​
--15 +36 5687 {15} exemple{36}+7 1AAA.AAA.bcdef aBcd6a 123*
 </​code>​ </​code>​
  
 +===Le caractère ? ===
 +<code user>​grep -E "​trucs?"​ liste4-spec</​code>​
 +<​code>​
 +il y a un truc et un truc et encore un truc et une chose
 +choses et trucs ne font pas bon ménage
 +trucschosetruc
 +tructructrucs
 +</​code>​
  
-====sed ​sans option utilise ​les ERb ==== +>On cherche les lignes qui comporte "​truc"​ au singulier ou au pluriel. 
-La syntaxe est la même que pour les caractères ​communs aux ERe.+ 
 +===Le caractère d'​alternative | === 
 +<code user>​grep -E "​(truc|chose)"​ liste4-spec</​code>​ 
 +<​code>​  
 +il y a un truc et un truc et encore un truc et une chose 
 +choses et trucs ne font pas bon ménage 
 +trucschosetruc 
 +tructructrucs 
 +chosechosechose 
 +</​code>​ 
 + 
 +====sed ​et les caractères spécifiques aux ERe ==== 
 +__**Rappel**__\\  
 + 
 +Par défaut sed utilise ​les ERb.\\  
 +Pour s'​éviter de mettre un antislash devant parenthèse,​ accolade, ?, +, |,\\ il faut utiliser **l'​option -r**.\\  
 + 
 +Sans option et avec l'​antislash le signification de ces caractères ​sont les mêmes que lors de leur utilisation avec l'​option -r. 
 + 
 +===Exemples ===
  
   * Substituer "​Hello"​ par "​OK"​ :   * Substituer "​Hello"​ par "​OK"​ :
  
-<code user>​echo "​coucou Hello Yep" | sed '​s/​[A-Z]\{1\}[a-z]\{4\}/​OK/​g'</​code>​+<code user>​echo "​coucou Hello Yep" | sed -r '​s/​[A-Z]{1}[a-z]{4}/​OK/​g'</​code>​
 <​code>​ <​code>​
 coucou OK Yep coucou OK Yep
Ligne 908: Ligne 1185:
   * Substituer "​a"​ et "​aa"​ par "​OK"​ :   * Substituer "​a"​ et "​aa"​ par "​OK"​ :
  
-<code user>​echo "a aa aaa aaaa aaaaaa aaaaaaaa"​ | sed -'s/\(a\{1\\)/​OK/'​\ +<code user>​echo "a aa aaa aaaa aaaaaa aaaaaaaa"​ | sed -re '​s/​(a{1} )/​OK/'​\ 
- -e 's/\(a\{2\\)/​OK/'</​code>​+ -e '​s/​(a{2} )/​OK/'</​code>​
 <​code>​ <​code>​
 OKOKaaa aaaa aaaaaa aaaaaaaa OKOKaaa aaaa aaaaaa aaaaaaaa
Ligne 915: Ligne 1192:
  
 <note tip> <note tip>
-La lisibilité devient vite difficile pour sélectionner des sous-chaîne avec les ERb.\\  +L'​antislash de la commande précédente permet de couper ​les longues commandes.\\  
-Mieux vaut donc passer aux ERe, quand les commandes peuvent ​les utiliser.\\  +Ne pas confondre avec l'​antislash utiliser pour les ERb et les caractères spécifiquesparenthèses,​ accolades, etc.
-C'est justement le cas de la commande sedlocate et find. Je ne m'y attarderai donc pas.+
 </​note>​ </​note>​
  
-====locate utilise ​les ERb avec l'​option --regexp ==== +====find et les caractères spécifiques aux ERe " ==== 
-<​code ​man locate+__**Rappel **__\\  
---regexp REGEXP + 
-              ​Search for a basic regexp REGEXP.  ​No PATTERNs ​ are  allowed ​ if +Pour utiliser les ERe, il faut utiliser l'​option **''​-regextype "​posix-extended"​ ''​**.\\  
-              ​this ​ option ​ is used, but this option can be specified multiple + 
-              times.+Pour les caractères **''​ <​nowiki>​[</​nowiki> ​ <​nowiki>​]</​nowiki> ​ <​nowiki>​{</​nowiki> ​ <​nowiki>​}</​nowiki> ​ ?  + ''​**,​ on peut là aussi choisir ​les ERb en mettant un antislash devant.\\  
 +Pour ce faire, il faut alors utiliser ​l'​option ​ ​**''​-regextype "posix-basic" ''​**. 
 + 
 +__**Préparation**__\\  
 + 
 +Dans le répertoire de l'​utilisateur soit le répertoire "​ERetCMD/"​ contenant : 
 + 
 +<​code>​ 
 +Dossier  ​     img-perso-2.jpg  liste3-erb-ere  ​   sort1.txt 
 +essai.grep2~  ​     liste  ​      ​liste4-spec  ​   sort2.txt 
 +image linux - 01.jpg ​ liste1  ​      ​liste4-vim  ​   sort3.txt 
 +image linux - 02.jpg ​ liste1-nom ​      ​liste-class  ​   vim2.png 
 +image linux - 03.jpg ​ liste2  ​      ​server-0.xkb  ​   vim.png 
 +img-perso-1.jpg ​      ​liste2-nom ​      ​smolski-exo-sed.txt ​ xxx-sort.txt
 </​code>​ </​code>​
-===Syntaxe === 
  
 +===Exemples ===
 +  * accolades (depuis le répertoire parent "​ERetCMD/"​ des fichiers recherchés :
 +<code user>​find -regextype "​posix-basic"​ -regex "​.*/​[a-z]\{,​3\}-.*\.jpg$"</​code>​
 <​code>​ <​code>​
-locate ​--regexp '​ERb'​+./img-perso-2.jpg 
 +./​img-perso-1.jpg
 </​code>​ </​code>​
  
-=== Préparation=== +ou 
-Dans le répertoire de l'​utilisateur et dans le dosssier "​ERetCMD/"​ :+
  
-  * Création de trois fichiers : "image linux 01.jpg""image linux 02.jpg" ​et "image linux 03.jpg" :+<code user>​find -regextype ​"posix-extended" ​-regex ​".*[a-z]{,3}-.*\.jpg$"</​code>​ 
 +<​code>​ 
 +./img-perso-2.jpg 
 +./​img-perso-1.jpg 
 +</​code>​
  
-<code user> +  * caractère ? : 
-touch image\ linux\ ​-\ 01.jpg image\ linux\ ​-\ 02.jpg image\ linux-\ 03.jpg +<code user>find -regextype "posix-basic" -regex "​.*/​liste.\?"</​code>​ 
 +<​code>​ 
 +./​ERetCMD/​liste1 
 +./​ERetCMD/​liste 
 +./​ERetCMD/​liste2
 </​code>​ </​code>​
  
-  * Visualisation ​+  * le caractère + (depuis le répertoire parent "​ERetCMD/"​ des fichiers) ​:  
-<code user>ls</​code>​+<code user>find -regextype "​posix-extended"​ -regex "​.*liste.+"​</​code>​
 <​code>​ <​code>​
-Dossier  ​     img-perso-1.jpg  ​liste3-erb-ere ​ ​smolski-exo-sed.txt +./liste2-nom 
-essai.grep2~  ​     img-perso-2.jpg  ​liste4-spec     ​sort1.txt +./liste1-nom 
-image linux - 01.jpg  ​liste1-nom       ​liste4-spec~ ​   sort2.txt +./liste3-erb-ere 
-image linux - 02.jpg  liste1-nom~ ​     ​liste4-vim      sort3.txt +./liste4-vim 
-image linux - 03.jpg  ​liste2-nom       ​server-0.xkb    xxx-sort.txt+./liste1 
 +./liste4-spec 
 +./liste2 
 +./liste-class
 </​code>​ </​code>​
  
-  ​* Mise à jour de la base de donnée :+====locate et les caractères spécifiques aux ERe ==== 
 +__**Rappel**__\\  
 + 
 +Pour utiliser les ERe, il faut utiliser l'​option **''​--regex''​**.\\  
 +De même que précédemment,​ on peut choisir l'​option **''​--regexp''​** pour utiliser les caractères spécifiques aux ERb qui nécessitent **''​\''​**. 
 + 
 +Soit encore le répertoire "​ERetCMD/"​ contenant les mêmes fichiers (voir find).\\  
 + 
 +Mise à jour de la base de donnée, si besoin ​:
 <code root> <code root>
 updatedb updatedb
 </​code>​ </​code>​
  
-===Exemple ​=== +===Exemples ​=== 
-<code user>​locate --regexp '.*\([a-z]\{1,​\} \)\{2\}.*\.jpg$'</​code>​+  * parenthèses et accolades (depuis n'​importe où dans l'​arborescence du système de fichiers) : 
 + 
 +<code user>​locate --regexp '​\([a-z]\{1,​\} \)\{2\}.*\.jpg$'</​code>​
 <​code>​ <​code>​
 /​home/​Téléchargements/​Les utilitaires awk, nawk et gawk - Tutoriel_fichiers/​logo.jpg /​home/​Téléchargements/​Les utilitaires awk, nawk et gawk - Tutoriel_fichiers/​logo.jpg
Ligne 966: Ligne 1278:
 </​code>​ </​code>​
  
 +ou
  
- +<​code ​user>locate ​--regex ​'([a-z]{1,} ){2}.*\.jpg$'</​code>​ 
-====find utilise les ERb avec l'​option -regextype "​posix-basic"​ ==== +<​code>​ 
-<​code ​man find> +/​home/​Téléchargements/​Les utilitaires ​awk, nawk et gawk Tutoriel_fichiers/​logo.jpg 
--regextype type +/​home/​hypathie/​ERetCMD/​image linux 01.jpg 
-              Définir la syntaxe des expressions rationnelles des tests -regex +/​home/​hypathie/​ERetCMD/​image linux 02.jpg 
-              et -iregex qui seront indiqués plus loin sur la  ligne  de  com‐ +/​home/​hypathie/​ERetCMD/​image linux - 03.jpg
-              mande ​Les ​ types actuellement implémentés sont emacs (type par +
-              ​défaut),​ posix-awk, posix-basic, posix-egrep et posix-extended+
 </​code>​ </​code>​
  
-===Syntaxe === +  * caractère ? : 
 +<code user>​locate --regex '/​liste.?'</​code>​
 <​code>​ <​code>​
-find -regextype "posix-basic" ​-regex "​ERb"​+/​home/​hypathie/​Documents/​PYTHON/​python2/​chap06/​liste_et_branch.py 
 +/​home/​hypathie/​Documents/​PYTHON/​python3/​chap06/​liste_et_branch.py 
 +/​home/​hypathie/​ERetCMD/​liste 
 +/​home/​hypathie/​ERetCMD/​liste-class 
 +/​home/​hypathie/​ERetCMD/​liste1 
 +/​home/​hypathie/​ERetCMD/​liste1-nom 
 +/​home/​hypathie/​ERetCMD/​liste2 
 +/​home/​hypathie/​ERetCMD/​liste2-nom 
 +/​home/​hypathie/​ERetCMD/​liste3-erb-ere 
 +/​home/​hypathie/​ERetCMD/​liste4-spec 
 +/​home/​hypathie/​ERetCMD/​liste4-vim 
 +/​usr/​share/​man/​man2/​listen.2.gz
 </​code>​ </​code>​
  
-===Préparation=== +>Le fichier ​"liste" ​(sans extension) apparaît.
-Dans le répertoire de l'​utilisateur et dans le dosssier ​"ERetCMD/"+
  
-  * Création de deux fichiers, "​img-perso-1.jpg"​ et "​img-perso-2.jpg" ​:+  * caractère + :
  
-<code user> +<code user>locate ​--regex '/​liste.+'</​code>​ 
-touch img-perso-1.jpg img-perso-2.jpg+<​code>​ 
 +/​home/​hypathie/​Documents/​PYTHON/​python2/​chap06/​liste_et_branch.py 
 +/​home/​hypathie/​Documents/​PYTHON/​python3/​chap06/​liste_et_branch.py 
 +/​home/​hypathie/​ERetCMD/​liste-class 
 +/​home/​hypathie/​ERetCMD/​liste1 
 +/​home/​hypathie/​ERetCMD/​liste1-nom 
 +/​home/​hypathie/​ERetCMD/​liste2 
 +/​home/​hypathie/​ERetCMD/​liste2-nom 
 +/​home/​hypathie/​ERetCMD/​liste3-erb-ere 
 +/​home/​hypathie/​ERetCMD/​liste4-spec 
 +/​home/​hypathie/​ERetCMD/​liste4-vim 
 +/​usr/​share/​man/​man2/​listen.2.gz
 </​code>​ </​code>​
  
-===exemples === 
  
-<code user>find -regextype ​"posix-basic"​ -regex ​".*/​[a-z]\{,​3\}-.*\.jpg$"</​code>​ +>Le fichier ​"liste" ​(sans extension) n'​apparaît pas.
-<​code>​ +
-./​img-perso-2.jpg +
-./​img-perso-1.jpg +
-</​code>​+
  
 =====Les classes ===== =====Les classes =====
Ligne 1019: Ligne 1345:
 |''<​nowiki>​[[:​xdigit:​]]</​nowiki>''​ | Chiffres hexadécimaux [0-9 a-f A-F] | |''<​nowiki>​[[:​xdigit:​]]</​nowiki>''​ | Chiffres hexadécimaux [0-9 a-f A-F] |
  
-====grep et les classes==== + 
-La commande grep utilise les classes comme ERb et comme ERe, c'​est-à-dire sans l'​option -E ou avec l'​option -E + 
 +====grep, grep -E et les classes==== 
 +La commande grep utilise les classes ​soit comme ERb et soit comme ERe, c'​est-à-dire sans l'​option -E ou avec l'​option -E 
 ===Préparation === ===Préparation ===
   * soit le fichier "   * soit le fichier "
Ligne 1091: Ligne 1419:
 >Dans l'​exemple ci-dessus, avec les ERe, on pourrait remplacer ''​[\. ]''​ par ''​(\.| )'' ​ >Dans l'​exemple ci-dessus, avec les ERe, on pourrait remplacer ''​[\. ]''​ par ''​(\.| )'' ​
  
-====locate et les classes ERb ou ERe====+ 
 +====locate et les classesERb ou ERe====
   * Visualisation du répertoire ~/ERetCMD/ :   * Visualisation du répertoire ~/ERetCMD/ :
 <code user>​ls</​code>​ <code user>​ls</​code>​
Ligne 1125: Ligne 1454:
  
  
-====find et les classes ERb ou ERe ====+====find et les classesERb ou ERe ====
  
 ===Les classes et ERb === ===Les classes et ERb ===
Ligne 1145: Ligne 1474:
 </​code>​ </​code>​
  
-===Pour sed les classes ​relèvent des ERe=== +===Pour sed les classes ​en tant que ERe===
 <note tip> <note tip>
-Avec sed il faut toujours ​l'​option -r pour utiliser les classes.+Rappel :\\  
 +sed utilise les ERb  sans option et les ERe avec l'​option -r, mais pour utiliser les classes, il faut utiliser l'​option -r.
 </​note>​ </​note>​
 +
  
   *Exemple 1 :   *Exemple 1 :
Ligne 1210: Ligne 1540:
 </​code>​ </​code>​
  
 +====vi (vim) utilise les classes en tant que ERb====
 +===Préparation ===
 +<code user>vim liste4-vim</​code>​
 +<​code>​
 +Kc5 T5 c E2* abcd 7 9Abcd
 +7 1AAA.AAA.bcdef aBcd6a 123*
 +abc2356.99
 +73000|Savoie
 +index-tel|04|Rhône-Alpe
 +-15 +36 5687 {15} exemple{36}
 +il y a un truc et un truc et encore un truc et une chose
 +chose et truc ne font pas bon ménage
 +123.3456.abc
 +trucchosetruc
 +tructructruc
 +chosechosechose
 +</​code>​
 +===Exemples ===
  
 +  * Recherche :
  
 +<​code>/​[[:​alnum:​]]\{7\}{[[:​digit:​]]\{2\}} </​code>​
  
-======Les expressions rationnelles étendues====== +-> sélectionne entièrement la chaîne **''​exemple{36}''​**
-====Caractères des ERe ====+
  
-^expressions ​               ^ Modèles reconnus ​            ^ +  ​Substitution ​<​nowiki>​[[:graph:]]</​nowiki>​: 
-|**''?''​** | zéro ou une fois le caractère ou le regroupement précédent | +<code>:6,10s/[[:graph:]]/x/g</code>
-|**''​+''​** |une à n fois le caractère ou regroupement précédent | +
-|**''​<​nowiki>​{m}</​nowiki>​''​** |m fois le caractère précédent | +
-|**''​<nowiki>{m,}</nowiki>''​** | m fois le caractère précédent | +
-|**''<​nowiki>​{m,​n}</​nowiki>''​** | entre m et n fois le caractère précédent | +
-|**''<​nowiki>​( er1)</​nowiki>''​** | regroupement | +
-|**''<​nowiki>​er1|er2|er3</​nowiki>''​** | alternative | +
-|**''<​nowiki>​(er)+</​nowiki>''​**|Une ou plus de une chaîne(s) consécutive(s) validée(s) "​er"​.| +
-|**''<​nowiki>​(er)*</​nowiki>''​**|zéro ou plus de zéro chaîne(s) consécutive(s) validée(s) par "​er"​ | +
-|**''<​nowiki>​(er)?</​nowiki>''​**|une chaîne bulle ou toute chaîne validée par "​er"​.| +
-|**''<​nowiki>​[c1c2...]</​nowiki>''​**|Tout caractère expressément listé entre les crochets.| +
-|**''<​nowiki>​[^c1c2...]</​nowiki>''​**|Tout caractère excepté ceux qui sont expressément listés entre les crochets.| +
-|**''<​nowiki>​[c1-c2]</nowiki>''​**|Tout caractère appartenant à l’intervalle c1 c2, bornes comprises.| +
-|**''<​nowiki>​er1|er2<​/nowiki>''​**|Toute chaîne de caractères validée soit par er1 soit par er2.| +
-|**''<​nowiki>​(er)(er)</nowiki>''​**|Toute chaîne validée par l’expression er, chaîne vide exclue.| +
-|**''<​nowiki>​(er1)(er2)</​nowiki>''​**|Toute chaîne de caractères de type AB, dans laquelle l’expression régulière er1 valide A et l’expression régulière er2 valide B.\\ Avec awk uniquement|+
  
-Excepté **''<​nowiki>(er1)(er2)</​nowiki>'​'** :+Le caractère "​ô"​ n'est pas concerné du fait de la touche morte.
  
-=== avec awk (sans option)===+{{http://​pix.toile-libre.org/​upload/​original/​1407925315.png?​400}}
  
-===avec grep -E et egrep=== +  * Substitution ​<nowiki>[[:print:]]</nowiki: 
-<code user>grep -E "1([A-Z]){2}.*"​ liste4-spec</code+<​code>​:​6,​10s/​[[:​print:​]]/​x/​g</​code>​
-<​code>​ +
-7 1AAA.AAA.bcdef aBcd6a 123* +
-</​code>​+
  
-===avec sed -r===+{{http://​pix.toile-libre.org/​upload/​original/​1407925697.png?​400}}
  
-===avec locate ​=== +====awk utilise les ERe et les classes sans option==== 
-<​code ​man locate+<​code ​user>cat liste2-nom</​code
---regex +<​code>​  
-              ​Interpret all PATTERNs as extended regexps.+Constance 20-03-1998 
 +Rebecca 09-03-1999 
 +Natanaël 01-08-2000 
 +Alexis 21-01-2002 
 +Hélène-Fleur 06-03-2005 
 +Samuel 27-08-2008
 </​code>​ </​code>​
  
-  * Syntaxe ​: +  * Exemple 1, sélection de ligne avec ER comme condition ​:
-<​code>​ +
-locate --regex '​ERe'​ +
-</​code>​+
  
-===avec find === +<​code ​user>awk '/​S[[:​lower:​]]*/'​ liste2-nom</​code>​ 
-<​code ​man find> +<​code> ​ 
--regextype type +Samuel 27-08-2008
-              ​Définir la syntaxe des expressions rationnelles des tests -regex +
-              et -iregex qui seront indiqués plus loin sur la  ligne  de  com‐ +
-              mande. ​ Les  types actuellement implémentés sont emacs (type par +
-              défaut), posix-awk, posix-basic,​ posix-egrep et posix-extended.+
 </​code>​ </​code>​
  
-  * Syntaxe ​:+  *Exemple 2, correspondance entre variable (champ n°2) et une ER : 
 + 
 +<code user>awk '$2 ~ /​([[:​digit:​]]{2}-){2}2005$/'​ liste2-nom</​code>​
 <​code>​ <​code>​
-find -regextype "posix-extended" ​-regex "​ERe"​+Hélène-Fleur 06-03-2005
 </​code>​ </​code>​
  
-====Les raccourcis ne sont pas posix==== 
  
-  * __sed__ :+======Raccourcis et commandes====== 
 + 
 + 
 +Les raccourcis ne sont pas posix 
 + 
 +=== __sed__ :===
  
 ^Séquences ​                  ​^Séquences ​                               ^ ^Séquences ​                  ​^Séquences ​                               ^
Ligne 1284: Ligne 1619:
 |**''<​nowiki>​\b</​nowiki>''​** | Correspond à une chaîne vide (blanc) à l'​extrémité d'un mot | |**''<​nowiki>​\b</​nowiki>''​** | Correspond à une chaîne vide (blanc) à l'​extrémité d'un mot |
  
- +=== __awk__ :===
- +
- +
-  * __awk__ :+
  
 ^Séquences ​                        ​^Séquences ​                                         ^ ^Séquences ​                        ​^Séquences ​                                         ^
Ligne 1296: Ligne 1628:
 |**''<​nowiki>​\c </​nowiki>''​** ​     | tout caractère pris sous sa forme littérale\\ excepté **''<​nowiki>​\</​nowiki>''​** ​ | |**''<​nowiki>​\c </​nowiki>''​** ​     | tout caractère pris sous sa forme littérale\\ excepté **''<​nowiki>​\</​nowiki>''​** ​ |
  
-__Excepté **''<​nowiki>​(er1)(er2)</​nowiki>''​**__ : 
- 
-  * Tous sont utilisables avec grep -E et egrep 
-  * Tous sont utilisable avec awk 
-  * Certains posent problème avec sed -r 
- 
-__Options nécessaires avec find et locate__ : 
- 
-  * find -regextype "​posix-extended"​\\ Les  types actuellement implémentés sont emacs (type par défaut), posix-awk, posix-basic,​ posix-egrep et posix-extended. 
- 
-  *locate --regex ​ :  Interpréter tous les "​PATTERNs"​ (modèles) comme des expressions rationnelles étendues. 
  
  
utilisateurs/hypathie/tutos/erb-et-ere-par-le-contexte-des-commandes.txt · Dernière modification: 01/10/2023 11:39 (modification externe)

Pied de page des forums

Propulsé par FluxBB