logo Debian Debian Debian-France Debian-Facile Debian-fr.org Forum-Debian.fr Debian ? Communautés logo inclusivité

Debian-facile

Bienvenue sur Debian-Facile, site d'aide pour les nouveaux utilisateurs de Debian.

Vous n'êtes pas identifié(e).


L'icône rouge permet de télécharger chaque page du wiki visitée au format PDF et la grise au format ODT → ODT PDF Export

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
Prochaine révision
Révision précédente
utilisateurs:hypathie:tutos:erb-et-ere-par-le-contexte-des-commandes [15/08/2014 12:51]
Hypathie [Les expressions rationnelles basiques et les commandes GNU/Linux]
utilisateurs:hypathie:tutos:erb-et-ere-par-le-contexte-des-commandes [01/10/2023 11:39] (Version actuelle)
Ligne 5: Ligne 5:
   * Commentaires : utiliser les expressions rationnelles basiques, étendues, les classes avec grep, grep -E, find, locate, expr, vi, sed et awk.   * Commentaires : utiliser les expressions rationnelles basiques, étendues, les classes avec grep, grep -E, find, locate, expr, vi, sed et awk.
  
-**NOTA**\\ ​ 
-Il s'​agira de distinguer les différents usages des ERb, ERe et des classes en fonction des commandes de recherche et d'​édition de fichiers GNU/linux. 
  
 =====Introduction ===== =====Introduction =====
-  
 Il faut savoir en effet : Il faut savoir en effet :
  
-  * qu'il y a plusieurs types d'​expressions rationnelles,​ celles reposant sur [[http://fr.wikipedia.org/​wiki/​Biblioth%C3%A8que_logicielle|la bibliothèque]] REGEX, ​celles reposant sur la bibliothèque [[http://​fr.wikipedia.org/​wiki/​PCRE|PCRE]].+  * qu'il y a plusieurs types d'​expressions rationnelles, ​ 
 +    *  ​celles reposant sur la bibliothèque ​[[http://en.wikipedia.org/​wiki/​Regular_expression#​POSIX_basic_and_extended|POSIX]] 
 +    * celles reposant sur la bibliothèque [[http://​fr.wikipedia.org/​wiki/​PCRE|PCRE]].\\ Il s'​agira ici de celle de la [[http://​fr.wikipedia.org/​wiki/​Biblioth%C3%A8que_logicielle|la bibliothèque]] POSIX qui sont désignées souvent par les abréviations anglophones [[http://​en.wikipedia.org/​wiki/​Regular_expression|REGEX ou REGEXP]] ;
  
-  * qu'il y a différents programmes qui utilisent ​soit l'une, soit l'​autre bibliothèque par exemple ​grep,  expr, awk, Perl, Tcl, Python... ​Je ne parlerai que de ceux pouvant utiliser la bibliothèque REGEX.+  * qu'il y a différents programmes qui utilisent ​les expression régulières ; grep,  expr, awk, sed, Perl, Tcl, Python, PHP, Java... Il s'​agira ici de ceux utilisables en ligne de commandes GNU/Linux.
  
-  * que certains des métacaractères reconnus par les shells UNIX (bash, ksh, csh, sh, etc.), sont homonymes avec certains caractères des //ER//, et qui plus est, ils servent le même objectif de fournir des motifs de recherche. Mais ils ne font pas partie de ce qu'on appelle les expressions rationnelles et ne doivent pas être confondus avec elles.\\ ​J'​insisterai sur ce point pour éviter la confusion.+  * que certains des métacaractères reconnus par les shells UNIX (bash, ksh, csh, sh, etc.), sont homonymes avec certains caractères des //ER//, et qui plus est, ils servent le même objectif de fournir des motifs de recherche. Mais ils ne font pas partie de ce qu'on appelle les expressions rationnelles et ne doivent pas être confondus avec elles.\\
  
-  * que la syntaxe ​d'​utilisation des //ER// n'est pas la même d'un programme ​à l'​autre. C'est ce qui motive la rédaction ​de cette page. Il faut forcément maîtriser la manière d'​utiliser les //ER// pour chacun des programmes pour pouvoir les utiliser. Mettre ces différences en avant démystifiera la difficulté attribuée ​à l'usage des expressions rationnelles.+  * que la syntaxe ​introduisant une //ER// n'est pas la même d'un programme de ligne de commandes GNU/Linux à l'autre 
  
   * Enfin, les différents programmes susceptibles d'​utiliser toutes les //ER// de la bibliothèque REGEX, vi, expr, grep, egrep, find, locate, sed, awk, __transforment le contexte d'​utilisation de l'//​ER//​ et par conséquent,​ l'​utilisation d'une même //ER// n'a plus le même effet d'un programme à l'​autre__.\\ ​   * Enfin, les différents programmes susceptibles d'​utiliser toutes les //ER// de la bibliothèque REGEX, vi, expr, grep, egrep, find, locate, sed, awk, __transforment le contexte d'​utilisation de l'//​ER//​ et par conséquent,​ l'​utilisation d'une même //ER// n'a plus le même effet d'un programme à l'​autre__.\\ ​
-Ce dernier point est rarement mis en avant, il est pourtant crucial de le soulever, pour des raisons autant pédagogiques,​ que philosophiques.\\ Le fondement en est simplement la certitude que //le dédain envers la diversité//,​ tandis que l'​entendement est la puissance d'​éprouver l'​unité cachée sous tout genre de multiple, est une tentative qui s'​ignore d'​instrumentaliser la raison. ​+Ces deux derniers points sont rarement mis en avant, il est pourtant crucial de les soulever, pour des raisons autant pédagogiques,​ que philosophiques.\\ Le fondement en est simplement la certitude que //le dédain envers la diversité//,​ tandis que l'​entendement est la puissance d'​éprouver l'​unité cachée sous tout genre de multiple, est une tentative qui s'​ignore d'​instrumentaliser la raison. ​
  
-**Pour en prendre le contre-piedcette présentation ​des expressions rationnelles ​souhaite éclairer leurs divers utilisations ainsi que la nécessité ​de leurs diversités,​ en les exposant du point de vue des commandes ​de recherches et d'​édition de fichiers ​GNU/​linux.**\\ +**En brefil s'​agira de donner accès à l'​utilisation ​des expressions rationnelles ​POSIX par la ligne de commandes GNU/​linux.**
  
-**En bref, il s'​agira de donner accès à l'​utilisation,​ en ligne de commandes GNU/linux, des expressions rationnelles POSIX de la bibliothèque REGEX.** +====Les types de REGEX ====
- +
-====Les types de ER ====+
 Il y en a trois : Il y en a trois :
  
Ligne 37: Ligne 34:
  
 Les raccourcis (par exemples, retour à la ligne ''​\n'',​ tabulation ''​\t''​) étant particuliers aux programmes, seront listés en complément. Les raccourcis (par exemples, retour à la ligne ''​\n'',​ tabulation ''​\t''​) étant particuliers aux programmes, seront listés en complément.
 +
 +**Le détail des expressions régulières est présenté comme ceci :**
 +  - **[[utilisateurs:​hypathie:​tutos:​erb-et-ere-par-le-contexte-des-commandes?&#​caracteres-communs-aux-erb-et-ere|les caractères communs aux ERb et ERe]].**
 +  - **les caractères spécifiques [[utilisateurs:​hypathie:​tutos:​erb-et-ere-par-le-contexte-des-commandes?&#​caracteres-specifiques-aux-erb|aux ERb]] et [[utilisateurs:​hypathie:​tutos:​erb-et-ere-par-le-contexte-des-commandes?&#​caracteres-specifiques-aux-ere|aux ERe]].**
 +  - **[[utilisateurs:​hypathie:​tutos:​erb-et-ere-par-le-contexte-des-commandes?&#​les-classes|les classes]]**
  
 ==== Panorama exhaustif des programmes GNU/Linux concernés par les expressions rationnelles=== ==== Panorama exhaustif des programmes GNU/Linux concernés par les expressions rationnelles===
Ligne 50: Ligne 52:
   * **awk**((c'​est-à-dire **gawk**\\ ''​whereis awk''​\\ awk: /​usr/​bin/​awk\\ ''​ls -l /​usr/​bin/​awk''​\\ lrwxrwxrwx 1 root root 21 juin   8 18:43 /​usr/​bin/​awk -> /​etc/​alternatives/​awk\\ ''​ls -l /​etc/​alternatives/​awk''​\\ lrwxrwxrwx 1 root root 13 juil. 13 18:41 /​etc/​alternatives/​awk -> /​usr/​bin/​**gawk**)) : **ERe**\\ sélectionne les colonnes, lignes, mots d'un fichier, et modifie l'​affichage,​ le fichier, etc. en utilisant la //ER// comme condition de l'​action qu'on choisit.   * **awk**((c'​est-à-dire **gawk**\\ ''​whereis awk''​\\ awk: /​usr/​bin/​awk\\ ''​ls -l /​usr/​bin/​awk''​\\ lrwxrwxrwx 1 root root 21 juin   8 18:43 /​usr/​bin/​awk -> /​etc/​alternatives/​awk\\ ''​ls -l /​etc/​alternatives/​awk''​\\ lrwxrwxrwx 1 root root 13 juil. 13 18:41 /​etc/​alternatives/​awk -> /​usr/​bin/​**gawk**)) : **ERe**\\ sélectionne les colonnes, lignes, mots d'un fichier, et modifie l'​affichage,​ le fichier, etc. en utilisant la //ER// comme condition de l'​action qu'on choisit.
  
-Concernant chacun de ces programmes, je n'​entrerai ni dans les combinaisons possibles entre eux, ni n'​approfondirai chacun d'eux en détail. Voir pour cela la documentation à leur sujet.\\  +Concernant chacun de ces programmes, je me limiterai strictement à leur utilisation des //ER//.\\  
-Les concernant, je me limiterai strictement à leur utilisation des //​ER//​. ​+Pour plus de détail sur chacun d'​entre eux, consulter la documentation à leur sujet.\\ ​
  
 ====Pour ne plus confondre "​métacaractères"​ du shell et caractères des ER==== ====Pour ne plus confondre "​métacaractères"​ du shell et caractères des ER====
Ligne 64: Ligne 66:
 |**''​[ ]''​** |un caractère cité dans la liste entre crochets |''​echo [Tt][io]t[io]''​((echo "Toto Tito toto toti tito loto" | echo [Tt][io]t[io]))\\ **affiche les fichiers**\\ Toto\\ Tito\\ toto\\ toti\\ ...\\ **mais pas**\\ loto\\ ... | |**''​[ ]''​** |un caractère cité dans la liste entre crochets |''​echo [Tt][io]t[io]''​((echo "Toto Tito toto toti tito loto" | echo [Tt][io]t[io]))\\ **affiche les fichiers**\\ Toto\\ Tito\\ toto\\ toti\\ ...\\ **mais pas**\\ loto\\ ... |
 |**''​[ - ]''​**\\ [a-z]\\ [A-Z]\\ [A-Z]\\ [0-9] |groupe de caractères |''​head t[a-z]to''​\\ **affiche**\\ titi\\ tito\\ toto\\ ...\\ **mais pas**\\ tOto\\ t5to\\ | |**''​[ - ]''​**\\ [a-z]\\ [A-Z]\\ [A-Z]\\ [0-9] |groupe de caractères |''​head t[a-z]to''​\\ **affiche**\\ titi\\ tito\\ toto\\ ...\\ **mais pas**\\ tOto\\ t5to\\ |
 +
 +
 +=====Métacaractère ou caractère d'​expression rationnelle ?=====
 +Les commandes de recherche et d'​édition de fichiers peuvent utiliser métacaractères et les caractères servant aux expressions rationnelles.
  
 ===Préparation=== ===Préparation===
Ligne 96: Ligne 102:
 </​note>​ </​note>​
  
-===Métacaractère ou caractère d'​expression rationnelle ?===+====grep==== 
 +<note tip> 
 +**__Rappel sur grep__**\\ ​
  
 +  * __**Synopsis**__ :
 +
 +  grep [OPTIONS] MOTIF [FICHIER...]
 +  grep [OPTIONS] [-e MOTIF | -f FICHIER] [FICHIER...]
 +
 +**''​grep toto ~/​Dossier/​liste.txt''​**\\ ​
 +**''​grep "​toto"​ ~/​Dossier/​liste.txt''​**
 +>Les guillemets ne sont pas obligatoires pour un mot
 +> Recherche le motif ''​toto''​ dans le fichier "​liste.txt"​
 +
 +**''​grep toto ~/​Dossier/​liste.txt /​Documents/​téléphone.txt''​**\\ ​
 +> Recherche le motif ''​toto''​ dans les fichiers "​liste.txt"​ et "​téléphone.txt"​.
 +
 +**''​grep "toto et titi" ~/​Dossier/​liste.txt"​ ''​**
 +> Les guillemets sont obligatoires lorsque MOTIF est une chaîne de caractères espacés d'un ou plusieurs espaces.
 +
 +  * __**Options les plus courantes**__ :
 +
 +
 +    * -v affiche les lignes ne contenant pas MOTIF
 +    * -c compte le nombre de lignes contenant MOTIF
 +    * -n chaque ligne contenant MOTIF est numérotée
 +    * -r ou -R (récursif) recherche MOTIF dans tous les fichiers et sous-répertoires
 +    * -x ligne correspondant exactement à MOTIF
 +    * -l (par défaut) affiche le nom des fichiers qui contiennent MOTIF
 +    * -f (par défaut) pour plusieurs fichiers ​
 +    * -w recherche du MOTIF exact et non approchant
 +
 +**''​grep -r -w Toto ~/''​**
 +
 +</​note>​
   * __L'​étoile__ :   * __L'​étoile__ :
 Imaginons qu'on cherche __tous les fichiers commençant par "​t"​__ contenant le caractère "​e"​.\\ ​ Imaginons qu'on cherche __tous les fichiers commençant par "​t"​__ contenant le caractère "​e"​.\\ ​
Ligne 110: Ligne 149:
 </​code>​ </​code>​
  
-> option -l : Ne  pas  afficher les résultats normaux. À la place, indiquer le nom des  fichiers ​ pour  lesquels ​ des  résultats ​ auraient ​ été affichés. 
-> option -R : Lire récursivement tous les fichiers ​ à  l'​intérieur ​ de  chaque répertoire. 
 >Le motif entre guillemets ("​e"​) concerne la recherche dans le contenu du fichier. C'est là qu'il faut  placer l'​expression rationnelle. Le motif "​e"​ en est d'​ailleurs une. >Le motif entre guillemets ("​e"​) concerne la recherche dans le contenu du fichier. C'est là qu'il faut  placer l'​expression rationnelle. Le motif "​e"​ en est d'​ailleurs une.
 >Le caractère "​*"​ est le métacaractère qui signifie "__nom de fichier__ commençant par "​Toto"​ avec n'​importe quel autre caractère après ou rien après. ​ >Le caractère "​*"​ est le métacaractère qui signifie "__nom de fichier__ commençant par "​Toto"​ avec n'​importe quel autre caractère après ou rien après. ​
Ligne 150: Ligne 187:
 </​code>​ </​code>​
  
-====Métacaractères du shell et commandes utilisant les expressions rationnelles====+==== find==== 
 +<note tip> 
 +**__Rappel sur find__** :
  
-Parmi les commandes GNU/Linux utilisant les expressions rationnelles,​ d'​autres commandes que **grep** ou **grep -E** utilisent aussi les métacaractères.\\ ​+  find <​répertoire de recherche>​ <​critères de recherche>​
  
-Il s'agit de **find** ​et **locate**.+**__Sans critère de recherche__** find affiche les fichiers du ou des répertoire(s) de recherche qu'on lui a donné en argument :\\  
 + 
 +''​find /​home/​hypathie/​Documents /​home/​hypathie/​Bureau''​ 
 + 
 + 
 +__**Les critères ​de recherche**__ : 
 +Utiliser les guillemets dans le critère de recherche est une bonne habitude à prendre car cela permet d’éviter les problèmes avec les caractères génériques du Shell : ''​find ~ -name "*.mp3"''​ 
 +    ​* **-name** recherche sensible à la casse sur le nom du fichier 
 +    * **-iname** recherche non sensible à la casse sur le nom du fichier 
 +    * **-perm** recherche sur les droits d'​accès du fichier((''​-perm u=rwx''​ (0700) ; ''​-perm -u=r''​ (-0400) => u=r ou u=rw ou u=rx ou u=rwx ou u=r,g=x… ; ''​-perm /​u=w,​g=w,​o=w''​ => u=w ou g=w ou o=w ou u=w,g=w,o=w ou u=rw,​g=rwx…)) 
 +    * **-links** recherche sur le nombre de liens du fichier 
 +    * **-user** recherche sur le propriétaire du fichier 
 +    * **-group** recherche sur le groupe auquel appartient le fichier 
 +    * **-type** recherche sur le type (''​d''​=répertoire,​ ''​c''​=caractère,​ ''​f''​=fichier normal, ''​l''​=lien,​ ''​s''​=socket)((lorsque l’on ne précise pas le -type à rechercher, la commande find recherchera des fichiers, des dossiers, des sockets, etc)) 
 +    * **-size** recherche sur la taille du fichier ''​M''​ pour Méga Octets, ''​G''​ pour Giga Octets, ''​c''​ pour octets((+10M ; -10M ; 10M)) ou en nombre de blocs (1 bloc=512 octets) 
 +    * **-atime** recherche par date de dernier accès en lecture du fichier 
 +    * **-mtime** recherche par date de dernière modification du fichier 
 +    * **-ctime** recherche par date de création du fichier 
 + 
 +Voir : [[http://​qanuq.com/​exploitez-la-puissance-de-la-commande-find/​]] 
 +</​note>​
  
-=== find=== 
 //Depuis le répertoire personnel ou le répertoire "​~ERetCMD"​ ou même le répertoire "​~/​ERetCMD/​Dossier/"//​ //Depuis le répertoire personnel ou le répertoire "​~ERetCMD"​ ou même le répertoire "​~/​ERetCMD/​Dossier/"//​
  
Ligne 182: Ligne 240:
 </​code>​ </​code>​
  
-===locate ===+====locate ===
 +<note tip> 
 +**__Rappel sur locate__**\\  
 + 
 +  locate <​options>​ <vos critères de recherche>​ 
 + 
 +**Options:​**\\ 
 + 
 +  * **-i** pour ignorer la casse majuscule ou minuscule 
 +  * **-c** afficher seulement le nombre de résultat  
 +  * **-n <n>** N'​affiche que les n premiers résultats. 
 + 
 +</​note>​
  
   * __Préparation :__   * __Préparation :__
Ligne 223: Ligne 293:
 </​code>​ </​code>​
  
-===sed===+====sed===
 +<note tip> 
 +Rappel sur sed\\ 
  
 +  * Adressages
 +
 +
 +</​note>​
   * __sed utilise aussi les deux :__   * __sed utilise aussi les deux :__
  
-Vérifier qu'on est bien au niveau du "​~/​ERetCMD/​Dossier/" ​+Vérifier qu'on est bien au niveau du "​~/​ERetCMD/​Dossier/"​ 
 + 
 +<code user>cd ~/​ERetCMD/​Dossier/</​code>​
  
 <code user>sed -r '/​(a|e).*/​s/​a/​A/'​ ti*</​code>​ <code user>sed -r '/​(a|e).*/​s/​a/​A/'​ ti*</​code>​
Ligne 246: Ligne 324:
 </​code> ​ </​code> ​
  
-===awk ===+====awk ​====
  
   * __De même encore pour awk :__   * __De même encore pour awk :__
Ligne 306: Ligne 384:
 **Puisque tout est bien clair, nous pouvons aller plus loin, et présenter le détail des expressions rationnelles ainsi que leur utilisation avec les programmes GNU/Linux. Cela permettra, non seulement de distinguer ERb, ERe et classes, mais encore d'en apprécier les différences.** ​ 8-) **Puisque tout est bien clair, nous pouvons aller plus loin, et présenter le détail des expressions rationnelles ainsi que leur utilisation avec les programmes GNU/Linux. Cela permettra, non seulement de distinguer ERb, ERe et classes, mais encore d'en apprécier les différences.** ​ 8-)
  
-=====Les expressions rationnelles basiques et les commandes GNU/​Linux===== +=====Caractères communs aux ERb et ERe====
-====Caractères communs aux ERb et ERe====+
 <note tip> <note tip>
   * Certains caractères sont communs au ERb et ERe.\\ Il est possible de les regrouper car toutes les commandes qui permettent de se servir des expressions rationnelles,​ reconnaissent tous les caractères communs aux ERb et ERe.   * Certains caractères sont communs au ERb et ERe.\\ Il est possible de les regrouper car toutes les commandes qui permettent de se servir des expressions rationnelles,​ reconnaissent tous les caractères communs aux ERb et ERe.
Ligne 313: Ligne 391:
   * Certaines commandes les utilisent soit en tant que ERb, soit en tant que ERe :\\ il s'agit de **''​grep''​** ; **''​sed''​** ; **''​locate''​** ; et **''​find''​**.   * Certaines commandes les utilisent soit en tant que ERb, soit en tant que ERe :\\ il s'agit de **''​grep''​** ; **''​sed''​** ; **''​locate''​** ; et **''​find''​**.
  
-  * **''​awk''​** (gawk) utilise en tant que ERe.+  * **''​awk''​** (gawk) ​les utilise en tant que ERe.
  
   * **''​vi''​** (vim) et **''​expr''​** les utilisent en tant que ERb.   * **''​vi''​** (vim) et **''​expr''​** les utilisent en tant que ERb.
Ligne 1499: Ligne 1577:
 La commande grep utilise les classes soit comme ERb et soit comme ERe, c'​est-à-dire sans l'​option -E ou avec l'​option -E  La commande grep utilise les classes soit comme ERb et soit comme ERe, c'​est-à-dire sans l'​option -E ou avec l'​option -E 
  
-Préparation ===+===Préparation ===
   * soit le fichier "   * soit le fichier "
 <code user>cd ~/ERetCMD/ && cat >> liste-class <<EOF <code user>cd ~/ERetCMD/ && cat >> liste-class <<EOF
Ligne 1515: Ligne 1593:
 </​code>​ </​code>​
  
-===[[:​class:​]] + quantificateur { }===+===<​nowiki>​[[:class:]]</​nowiki> ​+ quantificateur { }===
  
 <code user>​grep "​[[:​digit:​]]\{4\}"​ liste-class</​code>​ <code user>​grep "​[[:​digit:​]]\{4\}"​ liste-class</​code>​
Ligne 1750: Ligne 1828:
  
  
-=====Raccourcis ​et programmes d'​édition=====+=====Séquences d'​échappement ​et programmes d'​édition===== 
 + 
 +Sur les séquences d'​échappement POSIX\\ voir : [[http://​fr.wikipedia.org/​wiki/​Expression_rationnelle#​S.C3.A9quences_d.E2.80.99.C3.A9chappement_POSIX]]\\ ​
  
 +À ne pas confondre avec les classes abrégées supportées uniquement par les regex PCRE\\ voir : [[http://​en.wikipedia.org/​wiki/​Regular_expression#​Examples]]
  
-Les raccourcis ne sont pas posix 
  
 ====sed ==== ====sed ====
utilisateurs/hypathie/tutos/erb-et-ere-par-le-contexte-des-commandes.1408099915.txt.gz · Dernière modification: 15/08/2014 12:51 par Hypathie

Pied de page des forums

Propulsé par FluxBB