Vous n'êtes pas identifié(e).
L'icône rouge permet de télécharger chaque page du wiki visitée au format
PDF et la grise au format ODT →
Ci-dessous, les différences entre deux révisions de la page.
Les deux révisions précédentes Révision précédente Prochaine révision | Révision précédente Prochaine révision Les deux révisions suivantes | ||
utilisateurs:hypathie:tutos:erb-et-ere-par-le-contexte-des-commandes [13/08/2014 18:37] Hypathie [Les expressions rationnelles basiques et les commandes GNU/Linux] |
utilisateurs:hypathie:tutos:erb-et-ere-par-le-contexte-des-commandes [14/08/2014 09:17] Hypathie [Introduction] |
||
---|---|---|---|
Ligne 9: | Ligne 9: | ||
=====Introduction ===== | =====Introduction ===== | ||
- | Pour apprendre à utiliser les expressions rationnelles, il faut en passer par l'exercice.\\ | ||
- | Mais pour être en mesure d'en passer par l'exercice, il faut nécessairement en passer par les programmes utilisant les expressions rationnelles. C'est là que les choses se compliquent pour le néophyte.\\ | ||
Il faut savoir en effet que : | Il faut savoir en effet que : | ||
- | * la configuration locale affecte la façon dont les expressions rationnelles sont interprétées((Voir Variables d'environnement, pour une description de la façon dont la configuration de votre environnement local influe sur l'interprétation des expressions rationnelles)). | + | * qu'il y a plusieurs types d'expressions rationnelles, celles reposant sur [[http://fr.wikipedia.org/wiki/Biblioth%C3%A8que_logicielle|la bibliothèque]] REGEX, celles reposant sur la bibliothèque [[http://fr.wikipedia.org/wiki/PCRE|PCRE]]. |
- | + | ||
- | * qu'il y a également plusieurs types d'expressions rationnelles, celles reposant sur [[http://fr.wikipedia.org/wiki/Biblioth%C3%A8que_logicielle|la bibliothèque]] REGEX, celles reposant sur la bibliothèque [[http://fr.wikipedia.org/wiki/PCRE|PCRE]]. | + | |
* qu'il y a différents programmes qui utilisent soit l'une, soit l'autre bibliothèque par exemple grep, expr, awk, Perl, Tcl, Python... Je ne parlerai que de ceux pouvant utiliser la bibliothèque REGEX. | * qu'il y a différents programmes qui utilisent soit l'une, soit l'autre bibliothèque par exemple grep, expr, awk, Perl, Tcl, Python... Je ne parlerai que de ceux pouvant utiliser la bibliothèque REGEX. | ||
Ligne 45: | Ligne 41: | ||
* **expr** : **ERb**\\ pour la correspondance de chaîne de caractères avec une expression régulière. | * **expr** : **ERb**\\ pour la correspondance de chaîne de caractères avec une expression régulière. | ||
* **grep** : **ERb**\\ sélectionne par la //ER//, la ou les lignes d'un ou plusieurs fichiers comportant le motif. grep peut aussi rechercher les fichiers contenant le motif. | * **grep** : **ERb**\\ sélectionne par la //ER//, la ou les lignes d'un ou plusieurs fichiers comportant le motif. grep peut aussi rechercher les fichiers contenant le motif. | ||
+ | * **grep -E** ou **egrep** : **ERe**\\ Même usage que grep | ||
* **find** : **ERb** en le précisant avec l'option **''-regextype "posix-basic"''** ou **ERe** en précisant avec l'option **''-regextype "posix-extended"''**\\ rechercher de fichier en fonction du motif spécifié par la //ER//. | * **find** : **ERb** en le précisant avec l'option **''-regextype "posix-basic"''** ou **ERe** en précisant avec l'option **''-regextype "posix-extended"''**\\ rechercher de fichier en fonction du motif spécifié par la //ER//. | ||
* **locate** : **ERb** avec l'option **''- -regexp''** ou **ERe** avec l'option **''- -regex''**\\ recherche de fichiers selon un motif dans la base de données. | * **locate** : **ERb** avec l'option **''- -regexp''** ou **ERe** avec l'option **''- -regex''**\\ recherche de fichiers selon un motif dans la base de données. | ||
* **vi** : **ERb**\\ recherche et substitution de chaîne de caractères. | * **vi** : **ERb**\\ recherche et substitution de chaîne de caractères. | ||
- | * **egrep** ou **grep -E** : **ERe**\\ Même usage que grep | ||
* **sed** : **ERb**\\ par exemple, sélectionne, modifie les chaînes d'un fichier ou de l'affichage en se basant sur les colonnes. La //ER// permet de sélectionner quelle(s) colonne(s) est (sont) concernée(s). | * **sed** : **ERb**\\ par exemple, sélectionne, modifie les chaînes d'un fichier ou de l'affichage en se basant sur les colonnes. La //ER// permet de sélectionner quelle(s) colonne(s) est (sont) concernée(s). | ||
* **sed -r** : **ERe**\\ même usage que sed. | * **sed -r** : **ERe**\\ même usage que sed. | ||
Ligne 56: | Ligne 52: | ||
Les concernant, je me limiterai strictement à leur utilisation des //ER//. | Les concernant, je me limiterai strictement à leur utilisation des //ER//. | ||
- | ====Avant de commencer un rappel des métacaractères du shell==== | + | ====Pour ne plus confondre "métacaractères" du shell et caractères des ER==== |
- | * Rappel des métacatères et des "bracket expression" : | + | ===Rappel des caractères du shell servant au "globbing" === |
- | ^ ^ ^ | + | ^"métacaractères" ^significations ^exemples ^ |
- | |**Les métacaractères du shell (ou joker)** || | + | |**Les métacaractères du shell (ou joker)** ||| |
- | |**''*''** |n'importe quelle chaîne de n'importe quels caractères | | + | |**''*''** |n'importe quelle chaîne de n'importe quels caractères |''ls b*''\\ **liste**\\ b\\ b2\\ bibi\\ bobo\\ bidule\\ ...\\ **mais pas**\\ titi\\ to\\ ... | |
- | |**''?''** |un caractère quelconque et un seul | | + | |**''?''** |un caractère quelconque et un seul |''rm tit?'' **supprime**\\ tito\\ titi\\ tit~\\ ...\\ **mais pas**\\ tintin\\ titi.txt\\ ... | |
- | |**les "bracket expression" ** || | + | |**les "bracket expression" ** ||| |
- | |**''[ ]''** |un caractère cité dans la liste entre crochets | | + | |**''[ ]''** |un caractère cité dans la liste entre crochets |''echo [Tt][io]t[io]''((echo "Toto Tito toto toti tito loto" | echo [Tt][io]t[io]))\\ **affiche les fichiers**\\ Toto\\ Tito\\ toto\\ toti\\ ...\\ **mais pas**\\ loto\\ ... | |
- | |**''[ - ]''** |groupe de caractères | | + | |**''[ - ]''**\\ [a-z]\\ [A-Z]\\ [A-Z]\\ [0-9] |groupe de caractères |''head t[a-z]to''\\ **affiche**\\ titi\\ tito\\ toto\\ ...\\ **mais pas**\\ tOto\\ t5to\\ | |
- | * l'étoile : | + | ===Métacaractère ou caractère d'expression rationnelle ?=== |
- | <code user> | + | |
- | ls * | + | |
- | </code> | + | |
- | <code> | + | |
- | milou test titi titi1 titi.txt toto Toto1.txt | + | |
- | tata tintin titi. titi1.txt tito toto. Toto.txt | + | |
- | </code> | + | |
- | * le point d'interrogation | + | |
- | <code user> | + | |
- | ls titi? | + | |
- | </code> | + | |
- | <code> | + | |
- | titi. titi1 | + | |
- | </code> | + | |
- | * crochets | + | |
- | <code user> | + | |
- | ls [Tt][io]t[io]? | + | |
- | </code> | + | * L'étoile : |
+ | Imaginons qu'on cherche __tous les fichiers__ contenant le caractère "e".\\ | ||
+ | |||
+ | <code user>grep -lR "e" Toto*</code> | ||
+ | |||
+ | > option -l : Ne pas afficher les résultats normaux. À la place, indiquer le nom des fichiers pour lesquels des résultats auraient été affichés. | ||
+ | > option -R : Lire récursivement tous les fichiers à l'intérieur de chaque répertoire. | ||
+ | >Ce qui concerne la recherche dans le contenu du fichier est indiqué par le motif entre guillemets ("e"). C'est là qu'il faudra avec grep placer l'expression rationnelle. Le motif "e" en est d'ailleurs une. | ||
+ | >Le caractère "*" est le métacaractère qui signifie "__nom de fichier__ commençant par "Toto" avec n'importe quel autre caractère après ou pas. | ||
+ | |||
+ | * Le caractère ? | ||
+ | <code>grep -E "[ae]n.?" titi?</code> | ||
<code> | <code> | ||
- | titi. titi1 toto. | + | titi.:dans |
- | </code> | + | titi1:en |
- | * groupe avec crochets | + | titi2:dent |
- | <code user> | + | |
- | ls t[a-z]t[a-z] | + | |
- | </code> | + | |
- | <code> | + | |
- | tata titi tito toto | + | |
</code> | </code> | ||
- | **Il en serait de même avec les commandes echo et rm par exemple.** | + | >Cela signifie qu'on recherche dans les fichiers commençant par **''titi''** suivi d'un seul caractère exactement, et dans lequel on cherche les mots comportant la diphtongue ɑ̃ qui s'écrit "an" ou "en" ; l'expression rationnelle décrit ainsi : chaîne composée de "a" ou "e", suivi de "n", suivi d'un seul caractère ou non. |
+ | > Le **''?''** est un caractère d'expressions rationnelles et signifie "le caractère précédent (ou le groupement précédent) zéro ou une fois. Ici le caractère précédent est le "point", c'est-à-dire un caractère quelconque. | ||
+ | >Il faut grep -E car le **''?''** fait partie des expressions rationnelles étendues. | ||
+ | >On peut aussi faire **''grep "[ae]n.\?" titi?''** car grep utilise par défaut les expressions rationnelles basiques qui nécessitent **''\''** devant certains caractères. | ||
- | ====Métacaractères du shell et commandes utilisant les expressions rationnelles==== | + | * Les crochets ont la même signification en tant que métacaractère et en tant que //ER// |
- | Les commandes de __recherche de fichier__, **grep, find et locate**, utilisent les //ER// mais aussi les métacaractères du shell, dont certains caractères sont homonymes à ceux des //ER//.\\ | + | >Pour trouver dans les fichiers commençant par "T" ou "t" suivi de "i" ou "o" suivi d'un "t" suivi de "i" ou "o" suivi d'un caractère quelconque et un seul ; |
+ | >Une chaîne comportant "T" ou "t" suivi de "i" ou "o" suivi d'un "t" suivi de "i" ou "o" : | ||
- | Si certains métacaractères sont identiques aux caractères des //ER// leur signification n'est pas la même.\\ | + | <code user>grep "[Tt][io]t[io]" [Tt][io]t[io]?</code> |
- | Afin d'éviter toute confusion, voyons comment et dans quel contexte ces commandes utilisent les métacaractères du shell. | + | <code> |
+ | titi.:Toto Titi toto titi tito | ||
+ | titi1:Toto titi toto tito | ||
+ | titi2:Toto Titi | ||
+ | toto.:Toto titi toto tito | ||
+ | </code> | ||
- | ===grep et métacaractères pour globaliser les fichiers concernés === | + | * Le point n'est pas un métacaractère : |
- | Imaginons qu'on cherche tous les fichiers comportant le caractère "e".\\ | + | |
- | * Dans ce cas, il s'agit d'utiliser les métacaractères : | + | |
- | <code user>grep -lR "e" Toto*</code> | + | |
- | > option -l : Ne pas afficher les résultats normaux. À la place, indiquer le nom des fichiers pour lesquels des résultats auraient été affichés. | + | > mais c'est un caractère des expressions rationnelles. |
- | > option -R : Lire récursivement tous les fichiers à l'intérieur de chaque répertoire. | + | >Ainsi la ligne signifie : rechercher un point littéral dans les fichiers commençant soit par "T" soit par "t", suivi de plusieurs caractères, et finissant par "txt" |
+ | <code>grep "\." [Tt]*.txt</code> | ||
<code> | <code> | ||
- | Toto.txt | + | titi1.txt:. |
- | </code> | + | Toto1.txt:. |
- | <code user>grep -lR "e" titi?</code> | + | |
- | <code> | + | |
- | titi. | + | |
- | titi1 | + | |
- | </code> | + | |
- | <code user>grep -lR "e" [Tt][io]t[io]?</code> | + | |
- | <code> | + | |
- | titi. | + | |
- | titi1 | + | |
</code> | </code> | ||
+ | |||
+ | ====Métacaractères du shell et commandes utilisant les expressions rationnelles==== | ||
+ | |||
+ | Parmi les commandes GNU/Linux utilisant les expressions rationnelles, d'autres commandes que **grep** ou **grep -E** utilisent aussi les métacaractères.\\ | ||
+ | |||
+ | Il s'agit de **find** et **locate**. | ||
=== find=== | === find=== | ||
Ligne 182: | Ligne 171: | ||
</note> | </note> | ||
- | **Puisque tout est bien clair, nous pouvons aller plus loin, et présenter comment utiliser les programmes GNU/Linux avec chacun des trois types d'expression rationnelles** 8-) | + | **Puisque tout est bien clair, nous pouvons aller plus loin, et présenter comment utiliser les programmes GNU/Linux permettant d'utiliser les expressions rationnelles. Cela permettra aussi, non seulement de distinguer ERb, ERe et classes, mais encore de comprendre par leurs usages l'intérêt de conserver ces différents types.** 8-) |
=====Les expressions rationnelles basiques et les commandes GNU/Linux===== | =====Les expressions rationnelles basiques et les commandes GNU/Linux===== |