Vous n'êtes pas identifié(e).
L'icône rouge permet de télécharger chaque page du wiki visitée au format PDF et la grise au format ODT →
Ci-dessous, les différences entre deux révisions de la page.
Les deux révisions précédentes Révision précédente Prochaine révision | Révision précédente Prochaine révision Les deux révisions suivantes | ||
utilisateurs:hypathie:tutos:erb-et-ere-par-le-contexte-des-commandes [12/08/2014 13:23] Hypathie [Les classes] |
utilisateurs:hypathie:tutos:erb-et-ere-par-le-contexte-des-commandes [14/08/2014 10:02] Hypathie [Caractères spécifiques aux ERb ou caractères spécifiques aux ERe] |
||
---|---|---|---|
Ligne 1: | Ligne 1: | ||
======Les expressions rationnelles sous le jour des commandes ====== | ======Les expressions rationnelles sous le jour des commandes ====== | ||
- | * Objet : maîtriser les expressions rationnelles, ERb et ERe | + | * Objet : maîtriser les expressions rationnelles basiques et étendues ainsi que les classes POSIX |
* Niveau requis : {{avisé}} | * Niveau requis : {{avisé}} | ||
- | * Commentaires : utiliser les expressions rationnelles basiques et étendues avec grep, find, locate, expr, sed, awk. | + | * Commentaires : utiliser les expressions rationnelles basiques, étendues, les classes avec grep, grep -E, find, locate, expr, vi, sed et awk. |
**NOTA**\\ | **NOTA**\\ | ||
- | Il s'agira de distinguer ERb et ERe et de savoir les utiliser en fonction des commandes qui les utilisent pour effectuer des recherches de fichiers, des recherches dans le contenu des fichiers, et pour les commandes d'édition, des modifications (ajout, suppression dans le contenu) de fichiers. | + | Il s'agira de distinguer les différents usages des ERb, ERe et des classes en fonction des commandes de recherche et d'édition de fichiers GNU/linux. |
- | + | ||
=====Introduction ===== | =====Introduction ===== | ||
- | Pour apprendre à utiliser les expressions rationnelles, il faut en passer par l'exercice.\\ | ||
- | Mais pour être en mesure d'en passer par l'exercice, il faut nécessairement en passer par les programmes utilisant les expressions rationnelles. C'est là que les choses se compliquent pour le néophyte.\\ | ||
Il faut savoir en effet que : | Il faut savoir en effet que : | ||
- | * la configuration locale affecte la façon dont les expressions rationnelles sont interprétées((Voir Variables d'environnement, pour une description de la façon dont la configuration de votre environnement local influe sur l'interprétation des expressions rationnelles)). | + | * qu'il y a plusieurs types d'expressions rationnelles, celles reposant sur [[http://fr.wikipedia.org/wiki/Biblioth%C3%A8que_logicielle|la bibliothèque]] REGEX, celles reposant sur la bibliothèque [[http://fr.wikipedia.org/wiki/PCRE|PCRE]]. |
- | + | ||
- | * qu'il y a également plusieurs types d'expressions rationnelles, celles reposant sur [[http://fr.wikipedia.org/wiki/Biblioth%C3%A8que_logicielle|la bibliothèque]] REGEX, celles reposant sur la bibliothèque [[http://fr.wikipedia.org/wiki/PCRE|PCRE]]. | + | |
* qu'il y a différents programmes qui utilisent soit l'une, soit l'autre bibliothèque par exemple grep, expr, awk, Perl, Tcl, Python... Je ne parlerai que de ceux pouvant utiliser la bibliothèque REGEX. | * qu'il y a différents programmes qui utilisent soit l'une, soit l'autre bibliothèque par exemple grep, expr, awk, Perl, Tcl, Python... Je ne parlerai que de ceux pouvant utiliser la bibliothèque REGEX. | ||
Ligne 25: | Ligne 20: | ||
* La syntaxe d'utilisation des //ER// n'est pas la même d'un programme à l'autre. C'est ce qui motive la rédaction de cette page. Il faut forcément maîtriser la manière d'utiliser les //ER// pour chacun des programmes pour pouvoir les utiliser. Mettre ces différences en avant démystifiera la difficulté attribuée à l'usage des expressions rationnelles. | * La syntaxe d'utilisation des //ER// n'est pas la même d'un programme à l'autre. C'est ce qui motive la rédaction de cette page. Il faut forcément maîtriser la manière d'utiliser les //ER// pour chacun des programmes pour pouvoir les utiliser. Mettre ces différences en avant démystifiera la difficulté attribuée à l'usage des expressions rationnelles. | ||
- | * Enfin, les différents programmes susceptibles d'utiliser toutes les //ER// de la bibliothèque REGEX, vi, expr, grep, egrep, find, locate, sed, awk, etc., bien que pouvant tous utiliser la norme POSIX, __transforment le contexte d'utilisation de l'//ER// et par conséquent, l'utilisation d'une même //ER// n'a plus le même effet d'un programme à l'autre__.\\ C'est là un point crucial, rarement mis en avant et qu'il est pourtant nécessaire de soulever, pour des raisons pédagogiques, mais aussi pour des raisons philosophiques que je ne développerai pas.\\ Le fondement en est simplement la conviction que toute moquerie envers la diversité, tandis qu'un méta-langage est par définition l'unité cachée derrière tout genre de multiple, est une tentative qui s'ignore de ramener le méta-langage lui-même à une simple symbolisation du langage, et par conséquent, une tentative intéressée d'instrumentaliser la raison. | + | * Enfin, les différents programmes susceptibles d'utiliser toutes les //ER// de la bibliothèque REGEX, vi, expr, grep, egrep, find, locate, sed, awk, etc., bien que pouvant tous utiliser la norme POSIX, __transforment le contexte d'utilisation de l'//ER// et par conséquent, l'utilisation d'une même //ER// n'a plus le même effet d'un programme à l'autre__.\\ C'est là un point crucial, rarement mis en avant et qu'il est pourtant nécessaire de soulever, pour des raisons pédagogiques, mais aussi pour des raisons philosophiques que je ne développerai pas.\\ Le fondement en est simplement la conviction que le dédain envers la diversité, tandis qu'un méta-langage est par définition l'unité cachée derrière tout genre de multiple, est une tentative qui s'ignore de ramener le méta-langage lui-même à une simple symbolisation du langage, et par conséquent, une tentative intéressée d'instrumentaliser la raison. |
- | **Cette présentation montera comment utiliser des expressions rationnelles au moyen des commandes de recherches et d'édition de fichiers, et cela, en appréhendant seulement les expressions rationnelles POSIX de la bibliothèque REGEX.\\ | + | **Cette présentation des expressions rationnelles montera comment les utiliser au moyen des commandes de recherches et d'édition de fichiers, et cela, en appréhendant seulement les expressions rationnelles POSIX de la bibliothèque REGEX.\\ |
En bref, il s'agira de présenter les types de //ER// qui s'utilisent en ligne de commandes ou dans des scripts shell GNU/linux.** | En bref, il s'agira de présenter les types de //ER// qui s'utilisent en ligne de commandes ou dans des scripts shell GNU/linux.** | ||
Ligne 34: | Ligne 29: | ||
Il y en a trois : | Il y en a trois : | ||
- | * expression rationnelles basiques (ERb); | + | * expression rationnelle basique (ERb); appelées aussi "Basic Regular Expression" (BRE) |
- | * expression rationnelles étendues (ERe); | + | |
+ | * expression rationnelle étendue (ERe); appelées aussi "Extended Regular Expression" (ERE) | ||
* les classes POSIX (considérer soit comme ERb, soit comme ERe selon les programmes | * les classes POSIX (considérer soit comme ERb, soit comme ERe selon les programmes | ||
- | Les raccourcis (par exemples, retour à la ligne ''\n'', tabulation ''\t'') étant particuliers aux programmes, seront listés en complément mais ne seront pas exemplifiés. | + | Les raccourcis (par exemples, retour à la ligne ''\n'', tabulation ''\t'') étant particuliers aux programmes, seront listés en complément. |
- | ==== Panorama exhaustif des programmes GNU/Linux concernés par les ERE=== | + | ==== Panorama exhaustif des programmes GNU/Linux concernés par les expressions rationnelles=== |
* **expr** : **ERb**\\ pour la correspondance de chaîne de caractères avec une expression régulière. | * **expr** : **ERb**\\ pour la correspondance de chaîne de caractères avec une expression régulière. | ||
* **grep** : **ERb**\\ sélectionne par la //ER//, la ou les lignes d'un ou plusieurs fichiers comportant le motif. grep peut aussi rechercher les fichiers contenant le motif. | * **grep** : **ERb**\\ sélectionne par la //ER//, la ou les lignes d'un ou plusieurs fichiers comportant le motif. grep peut aussi rechercher les fichiers contenant le motif. | ||
+ | * **grep -E** ou **egrep** : **ERe**\\ Même usage que grep | ||
* **find** : **ERb** en le précisant avec l'option **''-regextype "posix-basic"''** ou **ERe** en précisant avec l'option **''-regextype "posix-extended"''**\\ rechercher de fichier en fonction du motif spécifié par la //ER//. | * **find** : **ERb** en le précisant avec l'option **''-regextype "posix-basic"''** ou **ERe** en précisant avec l'option **''-regextype "posix-extended"''**\\ rechercher de fichier en fonction du motif spécifié par la //ER//. | ||
* **locate** : **ERb** avec l'option **''- -regexp''** ou **ERe** avec l'option **''- -regex''**\\ recherche de fichiers selon un motif dans la base de données. | * **locate** : **ERb** avec l'option **''- -regexp''** ou **ERe** avec l'option **''- -regex''**\\ recherche de fichiers selon un motif dans la base de données. | ||
- | * **vi** (**vim**) : **ERb**\\ recherche et substitution de chaîne de caractères. | + | * **vi** : **ERb**\\ recherche et substitution de chaîne de caractères. |
- | * **egrep** ou **grep -E** : **ERe**\\ Même usage que grep | + | |
* **sed** : **ERb**\\ par exemple, sélectionne, modifie les chaînes d'un fichier ou de l'affichage en se basant sur les colonnes. La //ER// permet de sélectionner quelle(s) colonne(s) est (sont) concernée(s). | * **sed** : **ERb**\\ par exemple, sélectionne, modifie les chaînes d'un fichier ou de l'affichage en se basant sur les colonnes. La //ER// permet de sélectionner quelle(s) colonne(s) est (sont) concernée(s). | ||
* **sed -r** : **ERe**\\ même usage que sed. | * **sed -r** : **ERe**\\ même usage que sed. | ||
- | * **awk** : **ERe**\\ sélectionne les colonnes, lignes, mots d'un fichier, et modifie l'affichage, le fichier, etc. en utilisant la //ER// comme condition de l'action qu'on choisit. | + | * **awk**((c'est-à-dire **gawk**\\ ''whereis awk''\\ awk: /usr/bin/awk\\ ''ls -l /usr/bin/awk''\\ lrwxrwxrwx 1 root root 21 juin 8 18:43 /usr/bin/awk -> /etc/alternatives/awk\\ ''ls -l /etc/alternatives/awk''\\ lrwxrwxrwx 1 root root 13 juil. 13 18:41 /etc/alternatives/awk -> /usr/bin/**gawk**)) : **ERe**\\ sélectionne les colonnes, lignes, mots d'un fichier, et modifie l'affichage, le fichier, etc. en utilisant la //ER// comme condition de l'action qu'on choisit. |
- | On peut aussi combiner, par exemple, **find** et **grep** permettent de rechercher une chaîne et le fichier contenant cette chaîne en une ligne de commande avec un pipe.\\ | + | Concernant chacun de ces programmes, je n'entrerai ni dans les combinaisons possibles entre eux, ni n'approfondirai chacun d'eux en détail. Voir pour cela la documentation à leur sujet.\\ |
+ | Les concernant, je me limiterai strictement à leur utilisation des //ER//. | ||
- | Mais, concernant tous ces programmes, je n'entrerai ni dans les combinaisons possibles entre eux, ni n'approfondirai chacun d'eux en détail. Voir pour cela la documentation à leur sujet.\\ | + | ====Pour ne plus confondre "métacaractères" du shell et caractères des ER==== |
- | Les concernant, je me limiterai strictement à leur utilisation par rapport aux //ER//. | + | |
- | ====Avant de commencer un rappel des métacaractères du shell==== | + | ===Rappel des caractères du shell servant au "globbing" === |
- | * Rappel des métacatères et des "bracket expression" : | + | ^"métacaractères" ^significations ^exemples ^ |
+ | |**Les métacaractères du shell (ou joker)** ||| | ||
+ | |**''*''** |n'importe quelle chaîne de n'importe quels caractères |''ls b*''\\ **liste**\\ b\\ b2\\ bibi\\ bobo\\ bidule\\ ...\\ **mais pas**\\ titi\\ to\\ ... | | ||
+ | |**''?''** |un caractère quelconque et un seul |''rm tit?'' **supprime**\\ tito\\ titi\\ tit~\\ ...\\ **mais pas**\\ tintin\\ titi.txt\\ ... | | ||
+ | |**les "bracket expression" ** ||| | ||
+ | |**''[ ]''** |un caractère cité dans la liste entre crochets |''echo [Tt][io]t[io]''((echo "Toto Tito toto toti tito loto" | echo [Tt][io]t[io]))\\ **affiche les fichiers**\\ Toto\\ Tito\\ toto\\ toti\\ ...\\ **mais pas**\\ loto\\ ... | | ||
+ | |**''[ - ]''**\\ [a-z]\\ [A-Z]\\ [A-Z]\\ [0-9] |groupe de caractères |''head t[a-z]to''\\ **affiche**\\ titi\\ tito\\ toto\\ ...\\ **mais pas**\\ tOto\\ t5to\\ | | ||
- | ^ ^ ^ | + | ===Métacaractère ou caractère d'expression rationnelle ?=== |
- | |**Les métacaractères du shell (ou joker)** || | + | |
- | |**''*''** |n'importe quelle chaîne de n'importe quels caractères | | + | |
- | |**''?''** |un caractère quelconque et un seul | | + | |
- | |**les "bracket expression" ** || | + | |
- | |**''[ ]''** |un caractère cité dans la liste entre crochets | | + | |
- | |**''[ - ]''** |groupe de caractères | | + | |
- | * l'étoile : | + | * L'étoile : |
- | <code user> | + | Imaginons qu'on cherche __tous les fichiers__ contenant le caractère "e".\\ |
- | ls * | + | |
- | </code> | + | |
- | <code> | + | |
- | milou test titi titi1 titi.txt toto Toto1.txt | + | |
- | tata tintin titi. titi1.txt tito toto. Toto.txt | + | |
- | </code> | + | |
- | * le point d'interrogation | + | |
- | <code user> | + | |
- | ls titi? | + | |
- | </code> | + | |
- | <code> | + | |
- | titi. titi1 | + | |
- | </code> | + | |
- | * crochets | + | |
- | <code user> | + | |
- | ls [Tt][io]t[io]? | + | |
- | </code> | + | <code user>grep -lR "e" Toto*</code> |
+ | |||
+ | > option -l : Ne pas afficher les résultats normaux. À la place, indiquer le nom des fichiers pour lesquels des résultats auraient été affichés. | ||
+ | > option -R : Lire récursivement tous les fichiers à l'intérieur de chaque répertoire. | ||
+ | >Ce qui concerne la recherche dans le contenu du fichier est indiqué par le motif entre guillemets ("e"). C'est là qu'il faudra avec grep placer l'expression rationnelle. Le motif "e" en est d'ailleurs une. | ||
+ | >Le caractère "*" est le métacaractère qui signifie "__nom de fichier__ commençant par "Toto" avec n'importe quel autre caractère après ou pas. | ||
+ | |||
+ | * Le caractère ? | ||
+ | <code>grep -E "[ae]n.?" titi?</code> | ||
<code> | <code> | ||
- | titi. titi1 toto. | + | titi.:dans |
- | </code> | + | titi1:en |
- | * groupe avec crochets | + | titi2:dent |
- | <code user> | + | |
- | ls t[a-z]t[a-z] | + | |
- | </code> | + | |
- | <code> | + | |
- | tata titi tito toto | + | |
</code> | </code> | ||
- | **Il en serait de même avec les commandes echo et rm par exemple.** | + | >Cela signifie qu'on recherche dans les fichiers commençant par **''titi''** suivi d'un seul caractère exactement, et dans lequel on cherche les mots comportant la diphtongue ɑ̃ qui s'écrit "an" ou "en" ; l'expression rationnelle décrit ainsi : chaîne composée de "a" ou "e", suivi de "n", suivi d'un seul caractère ou non. |
+ | > Le **''?''** est un caractère d'expressions rationnelles et signifie "le caractère précédent (ou le groupement précédent) zéro ou une fois. Ici le caractère précédent est le "point", c'est-à-dire un caractère quelconque. | ||
+ | >Il faut grep -E car le **''?''** fait partie des expressions rationnelles étendues. | ||
+ | >On peut aussi faire **''grep "[ae]n.\?" titi?''** car grep utilise par défaut les expressions rationnelles basiques qui nécessitent **''\''** devant certains caractères. | ||
- | ====Métacaractères du shell et commandes utilisant les expressions rationnelles==== | + | * Les crochets ont la même signification en tant que métacaractère et en tant que //ER// |
- | Les commandes de __recherche de fichier__, **grep, find et locate**, utilisent les //ER// mais aussi les métacaractères du shell, dont certains caractères sont homonymes à ceux des //ER//.\\ | + | >Pour trouver dans les fichiers commençant par "T" ou "t" suivi de "i" ou "o" suivi d'un "t" suivi de "i" ou "o" suivi d'un caractère quelconque et un seul ; |
+ | >Une chaîne comportant "T" ou "t" suivi de "i" ou "o" suivi d'un "t" suivi de "i" ou "o" : | ||
- | Si certains métacaractères sont identiques aux caractères des //ER// leur signification n'est pas la même.\\ | + | <code user>grep "[Tt][io]t[io]" [Tt][io]t[io]?</code> |
- | Afin d'éviter toute confusion, voyons comment et dans quel contexte ces commandes utilisent les métacaractères du shell. | + | <code> |
+ | titi.:Toto Titi toto titi tito | ||
+ | titi1:Toto titi toto tito | ||
+ | titi2:Toto Titi | ||
+ | toto.:Toto titi toto tito | ||
+ | </code> | ||
- | ===grep et métacaractères pour globaliser les fichiers concernés === | + | * Le point n'est pas un métacaractère : |
- | Imaginons qu'on cherche tous les fichiers comportant le caractère "e".\\ | + | |
- | * Dans ce cas, il s'agit d'utiliser les métacaractères : | + | |
- | <code user>grep -lR "e" Toto*</code> | + | |
- | > option -l : Ne pas afficher les résultats normaux. À la place, indiquer le nom des fichiers pour lesquels des résultats auraient été affichés. | + | > mais c'est un caractère des expressions rationnelles. |
- | > option -R : Lire récursivement tous les fichiers à l'intérieur de chaque répertoire. | + | >Ainsi la ligne signifie : rechercher un point littéral((le point étant un caractère des ER, il faut l'antislash pour qu'il soit lu comme un point littéral)) dans les fichiers commençant soit par "T" soit par "t", suivi de plusieurs caractères, et finissant par "txt" |
+ | <code>grep "\." [Tt]*.txt</code> | ||
<code> | <code> | ||
- | Toto.txt | + | titi1.txt:. |
- | </code> | + | Toto1.txt:. |
- | <code user>grep -lR "e" titi?</code> | + | |
- | <code> | + | |
- | titi. | + | |
- | titi1 | + | |
- | </code> | + | |
- | <code user>grep -lR "e" [Tt][io]t[io]?</code> | + | |
- | <code> | + | |
- | titi. | + | |
- | titi1 | + | |
</code> | </code> | ||
+ | |||
+ | ====Métacaractères du shell et commandes utilisant les expressions rationnelles==== | ||
+ | |||
+ | Parmi les commandes GNU/Linux utilisant les expressions rationnelles, d'autres commandes que **grep** ou **grep -E** utilisent aussi les métacaractères.\\ | ||
+ | |||
+ | Il s'agit de **find** et **locate**. | ||
=== find=== | === find=== | ||
Ligne 183: | Ligne 171: | ||
</note> | </note> | ||
- | **Puisque tout est bien clair, nous pouvons aller plus loin, et présenter comment utiliser les programmes GNU/Linux avec chacun des trois types d'expression rationnelles** 8-) | + | **Puisque tout est bien clair, nous pouvons aller plus loin, et présenter comment utiliser les programmes GNU/Linux permettant d'utiliser les expressions rationnelles. Cela permettra aussi, non seulement de distinguer ERb, ERe et classes, mais encore de comprendre par leurs usages l'intérêt de conserver ces différents types.** 8-) |
- | =====Les expressions rationnelles basiques selon les commandes===== | + | =====Les expressions rationnelles basiques et les commandes GNU/Linux===== |
====Caractères communs aux ERb et ERe==== | ====Caractères communs aux ERb et ERe==== | ||
+ | <note tip> | ||
+ | * Certains caractères sont communs au ERb et ERe.\\ Pour ne pas avoir à les répéter, il est préférable de les regrouper. D'autant plus que les commandes qui permettent de se servir des expressions rationnelles, reconnaissent tous les caractères communs aux ERb et ERe. | ||
- | Certains caractères sont communs au ERb et ERe, pour ne pas avoir à les répéter, il est préférable de les regrouper. D'autant plus que les commandes qui permettent de se servir des ER en général, reconnaissent tous les caractères communs aux ERb et ERe, excepté pour les classes. | + | * Certaines commandes utilisent soit les ERb soit les ERe en fonction d'option :\\ il s'agit de **''grep''** ; **''sed''** ; **''locate''** ; et **''find''**. |
+ | * **''awk''** (gawk) utilise les ERe. | ||
+ | |||
+ | * **''vi''** (vim) et **''expr''** n'utilisent que les ERb. | ||
+ | |||
+ | </note> | ||
^expressions ^Modèles reconnus ^ | ^expressions ^Modèles reconnus ^ | ||
Ligne 204: | Ligne 199: | ||
+ | ====La commande grep et les caractères communs aux ERb et ERe==== | ||
+ | <note tip> | ||
+ | Sans option ou avec l'option -G, grep utilise les expressions rationnelles basiques. | ||
- | Certaines commandes utilisent soit les ERb soit les ERe en fonction d'option : il s'agit de grep ; sed ; locate ; et find.\\ | + | <code man grep> |
- | Awk utilise les ERe.\\ | + | -G, --basic-regexp |
- | Je les présente ici, parce qu'elles utilisent toutes les caractères communs aux ERb et ERe. | + | Interpréter le MOTIF comme une expression rationnelle simple |
+ | C'est le comportement par défaut. | ||
- | Je présenterai les commandes qui utilisent seulement les ERb dans le chapitre concernant les caractères spécifiques aux ERb. Les caractères communs aux ERb et ERe étant alors suffisamment exemplifiés. De plus, les caractères spécifiques aux ERb servent à composer des expressions rationnelles plus complexes, utilisant ces caractères communs aux ERb et ERe. | + | </code> |
- | ====la commande grep et les caractères communs aux ERb et ERe==== | + | Pour l'utilisation de grep (grep -G ou grep -E) avec soit les caractères spécifiques aux ERb, soit les caractères spécifiques aux ERe, voir [[utilisateurs:hypathie:tutos:erb-et-ere-par-le-contexte-des-commandes#grep-e-egrep-et-les-caracteres-specifiques-aux-ere|"grep -E (egrep) et les caractères spécifiques aux ERe"]]. |
- | Sans l'option -E, grep fonctionne avec les ERb. | + | </note> |
* Soit le fichier "liste1-nom" : | * Soit le fichier "liste1-nom" : | ||
Ligne 331: | Ligne 330: | ||
====La commande find et les caractères communs aux ERb et ERe==== | ====La commande find et les caractères communs aux ERb et ERe==== | ||
+ | <code man find> | ||
+ | -regextype type | ||
+ | Définir la syntaxe des expressions rationnelles des tests -regex | ||
+ | et -iregex qui seront indiqués plus loin sur la ligne de com‐ | ||
+ | mande. Les types actuellement implémentés sont emacs (type par | ||
+ | défaut), posix-awk, posix-basic, posix-egrep et posix-extended. | ||
+ | |||
+ | </code> | ||
<note tip> | <note tip> | ||
- | Les types de //ER// actuellement implémentés sont emacs.\\ | + | Avec find il faut toujours une option pour utiliser une //ER//.\\ |
- | Pour utiliser les ERb il faut utiliser l'option -regextype posix-basic pour définir le type de ER qu'on souhaite utiliser.\\ | + | |
- | Mais aussi l'une des options prévenant find, qu'on va utiliser une ER, de même qu'on prévient qu'on cherche un motif en respectant la casse avec -name : | + | * Pour une expression rationnelle basique :\\ |
- | * ''-regex motif'' : Nom de fichier correspondant à l'expression rationnelle 'motif'.\\ Il s'agit d'une correspondance sur le chemin complet, pas d'une\\ recherche. Par exemple, pour mettre en correspondance un fichier\\ nommé « ./fubar3 », vous pouvez utiliser les expressions rationnelles « .*bar. » ou « .*b.*3 », mais pas « f.*r3 ».\\ | + | <code> |
+ | find -regextype "posix-basic" -regex "son-expression-rationnelle-basique" | ||
+ | </code> | ||
+ | |||
+ | * Pour une expression rationnelle étendue :\\ | ||
+ | <code> | ||
+ | find -regextype "posix-extended" -regex "son-expression-rationnelle-étendue" | ||
+ | </code> | ||
+ | |||
+ | * Il faut aussi prévenir find, qu'on va utiliser une ER avec :((de même qu'on prévient qu'on cherche un motif en respectant la casse avec ''-name'')) | ||
+ | * **''-regex ER''** | ||
+ | * **''-iregex motif''** : Semblable à -regex, pour ne pas tenir compte de la casse (ne pas différencier les majuscules et les minuscules). | ||
+ | |||
+ | * Il s'agit d'une correspondance sur __le chemin complet__.\\ Pour représenter un chemin absolu quelque soit-il, il faut ajouter en début d'expression **''.*''**. | ||
+ | |||
+ | Je ne donnerai ici quelques exemples d'utilisation des caractères communs aux ERb et ERe, en tant que caractères ERb, afin d'illustrer l'utilisation de find avec l'option ''-regextype "posix-basic''.\\ | ||
+ | |||
+ | Pour l'utilisation des caractères spécifiques aux ERb ou des caractères spécifiques aux ERe avec find, voir : [[utilisateurs:hypathie:tutos:erb-et-ere-par-le-contexte-des-commandes#find-et-les-caracteres-specifiques-aux-ere|"find et les caractères spécifiques aux ERe"]].\\ | ||
- | * ''-iregex motif'' : Semblable à -regex, mais sans différencier les majuscules et les\\ minuscules. | ||
</note> | </note> | ||
- | Je ne donnerai que quelques exemples, puisque tous les caractères de ERb sont utilisables. \\ Je m'attacherai surtout à la syntaxe de find pour ce faire. | ||
* Soit le __répertoire parent__ des fichiers listés ci-dessous : | * Soit le __répertoire parent__ des fichiers listés ci-dessous : | ||
Ligne 361: | Ligne 383: | ||
>Le premier groupe de ''.*'' décrit le chemin du ou des fichiers dont le nom correspond à une chaîne commençant par "li", suivi de plusieurs caractères (deuxième groupe ''.*''), puis d'un "m". | >Le premier groupe de ''.*'' décrit le chemin du ou des fichiers dont le nom correspond à une chaîne commençant par "li", suivi de plusieurs caractères (deuxième groupe ''.*''), puis d'un "m". | ||
- | >Attention la même commande lancée depuis le répertoire personnel de l'utilisateur par exemple et non depuis le répertoire parent des fichiers : | + | >La même commande lancée depuis un répertoire plus en amont dans la hiérarchie, par exemple, depuis le répertoire personnel de l'utilisateur,et non depuis le répertoire parent des fichiers : |
<code>find -regextype "posix-basic" -regex ".*/li.*m"</code> | <code>find -regextype "posix-basic" -regex ".*/li.*m"</code> | ||
Ligne 386: | Ligne 408: | ||
====La commande locate et les caractères communs aux ERb et ERe==== | ====La commande locate et les caractères communs aux ERb et ERe==== | ||
+ | |||
<note tip> | <note tip> | ||
- | Pour utiliser les ERb, il faut utiliser l'option : | + | Pour utiliser les //ER// avec locate, il faut dans tous les cas une option.\\ |
+ | Les caractères communs aux ERb et ERe, peuvent être utilisés avec l'une ou l'autre de ces options : | ||
- | <code>--regexp</code> | + | * __Pour utiliser les ERb, il faut utiliser l'option__ : |
+ | |||
+ | <code man locate> | ||
+ | --regexp REGEXP | ||
+ | Search for a basic regexp REGEXP. No PATTERNs are allowed if | ||
+ | this option is used, but this option can be specified multiple | ||
+ | times. | ||
+ | </code> | ||
+ | |||
+ | * __Pour utiliser ces mêmes caractères en tant que ERe il faut utiliser l'option__ : | ||
+ | <code man locate> | ||
+ | --regex | ||
+ | Interpret all PATTERNs as extended regexps | ||
+ | </code> | ||
+ | |||
+ | Sans l'une ou l'autre de ces options, locate reconnaît le caractère ''*'' comme un métacaractère du shell.\\ | ||
+ | |||
+ | => Cela a une conséquence par rapport aux caractères ERb qui ne sont pas communs aux ERe.\\ | ||
+ | Autrement dit, si on choisit d'utiliser les ERb, il faudra un antislash pour utiliser [[utilisateurs:hypathie:tutos:erb-et-ere-par-le-contexte-des-commandes?&#caracteres-specifiques-aux-erb|les caractères spécifiques aux ERb]] et ce sera inutile si on choisit les ERe. | ||
+ | |||
+ | Voir l'utilisation de [[utilisateurs:hypathie:tutos:erb-et-ere-par-le-contexte-des-commandes?&#locate-et-les-caracteres-specifiques-aux-erb|locate avec les caractères spécifiques aux ERb]]. | ||
- | Sinon, locate reconnaît le caractère ''*'' comme un métacaractère du shell.\\ | ||
- | Contrairement à find, il n'est pas nécessaire que la ER corresponde au chemin absolu d'un fichier.\\ | + | *Contrairement à find, __il n'est pas nécessaire que la ER corresponde au chemin absolu d'un fichier__.\\ |
- | Mais la quantité de réponses peut être très élevée, si on a une idée du répertoire dans lequel se trouve le fichier recherché, il peut plus confortable de le préciser.\\ | + | Mais la quantité de réponses peut être très élevée, et si l'on a une idée du répertoire dans lequel se trouve le fichier recherché, il peut plus confortable de le préciser.\\ |
On peut aussi filtrer le retour avec grep.\\ | On peut aussi filtrer le retour avec grep.\\ | ||
- | Néanmoins, l'utilisation des ERe règle ce problème. (Voir plus bas) | ||
- | Enfin, avec l'utilisation de locate, on n'aura guère l'occasion d'utiliser les caractères début (^) et fin de ligne ($).\\ | + | * Enfin, avec l'utilisation de locate, le caractère début (^) est inusité.\\ |
- | En effet, avec une commande qui cherche des noms de fichiers en fonction d'une chaîne contenu dans ce nom, on ne peut utiliser que '' '^/' '', c'est-à-dire, le début du chemin absolu, ce qui demande d'allonger inutilement l'expression régulière ! | + | |
+ | En effet, avec une commande qui recherche des noms de fichier, la seule possibilité serait **''^/''**. Or locate permet justement de ne pas avoir à donner le chemin absolu du fichier recherché. L'utiliser ne ferait qu'allonger inutilement l'expression régulière ! | ||
</note> | </note> | ||
* Étoile et point | * Étoile et point | ||
<code user>locate --regexp '/home.*[Tt]o.*'</code> | <code user>locate --regexp '/home.*[Tt]o.*'</code> | ||
- | >Donne un retour de plusieurs pages par exemple en cas d'une grande quantité de photo dans un des répertoires de l'utilisateur. | ||
+ | >Donne un retour de plusieurs pages. | ||
<code user>locate --regexp '/home.*[Tt]o.*' | grep "/Dossier/"</code> | <code user>locate --regexp '/home.*[Tt]o.*' | grep "/Dossier/"</code> | ||
Ligne 414: | Ligne 457: | ||
/home/hypathie/ERetCMD/Dossier/toto | /home/hypathie/ERetCMD/Dossier/toto | ||
/home/hypathie/ERetCMD/Dossier/toto. | /home/hypathie/ERetCMD/Dossier/toto. | ||
+ | </code> | ||
+ | |||
+ | * caractère fin de ligne $ : | ||
+ | <code user>locate --regexp '/home.*/Dossier/[Tt]o.*\.txt$'</code> | ||
+ | <code> | ||
+ | /home/hypathie/ERetCMD/Dossier/Toto.txt | ||
+ | /home/hypathie/ERetCMD/Dossier/Toto1.txt | ||
</code> | </code> | ||
Ligne 617: | Ligne 667: | ||
toutefois | toutefois | ||
</code> | </code> | ||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | =====Caractères spécifiques aux ERb ===== | ||
- | ^expressions ^Modèles reconnus ^ | ||
- | |**''<nowiki>\{m\}</nowiki>''** | m fois le caractère précédent | | ||
- | |**''<nowiki>\{m,\} </nowiki>''** | au moins m fois le caractère précédent | | ||
- | |**''<nowiki>\{m,n\} </nowiki>''** | entre m et n fois le caractère précédent | | ||
- | |**''<nowiki>\(ERb\)</nowiki>''** | mémorisation d'une ERb | | ||
- | |**''<nowiki>\1, \2, ...</nowiki>''** | Rappel de mémorisation | | ||
- | |||
- | -> Le caractère **''\''** donne une signification spéciale aux parenthèses et accolades, au lieu de les rendre littérales.\\ | ||
- | Mais il permet de rendre littéraux les autres caractères des ERb, par exemple ''\.'' permet de sélectionner un point. | ||
- | |||
- | <note tip> | ||
- | Je présenterai ici les commandes "spécifiques" aux ERb, c'est-à-dire, celles qui n'ont pas la possibilité d'utiliser les ERE, vi (vim) et expr.\\ | ||
- | Elles utilisent bien sûr tous les caractères ERb et pas seulement les caractères spécifiques aux ERb. | ||
- | </note> | ||
====La commande expr n'utilise que ERb==== | ====La commande expr n'utilise que ERb==== | ||
Ligne 651: | Ligne 678: | ||
abc2356.99 | abc2356.99 | ||
73000|Savoie | 73000|Savoie | ||
+ | 123456 | ||
+ | 1234567 | ||
index-tel|04|Rhône-Alpe | index-tel|04|Rhône-Alpe | ||
-15 +36 5687 {15} exemple{36} | -15 +36 5687 {15} exemple{36} | ||
il y a un truc et un truc et encore un truc et une chose | il y a un truc et un truc et encore un truc et une chose | ||
- | chose et truc ne font pas bon ménage | + | choses et trucs ne font pas bon ménage |
123.3456.abc | 123.3456.abc | ||
- | trucchosetruc | + | trucschosetruc |
- | tructructruc | + | tructructrucs |
chosechosechose | chosechosechose | ||
</code> | </code> | ||
Ligne 666: | Ligne 695: | ||
<note tip> | <note tip> | ||
* La commande expr utilise l'opérateur **'':''** pour mettre en correspondance une chaîne de caractères avec une //ER//. | * La commande expr utilise l'opérateur **'':''** pour mettre en correspondance une chaîne de caractères avec une //ER//. | ||
- | * Si le nombre de caractères de la chaîne correspond à l'ERb, alors expr affiche à l'écran l'expression régulière basique. | + | * Si le nombre de caractères de la chaîne correspond à l'ERb, alors expr affiche ce nombre à l'écran. |
* Si la correspondance décrite ci-dessus est vraie, le code de retour est 0 (zéro). | * Si la correspondance décrite ci-dessus est vraie, le code de retour est 0 (zéro). | ||
* Si elle est fausse, expr retourne 0 (zéro) pour "zéro correspondance) et le code de retour est 1 (un). | * Si elle est fausse, expr retourne 0 (zéro) pour "zéro correspondance) et le code de retour est 1 (un). | ||
* L'expression rationnelle est comparée par rapport au début de la variable, le caractère **''^''** est toujours implicite. | * L'expression rationnelle est comparée par rapport au début de la variable, le caractère **''^''** est toujours implicite. | ||
* Si une partie de l'expression rationnelle est mémorisée avec **''\( \)''** la commande expr affiche dans le terminal la partie correspondante. | * Si une partie de l'expression rationnelle est mémorisée avec **''\( \)''** la commande expr affiche dans le terminal la partie correspondante. | ||
+ | |||
+ | |||
</note> | </note> | ||
Ligne 715: | Ligne 746: | ||
>Demander le code de retour est inutile, la ER est forcément juste, s'il y a affichage de la sous-chaîne correspondante. À moins d'en avoir besoin lors d'une utilisation de expr dans un script shell s'en servant pour un test. | >Demander le code de retour est inutile, la ER est forcément juste, s'il y a affichage de la sous-chaîne correspondante. À moins d'en avoir besoin lors d'une utilisation de expr dans un script shell s'en servant pour un test. | ||
- | |||
- | * sous-chaîne et quantificateur accolades : | ||
- | |||
- | <code user>var=123.456.</code> | ||
- | <code user>expr "$var" : '\([0-9]\{3\}.\)\{2\}'</code> | ||
- | <code> | ||
- | 456. | ||
- | </code> | ||
- | |||
- | > expr affiche la sous-chaîne "456." | ||
- | |||
- | |||
- | *Le caractère **''*''** est gourmand : | ||
- | <code user>var="hypathie|00 rue Debian-facile|01011|ici"</code> | ||
- | <code user>expr "$var" : '\(.*\)|'</code> | ||
- | <code> | ||
- | hypathie|00 rue Debian-facile|01011 | ||
- | </code> | ||
- | |||
+ | ====L'éditeur de texte vi n'utilise aussi que les ERb ==== | ||
- | ====L'éditeur de texte vi n'utilise que les ERb ==== | ||
===Préparation === | ===Préparation === | ||
<code user>cat liste4-vim</code> | <code user>cat liste4-vim</code> | ||
Ligne 756: | Ligne 768: | ||
<note tip> | <note tip> | ||
- | Modes utilises dans ce qui suit\\ | + | Modes utilisés dans ce qui suit :\\ |
Ligne 766: | Ligne 778: | ||
* Pour tester ce qui suit si vous ne connaissez pas vi ou vim :\\ | * Pour tester ce qui suit si vous ne connaissez pas vi ou vim :\\ | ||
- | *Après installation de vim, créer un fichier, par exemple "liste4-vim" : '' vim liste4-vim '' | + | *Après [[doc:editeurs:vim:vim#installation|installation de vim]], créer un fichier, par exemple "liste4-vim" : '' vim liste4-vim '' |
- | *Copier le contenu de "liste4-vim" ci-dessus ; | + | * Copier le contenu de "liste4-vim" ci-dessus ; |
- | *coller dans le fichier "liste4-vim" édité avec vim en faisant : | + | * Pour coller dans le fichier "liste4-vim" édité avec vim : |
* touche <majuscule de droite> + touche <inser> (cela fait que l'on est en mode insertion) | * touche <majuscule de droite> + touche <inser> (cela fait que l'on est en mode insertion) | ||
* sortir du mode insertion : touche "Échap" | * sortir du mode insertion : touche "Échap" | ||
- | * enregistrez : '' :wq '' et touche <entrée> | + | * enregistrer et sortir : '' :wq '' et touche <entrée> |
- | + | * Pour apprendre les rudiments de l'utilisation de vim (et donc de vi), après l'installation de vim : | |
- | * Pour apprendre les rudiment de l'utilisation de vim (et donc de vi), après l'installation de vim : | + | |
vimtutor | vimtutor | ||
- | |||
-> Pour y ajouter l'utilisation des //ER//, suivre ce qui suit. | -> Pour y ajouter l'utilisation des //ER//, suivre ce qui suit. | ||
</note> | </note> | ||
+ | * Éditer le fichier "liste4-vim" : | ||
+ | * Pour éditer le fichier avec vi ou vim : | ||
+ | |||
+ | <code user>vi liste4-vim</code> | ||
+ | ou | ||
+ | <code user>vim liste4-vim</code> | ||
+ | |||
+ | {{http://pix.toile-libre.org/upload/original/1407922486.png?400}} | ||
===Syntaxe d'utilisation des ER=== | ===Syntaxe d'utilisation des ER=== | ||
Ligne 811: | Ligne 829: | ||
*i - drapeau - ignorer la casse (prend en compte toutes les occurrences de la chaîne en majuscules ou en minuscules) | *i - drapeau - ignorer la casse (prend en compte toutes les occurrences de la chaîne en majuscules ou en minuscules) | ||
</note> | </note> | ||
- | |||
- | |||
- | |||
===Exemples de recherches === | ===Exemples de recherches === | ||
Ligne 831: | Ligne 846: | ||
On valide avec entrée, et ''nohlsearch'' pour effacer | On valide avec entrée, et ''nohlsearch'' pour effacer | ||
- | * sous-chaîne avec parenthèses et accolades : | + | |
- | <code> | + | |
- | \([0-9]\{3\}.\)\{2\} | + | |
- | </code> | + | |
- | Vi ou vim surligne à la ligne 9 (comportant "123.3456.abc") la sous-chaîne **''123.3456.''**. | + | |
===Exemples de substitution=== | ===Exemples de substitution=== | ||
Ligne 852: | Ligne 863: | ||
</code> | </code> | ||
- | >"1,$" est l'adressage qui signifie de la première ligne à la fin | + | >"1,$" est l'adressage qui signifie de la première ligne à la fin. |
+ | |||
+ | * sous-chaîne avec parenthèses et accolades : | ||
+ | <code> | ||
+ | /\([0-9]\{3\}.\)\{2\} | ||
+ | </code> | ||
+ | Vi ou vim surligne à la ligne 9 (comportant "123.3456.abc") la sous-chaîne **''123.3456.''**. | ||
+ | |||
+ | |||
+ | |||
+ | =====Caractères spécifiques aux ERb et ERe ===== | ||
+ | |||
+ | <note tip> | ||
+ | Je présenterai ici les commandes qui utilisent uniquement les ERb, c'est-à-dire, celles qui n'ont pas besoin d'une option pour utiliser les expressions rationnelles et qui n'utilisent que les expressions rationnelles basiques, et donc forcément les caractères spécifiques aux ERb.\\ | ||
+ | Il s'agit de **''expr''** et **''vi''**.\\ | ||
+ | |||
+ | Elles utilisent bien sûr tous [[utilisateurs:hypathie:tutos:erb-et-ere-par-le-contexte-des-commandes?&#caracteres-communs-aux-erb-et-ere|les caractères communs aux ERb et ERe]], leur utilisation avec ces caractères apparaîtra en à côté de l'utilisation des caractères spécifiques aux ERb qui permettent de décrire des motifs plus complexes. | ||
+ | |||
+ | Pour les commandes "à option" qui utilisent tous les caractères spécifiques aux ERb, mais qui peuvent aussi utiliser ces mêmes caractères((parenthèses, accolades, +, ? et |)) sans antislash avec les ERe, je présenterai rapidement leur utilisation des ERb dans le chapitre sur les caractères spécifiques aux ERe. | ||
+ | </note> | ||
+ | |||
+ | ====Caractères spécifiques aux ERb ==== | ||
+ | |||
+ | Toutes les commandes utilisant les expressions rationnelles basiques utilisent les caractères énumérés ci-dessous.\\ | ||
+ | |||
+ | La commande **''expr''** n'utilise que ceux-ci.\\ | ||
+ | |||
+ | ^expressions ^Modèles reconnus ^ | ||
+ | |**''<nowiki>\{m\}</nowiki>''** | m fois le caractère précédent | | ||
+ | |**''<nowiki>\{m,\} </nowiki>''** | au moins m fois le caractère précédent | | ||
+ | |**''<nowiki>\{m,n\} </nowiki>''** | entre m et n fois le caractère précédent | | ||
+ | |**''<nowiki>\(ERb\)</nowiki>''** | mémorisation d'une ERb | | ||
+ | |**''<nowiki>\1, \2, ...</nowiki>''** | Rappel de mémorisation | | ||
+ | |||
+ | Les commandes **''grep''** (ou **''grep -G''**) ; **''find -regextype "posix-basic" ''** ; | ||
+ | **''locate --regexp''** ; **''sed''**; **''vi''** utilisent en plus ces caractères ci-dessous : | ||
+ | |||
+ | ^ ^ ^ | ||
+ | |**''<nowiki>\?</nowiki>''** | zéro ou une fois l'élément précédent | | ||
+ | |**''<nowiki>\+</nowiki>''** | une ou plusieurs fois l'élément précédent | | ||
+ | |**''<nowiki>\|</nowiki>''** | alternative | | ||
+ | |||
+ | -> Le caractère **''\''** donne une signification spéciale aux parenthèses et accolades, ?, +, | au lieu de les rendre littérales.\\ | ||
+ | Mais il permet de rendre littéraux les autres caractères des ERb, par exemple ''\.'' permet de sélectionner un point. | ||
+ | |||
+ | |||
+ | ====Caractères spécifiques aux ERe ==== | ||
+ | |||
+ | Les caractères spécifiques aux ERe sont utilisables avec les commandes : | ||
+ | |||
+ | **''grep -E''** ; (ou **''egrep''**) ; **''find -regextype "posix-extended" ''** ; | ||
+ | **''locate --regex''** ; **''sed -r''** et **''awk''**((alias gawk)).\\ | ||
+ | |||
+ | Bien évidemment tous [[utilisateurs:hypathie:tutos:erb-et-ere-par-le-contexte-des-commandes?&#caracteres-communs-aux-erb-et-ere|les caractères communs aux ERb et ERe]] sont utilisables avec ces commandes et ces options. | ||
+ | |||
+ | ^expressions ^ Modèles reconnus ^ | ||
+ | |**''?''** | zéro ou une fois le caractère ou le regroupement précédent | | ||
+ | |**''+''** |une à n fois le caractère ou regroupement précédent | | ||
+ | |**''<nowiki>{m}</nowiki>''** |m fois le caractère précédent | | ||
+ | |**''<nowiki>{m,}</nowiki>''** | m fois le caractère précédent | | ||
+ | |**''<nowiki>{m,n}</nowiki>''** | entre m et n fois le caractère précédent | | ||
+ | |**''<nowiki>( er1)</nowiki>''** | regroupement | | ||
+ | |**''<nowiki>er1|er2|er3</nowiki>''** | alternative | | ||
+ | |**''<nowiki>(er)+</nowiki>''**|Une ou plus de une chaîne(s) consécutive(s) validée(s) "er".| | ||
+ | |**''<nowiki>(er)*</nowiki>''**|zéro ou plus de zéro chaîne(s) consécutive(s) validée(s) par "er" | | ||
+ | |**''<nowiki>(er)?</nowiki>''**|une chaîne bulle ou toute chaîne validée par "er".| | ||
+ | |**''<nowiki>[c1c2...]</nowiki>''**|Tout caractère expressément listé entre les crochets.| | ||
+ | |**''<nowiki>[^c1c2...]</nowiki>''**|Tout caractère excepté ceux qui sont expressément listés entre les crochets.| | ||
+ | |**''<nowiki>[c1-c2]</nowiki>''**|Tout caractère appartenant à l’intervalle c1 c2, bornes comprises.| | ||
+ | |**''<nowiki>er1|er2</nowiki>''**|Toute chaîne de caractères validée soit par er1 soit par er2.| | ||
+ | |**''<nowiki>(er)(er)</nowiki>''**|Toute chaîne validée par l’expression er, chaîne vide exclue.| | ||
+ | |**''<nowiki>(er1)(er2)</nowiki>''**|Toute chaîne de caractères de type AB, dans laquelle l’expression régulière er1 valide A et l’expression régulière er2 valide B.\\ Avec awk uniquement| | ||
+ | |||
+ | =====Les commandes expr et vi et les caractères spécifiques aux ERb ===== | ||
+ | |||
+ | ====La commande expr n'utilise que ERb==== | ||
+ | __ | ||
+ | **Rappel :**__\\ | ||
+ | |||
+ | * Soit le fichier "<nowiki>liste4-spec</nowiki>" : | ||
+ | |||
+ | <code user>cat liste4-spec</code> | ||
+ | <code> | ||
+ | gdd:a:aa:aaa:aaaa:aaaaaa:aaaaaaaa | ||
+ | T5c Kc5 T5 c E2* abcd 7 9Abcd | ||
+ | 7 1AAA.AAA.bcdef aBcd6a 123* | ||
+ | abc2356.99 | ||
+ | 73000|Savoie | ||
+ | 123456 | ||
+ | 1234567 | ||
+ | index-tel|04|Rhône-Alpe | ||
+ | -15 +36 5687 {15} exemple{36} | ||
+ | il y a un truc et un truc et encore un truc et une chose | ||
+ | choses et trucs ne font pas bon ménage | ||
+ | 123.3456.abc | ||
+ | trucschosetruc | ||
+ | tructructrucs | ||
+ | chosechosechose | ||
+ | </code> | ||
+ | |||
+ | * Syntaxe : | ||
+ | |||
+ | expr chaîne-de-caractères : expression-rationnelle-basique | ||
+ | |||
+ | <note tip> | ||
+ | |||
+ | * **''expr''** utilise tous les [[utilisateurs:hypathie:tutos:erb-et-ere-par-le-contexte-des-commandes?&#caracteres-communs-aux-erb-et-ere|caractères communs aux ERb et ERe]] | ||
+ | * mais elle n'utilise que les caractères spécifiques aux ERb ci-dessous : | ||
+ | |||
+ | |**''<nowiki>\{m\}</nowiki>''** | m fois le caractère précédent | | ||
+ | |**''<nowiki>\{m,\} </nowiki>''** | au moins m fois le caractère précédent | | ||
+ | |**''<nowiki>\{m,n\} </nowiki>''** | entre m et n fois le caractère précédent | | ||
+ | |**''<nowiki>\(ERb\)</nowiki>''** | mémorisation d'une ERb | | ||
+ | |**''<nowiki>\1, \2, ...</nowiki>''** | Rappel de mémorisation | | ||
+ | |||
+ | </note> | ||
+ | |||
+ | ===Exemple === | ||
+ | |||
+ | * sous-chaîne et quantificateur accolades : | ||
+ | |||
+ | <code user>var=123.456.</code> | ||
+ | <code user>expr "$var" : '\([0-9]\{3\}.\)\{2\}'</code> | ||
+ | <code> | ||
+ | 456. | ||
+ | </code> | ||
+ | |||
+ | > expr affiche la sous-chaîne "456." | ||
+ | |||
+ | |||
+ | *Le caractère **''*''** est gourmand : | ||
+ | <code user>var="hypathie|00 rue Debian-facile|01011|ici"</code> | ||
+ | <code user>expr "$var" : '\(.*\)|'</code> | ||
+ | <code> | ||
+ | hypathie|00 rue Debian-facile|01011 | ||
+ | </code> | ||
+ | |||
+ | |||
+ | ====L'éditeur de texte vi et les caractères spécifiques aux ERb==== | ||
+ | |||
+ | <note tip> | ||
+ | **'' vi''** (vim) utilise tous [[utilisateurs:hypathie:tutos:erb-et-ere-par-le-contexte-des-commandes?&#caracteres-communs-aux-erb-et-ere|les caractères communs aux ERb et ERe]], tous [[utilisateurs:hypathie:tutos:erb-et-ere-par-le-contexte-des-commandes?&#caracteres-specifiques-aux-erb|les caractères spécifiques aux ERb]], y compris ceux ci-dessous (comme "les commandes à option" permettant de choisir le type //ER//): | ||
+ | |||
+ | |**''<nowiki>\?</nowiki>''** | zéro ou une fois l'élément précédent | | ||
+ | |**''<nowiki>\+</nowiki>''** | une ou plusieurs fois l'élément précédent | | ||
+ | |**''<nowiki>\|</nowiki>''** | alternative | | ||
+ | |||
+ | </note> | ||
+ | |||
+ | * Reprise du fichier "liste4-vim" : | ||
+ | <code user>vi liste4-vim</code> | ||
+ | ou | ||
+ | <code user>vim liste4-vim</code> | ||
+ | |||
+ | {{http://pix.toile-libre.org/upload/original/1407922486.png?400}} | ||
+ | |||
+ | |||
+ | ===utilisation de \| === | ||
+ | <code>/c\|t</code> | ||
+ | |||
+ | ->Une image vaut mieux qu'une description :\\ | ||
+ | {{http://pix.toile-libre.org/upload/original/1407937898.png?400}} | ||
+ | |||
+ | ===Utilisation de \? === | ||
+ | <code>/\.[0-9]\?</code> | ||
+ | |||
+ | -> Là aussi :\\ | ||
+ | {{http://pix.toile-libre.org/upload/original/1407857157.png?400}} | ||
+ | |||
+ | ===Utilisation de \+ === | ||
+ | <code>/[A-Z]\+</code> | ||
+ | -> Là aussi :\\ | ||
+ | {{http://pix.toile-libre.org/upload/original/1407856299.png?400}} | ||
<note> | <note> | ||
Ligne 867: | Ligne 1050: | ||
</note> | </note> | ||
- | ===== grep, sed, find, locate et les caractères spécifiques aux ERb ===== | + | =====Caractères spécifiques aux ERb ou caractères spécifiques aux ERe ===== |
+ | grep, sed, find, locate | ||
+ | ===Préparation=== | ||
- | Les commandes grep et sed sans option, et les commandes locate et locate avec option utilisent les caractères spécifiques aux ERb.\\ Puisqu'il est plus pratique de les utiliser avec les ERe qui sont plus lisibles, je n'en donnerai que quelques exemples. | + | * Soit le fichier "<nowiki>liste4-spec</nowiki>": |
+ | <code> | ||
+ | gdd:a:aa:aaa:aaaa:aaaaaa:aaaaaaaa | ||
+ | T5c Kc5 T5 c E2* abcd 7 9Abcd | ||
+ | 7 1AAA.AAA.bcdef aBcd6a 123* | ||
+ | abc2356.99 | ||
+ | 73000|Savoie | ||
+ | 123456 | ||
+ | 1234567 | ||
+ | index-tel|04|Rhône-Alpe | ||
+ | -15 +36 5687 {15} exemple{36} | ||
+ | il y a un truc et un truc et encore un truc et une chose | ||
+ | choses et trucs ne font pas bon ménage | ||
+ | 123.3456.abc | ||
+ | trucschosetruc | ||
+ | tructructrucs | ||
+ | chosechosechose | ||
+ | </code> | ||
- | ==== grep ==== | + | ==== grep -E (egrep) et les caractères spécifiques==== |
+ | Avec l'option -E grep utilisent les expressions rationnelles étendues.\\ | ||
+ | La commande egrep et un équivalent. | ||
- | * les accolades avec antislash (le caractère précédent un nombre exact de fois) : | + | <note tip> |
+ | Pour les caractères : **'' <nowiki>[</nowiki> <nowiki>]</nowiki> <nowiki>{</nowiki> <nowiki>}</nowiki> ? + |''**\\ | ||
+ | |||
+ | il possible avec grep d'utiliser aussi les caractères spécifiques aux ERb.\\ | ||
+ | Par exemple :\\ | ||
<code user>grep "1A\{3\}\.A\{3\}\..*" liste4-spec</code> | <code user>grep "1A\{3\}\.A\{3\}\..*" liste4-spec</code> | ||
+ | ou | ||
+ | |||
+ | <code user>grep -G "1A\{3\}\.A\{3\}\..*" liste4-spec</code> | ||
+ | |||
<code> | <code> | ||
7 1AAA.AAA.bcdef aBcd6a 123* | 7 1AAA.AAA.bcdef aBcd6a 123* | ||
</code> | </code> | ||
- | * le caractère précédent à partir de "n" à "m" fois : | + | -> mais ne pas oublier l'antislash devant les accolades !\\ |
- | <code user>grep "[0-9]\{1,3\}" liste4-spec</code> | + | </note> |
+ | |||
+ | ===Parenthèses === | ||
+ | |||
+ | <code user>grep -E "( [0-9]{4})" liste4-spec</code> | ||
+ | <code> | ||
+ | -15 +36 5687 {15} exemple{36} | ||
+ | </code> | ||
+ | |||
+ | ===le caractère précédent de "n" à "m" fois :=== | ||
+ | <code user>grep -E "[0-9]{1,3}" liste4-spec</code> | ||
<code> | <code> | ||
T5c Kc5 T5 c E2* abcd 7 9Abcd | T5c Kc5 T5 c E2* abcd 7 9Abcd | ||
Ligne 886: | Ligne 1108: | ||
abc2356.99 | abc2356.99 | ||
73000|Savoie | 73000|Savoie | ||
+ | 123456 | ||
+ | 1234567 | ||
index-tel|04|Rhône-Alpe | index-tel|04|Rhône-Alpe | ||
-15 +36 5687 {15} exemple{36} | -15 +36 5687 {15} exemple{36} | ||
Ligne 891: | Ligne 1115: | ||
</code> | </code> | ||
- | * le caractère précédent au moins "n" fois : | + | ===Les accolades (le caractère précédent un nombre exact de fois) : === |
- | <code user>grep "[0-9]\{4,\}" liste4-spec</code> | + | <code user>grep -E "1A{3}\.A{3}\..*" liste4-spec</code> |
+ | <code> | ||
+ | 7 1AAA.AAA.bcdef aBcd6a 123* | ||
+ | </code> | ||
+ | |||
+ | ===Le caractère précédent au moins "n" fois :=== | ||
+ | <code user>grep -E "[0-9]{4,}" liste4-spec</code> | ||
<code> | <code> | ||
abc2356.99 | abc2356.99 | ||
Ligne 900: | Ligne 1130: | ||
</code> | </code> | ||
- | * parenthèses avec antislash et mémorisation : | + | ===Le caractère + et parenthèses === |
- | <code user>grep "\( [0-9]\{4\}\)" liste4-spec</code> | + | <code user>grep -E "(1A{3}\.)+.*" liste4-spec</code> |
<code> | <code> | ||
- | -15 +36 5687 {15} exemple{36} | + | 7 1AAA.AAA.bcdef aBcd6a 123* |
</code> | </code> | ||
+ | ===Le caractère ? === | ||
+ | <code user>grep -E "trucs?" liste4-spec</code> | ||
+ | <code> | ||
+ | il y a un truc et un truc et encore un truc et une chose | ||
+ | choses et trucs ne font pas bon ménage | ||
+ | trucschosetruc | ||
+ | tructructrucs | ||
+ | </code> | ||
- | ====sed sans option utilise les ERb ==== | + | >On cherche les lignes qui comporte "truc" au singulier ou au pluriel. |
- | La syntaxe est la même que pour les caractères communs aux ERe. | + | |
+ | ===Le caractère d'alternative | === | ||
+ | <code user>grep -E "(truc|chose)" liste4-spec</code> | ||
+ | <code> | ||
+ | il y a un truc et un truc et encore un truc et une chose | ||
+ | choses et trucs ne font pas bon ménage | ||
+ | trucschosetruc | ||
+ | tructructrucs | ||
+ | chosechosechose | ||
+ | </code> | ||
+ | |||
+ | ====sed et les caractères spécifiques aux ERe ==== | ||
+ | __**Rappel**__\\ | ||
+ | |||
+ | Par défaut sed utilise les ERb.\\ | ||
+ | Pour s'éviter de mettre un antislash devant parenthèse, accolade, ?, +, |,\\ il faut utiliser **l'option -r**.\\ | ||
+ | |||
+ | Sans option et avec l'antislash le signification de ces caractères sont les mêmes que lors de leur utilisation avec l'option -r. | ||
+ | |||
+ | ===Exemples === | ||
* Substituer "Hello" par "OK" : | * Substituer "Hello" par "OK" : | ||
- | <code user>echo "coucou Hello Yep" | sed 's/[A-Z]\{1\}[a-z]\{4\}/OK/g'</code> | + | <code user>echo "coucou Hello Yep" | sed -r 's/[A-Z]{1}[a-z]{4}/OK/g'</code> |
<code> | <code> | ||
coucou OK Yep | coucou OK Yep | ||
Ligne 920: | Ligne 1177: | ||
* Substituer "a" et "aa" par "OK" : | * Substituer "a" et "aa" par "OK" : | ||
- | <code user>echo "a aa aaa aaaa aaaaaa aaaaaaaa" | sed -e 's/\(a\{1\} \)/OK/'\ | + | <code user>echo "a aa aaa aaaa aaaaaa aaaaaaaa" | sed -re 's/(a{1} )/OK/'\ |
- | -e 's/\(a\{2\} \)/OK/'</code> | + | -e 's/(a{2} )/OK/'</code> |
<code> | <code> | ||
OKOKaaa aaaa aaaaaa aaaaaaaa | OKOKaaa aaaa aaaaaa aaaaaaaa | ||
Ligne 927: | Ligne 1184: | ||
<note tip> | <note tip> | ||
- | La lisibilité devient vite difficile pour sélectionner des sous-chaîne avec les ERb.\\ | + | L'antislash de la commande précédente permet de couper les longues commandes.\\ |
- | Mieux vaut donc passer aux ERe, quand les commandes peuvent les utiliser.\\ | + | Ne pas confondre avec l'antislash utiliser pour les ERb et les caractères spécifiques, parenthèses, accolades, etc. |
- | C'est justement le cas de la commande sed, locate et find. Je ne m'y attarderai donc pas. | + | |
</note> | </note> | ||
- | ====locate utilise les ERb avec l'option --regexp ==== | + | ====find et les caractères spécifiques==== |
- | <code man locate> | + | __**Rappel **__\\ |
- | --regexp REGEXP | + | |
- | Search for a basic regexp REGEXP. No PATTERNs are allowed if | + | Pour utiliser les ERe, il faut utiliser l'option **''-regextype "posix-extended" ''**.\\ |
- | this option is used, but this option can be specified multiple | + | |
- | times. | + | Pour les caractères **'' <nowiki>[</nowiki> <nowiki>]</nowiki> <nowiki>{</nowiki> <nowiki>}</nowiki> ? + ''**, on peut là aussi choisir les ERb en mettant un antislash devant.\\ |
+ | Pour ce faire, il faut alors utiliser l'option **''-regextype "posix-basic" ''**. | ||
+ | |||
+ | __**Préparation**__\\ | ||
+ | |||
+ | Dans le répertoire de l'utilisateur soit le répertoire "ERetCMD/" contenant : | ||
+ | |||
+ | <code> | ||
+ | Dossier img-perso-2.jpg liste3-erb-ere sort1.txt | ||
+ | essai.grep2~ liste liste4-spec sort2.txt | ||
+ | image linux - 01.jpg liste1 liste4-vim sort3.txt | ||
+ | image linux - 02.jpg liste1-nom liste-class vim2.png | ||
+ | image linux - 03.jpg liste2 server-0.xkb vim.png | ||
+ | img-perso-1.jpg liste2-nom smolski-exo-sed.txt xxx-sort.txt | ||
</code> | </code> | ||
- | ===Syntaxe === | ||
+ | ===Exemples === | ||
+ | * accolades (depuis le répertoire parent "ERetCMD/" des fichiers recherchés : | ||
+ | <code user>find -regextype "posix-basic" -regex ".*/[a-z]\{,3\}-.*\.jpg$"</code> | ||
<code> | <code> | ||
- | locate --regexp 'ERb' | + | ./img-perso-2.jpg |
+ | ./img-perso-1.jpg | ||
</code> | </code> | ||
- | === Préparation=== | + | ou |
- | Dans le répertoire de l'utilisateur et dans le dosssier "ERetCMD/" : | + | |
- | * Création de trois fichiers : "image linux - 01.jpg", "image linux - 02.jpg" et "image linux - 03.jpg" : | + | <code user>find -regextype "posix-extended" -regex ".*[a-z]{,3}-.*\.jpg$"</code> |
+ | <code> | ||
+ | ./img-perso-2.jpg | ||
+ | ./img-perso-1.jpg | ||
+ | </code> | ||
- | <code user> | + | * caractère ? : |
- | touch image\ linux\ -\ 01.jpg image\ linux\ -\ 02.jpg image\ linux\ -\ 03.jpg | + | <code user>find -regextype "posix-basic" -regex ".*/liste.\?"</code> |
+ | <code> | ||
+ | ./ERetCMD/liste1 | ||
+ | ./ERetCMD/liste | ||
+ | ./ERetCMD/liste2 | ||
</code> | </code> | ||
- | * Visualisation : | + | * le caractère + (depuis le répertoire parent "ERetCMD/" des fichiers) : |
- | <code user>ls</code> | + | <code user>find -regextype "posix-extended" -regex ".*liste.+"</code> |
<code> | <code> | ||
- | Dossier img-perso-1.jpg liste3-erb-ere smolski-exo-sed.txt | + | ./liste2-nom |
- | essai.grep2~ img-perso-2.jpg liste4-spec sort1.txt | + | ./liste1-nom |
- | image linux - 01.jpg liste1-nom liste4-spec~ sort2.txt | + | ./liste3-erb-ere |
- | image linux - 02.jpg liste1-nom~ liste4-vim sort3.txt | + | ./liste4-vim |
- | image linux - 03.jpg liste2-nom server-0.xkb xxx-sort.txt | + | ./liste1 |
+ | ./liste4-spec | ||
+ | ./liste2 | ||
+ | ./liste-class | ||
</code> | </code> | ||
- | * Mise à jour de la base de donnée : | + | ====locate et les caractères spécifiques==== |
+ | __**Rappel**__\\ | ||
+ | |||
+ | Pour utiliser les ERe, il faut utiliser l'option **''--regex''**.\\ | ||
+ | De même que précédemment, on peut choisir l'option **''--regexp''** pour utiliser les caractères spécifiques aux ERb qui nécessitent **''\''**. | ||
+ | |||
+ | Soit encore le répertoire "ERetCMD/" contenant les mêmes fichiers (voir find).\\ | ||
+ | |||
+ | Mise à jour de la base de donnée, si besoin : | ||
<code root> | <code root> | ||
updatedb | updatedb | ||
</code> | </code> | ||
- | ===Exemple === | + | ===Exemples === |
- | <code user>locate --regexp '.*\([a-z]\{1,\} \)\{2\}.*\.jpg$'</code> | + | * parenthèses et accolades (depuis n'importe où dans l'arborescence du système de fichiers) : |
+ | |||
+ | <code user>locate --regexp '\([a-z]\{1,\} \)\{2\}.*\.jpg$'</code> | ||
<code> | <code> | ||
/home/Téléchargements/Les utilitaires awk, nawk et gawk - Tutoriel_fichiers/logo.jpg | /home/Téléchargements/Les utilitaires awk, nawk et gawk - Tutoriel_fichiers/logo.jpg | ||
Ligne 978: | Ligne 1270: | ||
</code> | </code> | ||
+ | ou | ||
- | + | <code user>locate --regex '([a-z]{1,} ){2}.*\.jpg$'</code> | |
- | ====find utilise les ERb avec l'option -regextype "posix-basic" ==== | + | <code> |
- | <code man find> | + | /home/Téléchargements/Les utilitaires awk, nawk et gawk - Tutoriel_fichiers/logo.jpg |
- | -regextype type | + | /home/hypathie/ERetCMD/image linux - 01.jpg |
- | Définir la syntaxe des expressions rationnelles des tests -regex | + | /home/hypathie/ERetCMD/image linux - 02.jpg |
- | et -iregex qui seront indiqués plus loin sur la ligne de com‐ | + | /home/hypathie/ERetCMD/image linux - 03.jpg |
- | mande. Les types actuellement implémentés sont emacs (type par | + | |
- | défaut), posix-awk, posix-basic, posix-egrep et posix-extended. | + | |
</code> | </code> | ||
- | ===Syntaxe === | + | * caractère ? : |
+ | <code user>locate --regex '/liste.?'</code> | ||
<code> | <code> | ||
- | find -regextype "posix-basic" -regex "ERb" | + | /home/hypathie/Documents/PYTHON/python2/chap06/liste_et_branch.py |
+ | /home/hypathie/Documents/PYTHON/python3/chap06/liste_et_branch.py | ||
+ | /home/hypathie/ERetCMD/liste | ||
+ | /home/hypathie/ERetCMD/liste-class | ||
+ | /home/hypathie/ERetCMD/liste1 | ||
+ | /home/hypathie/ERetCMD/liste1-nom | ||
+ | /home/hypathie/ERetCMD/liste2 | ||
+ | /home/hypathie/ERetCMD/liste2-nom | ||
+ | /home/hypathie/ERetCMD/liste3-erb-ere | ||
+ | /home/hypathie/ERetCMD/liste4-spec | ||
+ | /home/hypathie/ERetCMD/liste4-vim | ||
+ | /usr/share/man/man2/listen.2.gz | ||
</code> | </code> | ||
- | ===Préparation=== | + | >Le fichier "liste" (sans extension) apparaît. |
- | Dans le répertoire de l'utilisateur et dans le dosssier "ERetCMD/" | + | |
- | * Création de deux fichiers, "img-perso-1.jpg" et "img-perso-2.jpg" : | + | * caractère + : |
- | <code user> | + | <code user>locate --regex '/liste.+'</code> |
- | touch img-perso-1.jpg img-perso-2.jpg | + | <code> |
+ | /home/hypathie/Documents/PYTHON/python2/chap06/liste_et_branch.py | ||
+ | /home/hypathie/Documents/PYTHON/python3/chap06/liste_et_branch.py | ||
+ | /home/hypathie/ERetCMD/liste-class | ||
+ | /home/hypathie/ERetCMD/liste1 | ||
+ | /home/hypathie/ERetCMD/liste1-nom | ||
+ | /home/hypathie/ERetCMD/liste2 | ||
+ | /home/hypathie/ERetCMD/liste2-nom | ||
+ | /home/hypathie/ERetCMD/liste3-erb-ere | ||
+ | /home/hypathie/ERetCMD/liste4-spec | ||
+ | /home/hypathie/ERetCMD/liste4-vim | ||
+ | /usr/share/man/man2/listen.2.gz | ||
</code> | </code> | ||
- | ===exemples === | ||
- | <code user>find -regextype "posix-basic" -regex ".*/[a-z]\{,3\}-.*\.jpg$"</code> | + | >Le fichier "liste" (sans extension) n'apparaît pas. |
- | <code> | + | |
- | ./img-perso-2.jpg | + | |
- | ./img-perso-1.jpg | + | |
- | </code> | + | |
=====Les classes ===== | =====Les classes ===== | ||
Ligne 1031: | Ligne 1337: | ||
|''<nowiki>[[:xdigit:]]</nowiki>'' | Chiffres hexadécimaux [0-9 a-f A-F] | | |''<nowiki>[[:xdigit:]]</nowiki>'' | Chiffres hexadécimaux [0-9 a-f A-F] | | ||
- | ====grep et les classes==== | + | |
- | La commande grep utilise les classes comme ERb et comme ERe, c'est-à-dire sans l'option -E ou avec l'option -E | + | |
+ | ====grep, grep -E et les classes==== | ||
+ | La commande grep utilise les classes soit comme ERb et soit comme ERe, c'est-à-dire sans l'option -E ou avec l'option -E | ||
===Préparation === | ===Préparation === | ||
* soit le fichier " | * soit le fichier " | ||
Ligne 1103: | Ligne 1411: | ||
>Dans l'exemple ci-dessus, avec les ERe, on pourrait remplacer ''[\. ]'' par ''(\.| )'' | >Dans l'exemple ci-dessus, avec les ERe, on pourrait remplacer ''[\. ]'' par ''(\.| )'' | ||
- | ====locate et les classes ERb ou ERe==== | + | |
+ | ====locate et les classes, ERb ou ERe==== | ||
* Visualisation du répertoire ~/ERetCMD/ : | * Visualisation du répertoire ~/ERetCMD/ : | ||
<code user>ls</code> | <code user>ls</code> | ||
Ligne 1137: | Ligne 1446: | ||
- | ====find et les classes ERb ou ERe ==== | + | ====find et les classes, ERb ou ERe ==== |
===Les classes et ERb === | ===Les classes et ERb === | ||
Ligne 1157: | Ligne 1466: | ||
</code> | </code> | ||
- | ===Pour sed les classes relèvent des ERe=== | + | ===Pour sed les classes en tant que ERe=== |
<note tip> | <note tip> | ||
- | Avec sed il faut toujours l'option -r pour utiliser les classes. | + | Rappel :\\ |
+ | sed utilise les ERb sans option et les ERe avec l'option -r, mais pour utiliser les classes, il faut utiliser l'option -r. | ||
</note> | </note> | ||
+ | |||
*Exemple 1 : | *Exemple 1 : | ||
Ligne 1222: | Ligne 1532: | ||
</code> | </code> | ||
- | ====vi (vim) et les classes ==== | + | ====vi (vim) utilise les classes en tant que ERb==== |
===Préparation === | ===Préparation === | ||
<code user>vim liste4-vim</code> | <code user>vim liste4-vim</code> | ||
Ligne 1239: | Ligne 1549: | ||
chosechosechose | chosechosechose | ||
</code> | </code> | ||
- | |||
===Exemples === | ===Exemples === | ||
* Recherche : | * Recherche : | ||
- | <code>/[[:alnum:]]\{7\}\.[[:digit:]]\{2\} </code> | + | <code>/[[:alnum:]]\{7\}{[[:digit:]]\{2\}} </code> |
- | -> sélectionne entièrement la ligne **''abc2356.99''** | + | -> sélectionne entièrement la chaîne **''exemple{36}''** |
- | * Substitution : | + | * Substitution <nowiki>[[:graph:]]</nowiki>: |
- | <code>:3,4s/[[:graph:]]/x/g</code> | + | <code>:6,10s/[[:graph:]]/x/g</code> |
- | -> les ligne 3 et 4 ne présentent plus que des "x", tous les caractères susceptibles d'être concernés par la //ER// sont surlignés, c'est-à-dire tous le texte sauf les espaces. | + | > Le caractère "ô" n'est pas concerné du fait de la touche morte. |
- | -> Information sur les substitutions : ''22 substitutions, sur 2 lignes'' | + | {{http://pix.toile-libre.org/upload/original/1407925315.png?400}} |
+ | * Substitution <nowiki>[[:print:]]</nowiki> : | ||
+ | <code>:6,10s/[[:print:]]/x/g</code> | ||
+ | {{http://pix.toile-libre.org/upload/original/1407925697.png?400}} | ||
- | ======Les expressions rationnelles étendues====== | + | ====awk utilise les ERe et les classes sans option==== |
- | ====Caractères des ERe ==== | + | <code user>cat liste2-nom</code> |
+ | <code> | ||
+ | Constance 20-03-1998 | ||
+ | Rebecca 09-03-1999 | ||
+ | Natanaël 01-08-2000 | ||
+ | Alexis 21-01-2002 | ||
+ | Hélène-Fleur 06-03-2005 | ||
+ | Samuel 27-08-2008 | ||
+ | </code> | ||
- | ^expressions ^ Modèles reconnus ^ | + | * Exemple 1, sélection de ligne avec ER comme condition : |
- | |**''?''** | zéro ou une fois le caractère ou le regroupement précédent | | + | |
- | |**''+''** |une à n fois le caractère ou regroupement précédent | | + | |
- | |**''<nowiki>{m}</nowiki>''** |m fois le caractère précédent | | + | |
- | |**''<nowiki>{m,}</nowiki>''** | m fois le caractère précédent | | + | |
- | |**''<nowiki>{m,n}</nowiki>''** | entre m et n fois le caractère précédent | | + | |
- | |**''<nowiki>( er1)</nowiki>''** | regroupement | | + | |
- | |**''<nowiki>er1|er2|er3</nowiki>''** | alternative | | + | |
- | |**''<nowiki>(er)+</nowiki>''**|Une ou plus de une chaîne(s) consécutive(s) validée(s) "er".| | + | |
- | |**''<nowiki>(er)*</nowiki>''**|zéro ou plus de zéro chaîne(s) consécutive(s) validée(s) par "er" | | + | |
- | |**''<nowiki>(er)?</nowiki>''**|une chaîne bulle ou toute chaîne validée par "er".| | + | |
- | |**''<nowiki>[c1c2...]</nowiki>''**|Tout caractère expressément listé entre les crochets.| | + | |
- | |**''<nowiki>[^c1c2...]</nowiki>''**|Tout caractère excepté ceux qui sont expressément listés entre les crochets.| | + | |
- | |**''<nowiki>[c1-c2]</nowiki>''**|Tout caractère appartenant à l’intervalle c1 c2, bornes comprises.| | + | |
- | |**''<nowiki>er1|er2</nowiki>''**|Toute chaîne de caractères validée soit par er1 soit par er2.| | + | |
- | |**''<nowiki>(er)(er)</nowiki>''**|Toute chaîne validée par l’expression er, chaîne vide exclue.| | + | |
- | |**''<nowiki>(er1)(er2)</nowiki>''**|Toute chaîne de caractères de type AB, dans laquelle l’expression régulière er1 valide A et l’expression régulière er2 valide B.\\ Avec awk uniquement| | + | |
- | Excepté **''<nowiki>(er1)(er2)</nowiki>''** : | + | <code user>awk '/S[[:lower:]]*/' liste2-nom</code> |
+ | <code> | ||
+ | Samuel 27-08-2008 | ||
+ | </code> | ||
- | === avec awk (sans option)=== | + | *Exemple 2, correspondance entre variable (champ n°2) et une ER : |
- | ===avec grep -E et egrep=== | + | <code user>awk '$2 ~ /([[:digit:]]{2}-){2}2005$/' liste2-nom</code> |
- | <code user>grep -E "1([A-Z]){2}.*" liste4-spec</code> | + | |
<code> | <code> | ||
- | 7 1AAA.AAA.bcdef aBcd6a 123* | + | Hélène-Fleur 06-03-2005 |
</code> | </code> | ||
- | ===avec sed -r=== | ||
- | ===avec locate === | + | ======Raccourcis et commandes====== |
- | <code man locate> | + | |
- | --regex | + | |
- | Interpret all PATTERNs as extended regexps. | + | |
- | </code> | + | |
- | * Syntaxe : | ||
- | <code> | ||
- | locate --regex 'ERe' | ||
- | </code> | ||
- | ===avec find === | + | Les raccourcis ne sont pas posix |
- | <code man find> | + | |
- | -regextype type | + | |
- | Définir la syntaxe des expressions rationnelles des tests -regex | + | |
- | et -iregex qui seront indiqués plus loin sur la ligne de com‐ | + | |
- | mande. Les types actuellement implémentés sont emacs (type par | + | |
- | défaut), posix-awk, posix-basic, posix-egrep et posix-extended. | + | |
- | </code> | + | |
- | * Syntaxe : | + | === __sed__ :=== |
- | <code> | + | |
- | find -regextype "posix-extended" -regex "ERe" | + | |
- | </code> | + | |
- | + | ||
- | ====Les raccourcis ne sont pas posix==== | + | |
- | + | ||
- | * __sed__ : | + | |
^Séquences ^Séquences ^ | ^Séquences ^Séquences ^ | ||
Ligne 1328: | Ligne 1611: | ||
|**''<nowiki>\b</nowiki>''** | Correspond à une chaîne vide (blanc) à l'extrémité d'un mot | | |**''<nowiki>\b</nowiki>''** | Correspond à une chaîne vide (blanc) à l'extrémité d'un mot | | ||
- | + | === __awk__ :=== | |
- | + | ||
- | + | ||
- | * __awk__ : | + | |
^Séquences ^Séquences ^ | ^Séquences ^Séquences ^ | ||
Ligne 1340: | Ligne 1620: | ||
|**''<nowiki>\c </nowiki>''** | tout caractère pris sous sa forme littérale\\ excepté **''<nowiki>\</nowiki>''** | | |**''<nowiki>\c </nowiki>''** | tout caractère pris sous sa forme littérale\\ excepté **''<nowiki>\</nowiki>''** | | ||
- | __Excepté **''<nowiki>(er1)(er2)</nowiki>''**__ : | ||
- | |||
- | * Tous sont utilisables avec grep -E et egrep | ||
- | * Tous sont utilisable avec awk | ||
- | * Certains posent problème avec sed -r | ||
- | |||
- | __Options nécessaires avec find et locate__ : | ||
- | |||
- | * find -regextype "posix-extended"\\ Les types actuellement implémentés sont emacs (type par défaut), posix-awk, posix-basic, posix-egrep et posix-extended. | ||
- | |||
- | *locate --regex : Interpréter tous les "PATTERNs" (modèles) comme des expressions rationnelles étendues. | ||