Vous n'êtes pas identifié(e).
L'icône rouge permet de télécharger chaque page du wiki visitée au format PDF et la grise au format ODT →
Ci-dessous, les différences entre deux révisions de la page.
Les deux révisions précédentes Révision précédente Prochaine révision | Révision précédente Prochaine révision Les deux révisions suivantes | ||
utilisateurs:hypathie:tutos:erb-et-ere-par-le-contexte-des-commandes [12/08/2014 15:38] Hypathie [Les expressions rationnelles sous le jour des commandes] |
utilisateurs:hypathie:tutos:erb-et-ere-par-le-contexte-des-commandes [13/08/2014 12:31] Hypathie [Les classes] |
||
---|---|---|---|
Ligne 3: | Ligne 3: | ||
* Objet : maîtriser les expressions rationnelles basiques et étendues ainsi que les classes POSIX | * Objet : maîtriser les expressions rationnelles basiques et étendues ainsi que les classes POSIX | ||
* Niveau requis : {{avisé}} | * Niveau requis : {{avisé}} | ||
- | * Commentaires : utiliser les expressions rationnelles basiques, étendues, les classes avec grep, grep -E, find, locate, expr, vi (vim), sed et awk. | + | * Commentaires : utiliser les expressions rationnelles basiques, étendues, les classes avec grep, grep -E, find, locate, expr, vi, sed et awk. |
**NOTA**\\ | **NOTA**\\ | ||
Ligne 26: | Ligne 26: | ||
* Enfin, les différents programmes susceptibles d'utiliser toutes les //ER// de la bibliothèque REGEX, vi, expr, grep, egrep, find, locate, sed, awk, etc., bien que pouvant tous utiliser la norme POSIX, __transforment le contexte d'utilisation de l'//ER// et par conséquent, l'utilisation d'une même //ER// n'a plus le même effet d'un programme à l'autre__.\\ C'est là un point crucial, rarement mis en avant et qu'il est pourtant nécessaire de soulever, pour des raisons pédagogiques, mais aussi pour des raisons philosophiques que je ne développerai pas.\\ Le fondement en est simplement la conviction que le dédain envers la diversité, tandis qu'un méta-langage est par définition l'unité cachée derrière tout genre de multiple, est une tentative qui s'ignore de ramener le méta-langage lui-même à une simple symbolisation du langage, et par conséquent, une tentative intéressée d'instrumentaliser la raison. | * Enfin, les différents programmes susceptibles d'utiliser toutes les //ER// de la bibliothèque REGEX, vi, expr, grep, egrep, find, locate, sed, awk, etc., bien que pouvant tous utiliser la norme POSIX, __transforment le contexte d'utilisation de l'//ER// et par conséquent, l'utilisation d'une même //ER// n'a plus le même effet d'un programme à l'autre__.\\ C'est là un point crucial, rarement mis en avant et qu'il est pourtant nécessaire de soulever, pour des raisons pédagogiques, mais aussi pour des raisons philosophiques que je ne développerai pas.\\ Le fondement en est simplement la conviction que le dédain envers la diversité, tandis qu'un méta-langage est par définition l'unité cachée derrière tout genre de multiple, est une tentative qui s'ignore de ramener le méta-langage lui-même à une simple symbolisation du langage, et par conséquent, une tentative intéressée d'instrumentaliser la raison. | ||
- | **Cette présentation montera comment utiliser des expressions rationnelles au moyen des commandes de recherches et d'édition de fichiers, et cela, en appréhendant seulement les expressions rationnelles POSIX de la bibliothèque REGEX.\\ | + | **Cette présentation des expressions rationnelles montera comment les utiliser au moyen des commandes de recherches et d'édition de fichiers, et cela, en appréhendant seulement les expressions rationnelles POSIX de la bibliothèque REGEX.\\ |
En bref, il s'agira de présenter les types de //ER// qui s'utilisent en ligne de commandes ou dans des scripts shell GNU/linux.** | En bref, il s'agira de présenter les types de //ER// qui s'utilisent en ligne de commandes ou dans des scripts shell GNU/linux.** | ||
Ligne 33: | Ligne 33: | ||
Il y en a trois : | Il y en a trois : | ||
- | * expression rationnelles basiques (ERb); | + | * expression rationnelle basique (ERb); appelées aussi "Basic Regular Expression" (BRE) |
- | * expression rationnelles étendues (ERe); | + | |
+ | * expression rationnelle étendue (ERe); appelées aussi "Extended Regular Expression" (ERE) | ||
* les classes POSIX (considérer soit comme ERb, soit comme ERe selon les programmes | * les classes POSIX (considérer soit comme ERb, soit comme ERe selon les programmes | ||
- | Les raccourcis (par exemples, retour à la ligne ''\n'', tabulation ''\t'') étant particuliers aux programmes, seront listés en complément mais ne seront pas exemplifiés. | + | Les raccourcis (par exemples, retour à la ligne ''\n'', tabulation ''\t'') étant particuliers aux programmes, seront listés en complément. |
- | ==== Panorama exhaustif des programmes GNU/Linux concernés par les ERE=== | + | ==== Panorama exhaustif des programmes GNU/Linux concernés par les expressions rationnelles=== |
* **expr** : **ERb**\\ pour la correspondance de chaîne de caractères avec une expression régulière. | * **expr** : **ERb**\\ pour la correspondance de chaîne de caractères avec une expression régulière. | ||
Ligne 45: | Ligne 47: | ||
* **find** : **ERb** en le précisant avec l'option **''-regextype "posix-basic"''** ou **ERe** en précisant avec l'option **''-regextype "posix-extended"''**\\ rechercher de fichier en fonction du motif spécifié par la //ER//. | * **find** : **ERb** en le précisant avec l'option **''-regextype "posix-basic"''** ou **ERe** en précisant avec l'option **''-regextype "posix-extended"''**\\ rechercher de fichier en fonction du motif spécifié par la //ER//. | ||
* **locate** : **ERb** avec l'option **''- -regexp''** ou **ERe** avec l'option **''- -regex''**\\ recherche de fichiers selon un motif dans la base de données. | * **locate** : **ERb** avec l'option **''- -regexp''** ou **ERe** avec l'option **''- -regex''**\\ recherche de fichiers selon un motif dans la base de données. | ||
- | * **vi** (**vim**) : **ERb**\\ recherche et substitution de chaîne de caractères. | + | * **vi** : **ERb**\\ recherche et substitution de chaîne de caractères. |
* **egrep** ou **grep -E** : **ERe**\\ Même usage que grep | * **egrep** ou **grep -E** : **ERe**\\ Même usage que grep | ||
* **sed** : **ERb**\\ par exemple, sélectionne, modifie les chaînes d'un fichier ou de l'affichage en se basant sur les colonnes. La //ER// permet de sélectionner quelle(s) colonne(s) est (sont) concernée(s). | * **sed** : **ERb**\\ par exemple, sélectionne, modifie les chaînes d'un fichier ou de l'affichage en se basant sur les colonnes. La //ER// permet de sélectionner quelle(s) colonne(s) est (sont) concernée(s). | ||
* **sed -r** : **ERe**\\ même usage que sed. | * **sed -r** : **ERe**\\ même usage que sed. | ||
- | * **awk** : **ERe**\\ sélectionne les colonnes, lignes, mots d'un fichier, et modifie l'affichage, le fichier, etc. en utilisant la //ER// comme condition de l'action qu'on choisit. | + | * **awk**((c'est-à-dire **gawk**\\ ''whereis awk''\\ awk: /usr/bin/awk\\ ''ls -l /usr/bin/awk''\\ lrwxrwxrwx 1 root root 21 juin 8 18:43 /usr/bin/awk -> /etc/alternatives/awk\\ ''ls -l /etc/alternatives/awk''\\ lrwxrwxrwx 1 root root 13 juil. 13 18:41 /etc/alternatives/awk -> /usr/bin/**gawk**)) : **ERe**\\ sélectionne les colonnes, lignes, mots d'un fichier, et modifie l'affichage, le fichier, etc. en utilisant la //ER// comme condition de l'action qu'on choisit. |
Concernant chacun de ces programmes, je n'entrerai ni dans les combinaisons possibles entre eux, ni n'approfondirai chacun d'eux en détail. Voir pour cela la documentation à leur sujet.\\ | Concernant chacun de ces programmes, je n'entrerai ni dans les combinaisons possibles entre eux, ni n'approfondirai chacun d'eux en détail. Voir pour cela la documentation à leur sujet.\\ | ||
Ligne 185: | Ligne 187: | ||
====Caractères communs aux ERb et ERe==== | ====Caractères communs aux ERb et ERe==== | ||
- | Certains caractères sont communs au ERb et ERe, pour ne pas avoir à les répéter, il est préférable de les regrouper. D'autant plus que les commandes qui permettent de se servir des ER en général, reconnaissent tous les caractères communs aux ERb et ERe, excepté pour les classes. | + | Certains caractères sont communs au ERb et ERe, pour ne pas avoir à les répéter, il est préférable de les regrouper. D'autant plus que les commandes qui permettent de se servir des expressions rationnelles, reconnaissent tous les caractères communs aux ERb et ERe, excepté pour les classes.\\ |
Ligne 209: | Ligne 211: | ||
====la commande grep et les caractères communs aux ERb et ERe==== | ====la commande grep et les caractères communs aux ERb et ERe==== | ||
- | Sans l'option -E, grep fonctionne avec les ERb. | + | <note tip> |
+ | Sans option ou avec l'option -G, grep utilise les expressions rationnelles basiques. | ||
+ | |||
+ | <code man grep> | ||
+ | -G, --basic-regexp | ||
+ | Interpréter le MOTIF comme une expression rationnelle simple | ||
+ | C'est le comportement par défaut. | ||
+ | |||
+ | </code> | ||
+ | |||
+ | Voir ci-dessous pour l'utilisation de grep (grep -G) avec [[utilisateurs:hypathie:tutos:erb-et-ere-par-le-contexte-des-commandes?&#grep-ou-grep-g-et-les-caracteres-specifiques-aux-erb|les caractères spécifiques aux ERb]]. | ||
+ | </note> | ||
* Soit le fichier "liste1-nom" : | * Soit le fichier "liste1-nom" : | ||
Ligne 328: | Ligne 341: | ||
====La commande find et les caractères communs aux ERb et ERe==== | ====La commande find et les caractères communs aux ERb et ERe==== | ||
+ | <code man find> | ||
+ | -regextype type | ||
+ | Définir la syntaxe des expressions rationnelles des tests -regex | ||
+ | et -iregex qui seront indiqués plus loin sur la ligne de com‐ | ||
+ | mande. Les types actuellement implémentés sont emacs (type par | ||
+ | défaut), posix-awk, posix-basic, posix-egrep et posix-extended. | ||
+ | |||
+ | </code> | ||
<note tip> | <note tip> | ||
- | Les types de //ER// actuellement implémentés sont emacs.\\ | + | Avec find il faut toujours une option pour utiliser une //ER//.\\ |
- | Pour utiliser les ERb il faut utiliser l'option -regextype posix-basic pour définir le type de ER qu'on souhaite utiliser.\\ | + | |
- | Mais aussi l'une des options prévenant find, qu'on va utiliser une ER, de même qu'on prévient qu'on cherche un motif en respectant la casse avec -name : | + | * Pour une expression rationnelle basique :\\ |
- | * ''-regex motif'' : Nom de fichier correspondant à l'expression rationnelle 'motif'.\\ Il s'agit d'une correspondance sur le chemin complet, pas d'une\\ recherche. Par exemple, pour mettre en correspondance un fichier\\ nommé « ./fubar3 », vous pouvez utiliser les expressions rationnelles « .*bar. » ou « .*b.*3 », mais pas « f.*r3 ».\\ | + | <code> |
+ | find -regextype "posix-basic" -regex "son-expression-rationnelle-basique" | ||
+ | </code> | ||
+ | |||
+ | * Pour une expression rationnelle étendue :\\ | ||
+ | <code> | ||
+ | find -regextype "posix-extended" -regex "son-expression-rationnelle-étendue" | ||
+ | </code> | ||
+ | |||
+ | * Il faut aussi prévenir find, qu'on va utiliser une ER avec :((de même qu'on prévient qu'on cherche un motif en respectant la casse avec ''-name'')) | ||
+ | * **''-regex ER''** | ||
+ | * **''-iregex motif''** : Semblable à -regex, pour ne pas tenir compte de la casse (ne pas différencier les majuscules et les minuscules). | ||
+ | |||
+ | * Il s'agit d'une correspondance sur __le chemin complet__.\\ Pour représenter un chemin absolu quelque soit-il, il faut ajouter en début d'expression **''.*''**. | ||
+ | |||
+ | Je ne donnerai ici quelques exemples d'utilisation des caractères communs aux ERb et ERe, en tant que caractères ERb, afin d'illustrer l'utilisation de find avec l'option ''-regextype "posix-basic''.\\ | ||
+ | |||
+ | Pour l'utilisation des caractères spécifiques aux ERb avec find, voir : [[utilisateurs:hypathie:tutos:erb-et-ere-par-le-contexte-des-commandes?&#find-et-les-caracteres-specifiques-aux-erb|find et les caractères spécifiques aux ERb]]\\ | ||
- | * ''-iregex motif'' : Semblable à -regex, mais sans différencier les majuscules et les\\ minuscules. | + | Pour l'illustration de find avec les ERe voir : |
</note> | </note> | ||
- | Je ne donnerai que quelques exemples, puisque tous les caractères de ERb sont utilisables. \\ Je m'attacherai surtout à la syntaxe de find pour ce faire. | ||
* Soit le __répertoire parent__ des fichiers listés ci-dessous : | * Soit le __répertoire parent__ des fichiers listés ci-dessous : | ||
Ligne 358: | Ligne 395: | ||
>Le premier groupe de ''.*'' décrit le chemin du ou des fichiers dont le nom correspond à une chaîne commençant par "li", suivi de plusieurs caractères (deuxième groupe ''.*''), puis d'un "m". | >Le premier groupe de ''.*'' décrit le chemin du ou des fichiers dont le nom correspond à une chaîne commençant par "li", suivi de plusieurs caractères (deuxième groupe ''.*''), puis d'un "m". | ||
- | >Attention la même commande lancée depuis le répertoire personnel de l'utilisateur par exemple et non depuis le répertoire parent des fichiers : | + | >La même commande lancée depuis un répertoire plus en amont dans la hiérarchie, par exemple, depuis le répertoire personnel de l'utilisateur,et non depuis le répertoire parent des fichiers : |
<code>find -regextype "posix-basic" -regex ".*/li.*m"</code> | <code>find -regextype "posix-basic" -regex ".*/li.*m"</code> | ||
Ligne 383: | Ligne 420: | ||
====La commande locate et les caractères communs aux ERb et ERe==== | ====La commande locate et les caractères communs aux ERb et ERe==== | ||
+ | |||
<note tip> | <note tip> | ||
- | Pour utiliser les ERb, il faut utiliser l'option : | + | Pour utiliser les //ER// avec locate, il faut dans tous les cas une option.\\ |
+ | Les caractères communs aux ERb et ERe, peuvent être utilisés avec l'une ou l'autre de ces options : | ||
- | <code>--regexp</code> | + | * __Pour utiliser les ERb, il faut utiliser l'option__ : |
- | Sinon, locate reconnaît le caractère ''*'' comme un métacaractère du shell.\\ | + | <code man locate> |
+ | --regexp REGEXP | ||
+ | Search for a basic regexp REGEXP. No PATTERNs are allowed if | ||
+ | this option is used, but this option can be specified multiple | ||
+ | times. | ||
+ | </code> | ||
- | Contrairement à find, il n'est pas nécessaire que la ER corresponde au chemin absolu d'un fichier.\\ | + | * __Pour utiliser ces mêmes caractères en tant que ERe il faut utiliser l'option__ : |
- | Mais la quantité de réponses peut être très élevée, si on a une idée du répertoire dans lequel se trouve le fichier recherché, il peut plus confortable de le préciser.\\ | + | <code man locate> |
+ | --regex | ||
+ | Interpret all PATTERNs as extended regexps | ||
+ | </code> | ||
+ | |||
+ | Sans l'une ou l'autre de ces options, locate reconnaît le caractère ''*'' comme un métacaractère du shell.\\ | ||
+ | |||
+ | => Cela a une conséquence par rapport aux caractères ERb qui ne sont pas communs aux ERe.\\ | ||
+ | Autrement dit, si on choisit d'utiliser les ERb, il faudra un antislash pour utiliser [[utilisateurs:hypathie:tutos:erb-et-ere-par-le-contexte-des-commandes?&#caracteres-specifiques-aux-erb|les caractères spécifiques aux ERb]] et ce sera inutile si on choisit les ERe. | ||
+ | |||
+ | Voir l'utilisation de [[utilisateurs:hypathie:tutos:erb-et-ere-par-le-contexte-des-commandes?&#locate-et-les-caracteres-specifiques-aux-erb|locate avec les caractères spécifiques aux ERb]]. | ||
+ | |||
+ | |||
+ | *Contrairement à find, __il n'est pas nécessaire que la ER corresponde au chemin absolu d'un fichier__.\\ | ||
+ | Mais la quantité de réponses peut être très élevée, et si l'on a une idée du répertoire dans lequel se trouve le fichier recherché, il peut plus confortable de le préciser.\\ | ||
On peut aussi filtrer le retour avec grep.\\ | On peut aussi filtrer le retour avec grep.\\ | ||
- | Néanmoins, l'utilisation des ERe règle ce problème. (Voir plus bas) | ||
- | Enfin, avec l'utilisation de locate, on n'aura guère l'occasion d'utiliser les caractères début (^) et fin de ligne ($).\\ | + | * Enfin, avec l'utilisation de locate, le caractère début (^) est inusité.\\ |
- | En effet, avec une commande qui cherche des noms de fichiers en fonction d'une chaîne contenu dans ce nom, on ne peut utiliser que '' '^/' '', c'est-à-dire, le début du chemin absolu, ce qui demande d'allonger inutilement l'expression régulière ! | + | |
+ | En effet, avec une commande qui recherche des noms de fichier, la seule possibilité serait **''^/''**. Or locate permet justement de ne pas avoir à donner le chemin absolu du fichier recherché. L'utiliser ne ferait qu'allonger inutilement l'expression régulière ! | ||
</note> | </note> | ||
* Étoile et point | * Étoile et point | ||
<code user>locate --regexp '/home.*[Tt]o.*'</code> | <code user>locate --regexp '/home.*[Tt]o.*'</code> | ||
- | >Donne un retour de plusieurs pages par exemple en cas d'une grande quantité de photo dans un des répertoires de l'utilisateur. | ||
+ | >Donne un retour de plusieurs pages. | ||
<code user>locate --regexp '/home.*[Tt]o.*' | grep "/Dossier/"</code> | <code user>locate --regexp '/home.*[Tt]o.*' | grep "/Dossier/"</code> | ||
Ligne 411: | Ligne 469: | ||
/home/hypathie/ERetCMD/Dossier/toto | /home/hypathie/ERetCMD/Dossier/toto | ||
/home/hypathie/ERetCMD/Dossier/toto. | /home/hypathie/ERetCMD/Dossier/toto. | ||
+ | </code> | ||
+ | |||
+ | * caractère fin de ligne $ : | ||
+ | <code user>locate --regexp '/home.*/Dossier/[Tt]o.*\.txt$'</code> | ||
+ | <code> | ||
+ | /home/hypathie/ERetCMD/Dossier/Toto.txt | ||
+ | /home/hypathie/ERetCMD/Dossier/Toto1.txt | ||
</code> | </code> | ||
Ligne 623: | Ligne 688: | ||
=====Caractères spécifiques aux ERb ===== | =====Caractères spécifiques aux ERb ===== | ||
+ | Toutes les commandes utilisant les expressions rationnelles basiques utilisent les caractères énumérés ci-dessous.\\ | ||
+ | |||
+ | La commande **''expr''** n'utilise que ceux-ci.\\ | ||
+ | |||
^expressions ^Modèles reconnus ^ | ^expressions ^Modèles reconnus ^ | ||
|**''<nowiki>\{m\}</nowiki>''** | m fois le caractère précédent | | |**''<nowiki>\{m\}</nowiki>''** | m fois le caractère précédent | | ||
Ligne 630: | Ligne 699: | ||
|**''<nowiki>\1, \2, ...</nowiki>''** | Rappel de mémorisation | | |**''<nowiki>\1, \2, ...</nowiki>''** | Rappel de mémorisation | | ||
- | -> Le caractère **''\''** donne une signification spéciale aux parenthèses et accolades, au lieu de les rendre littérales.\\ | + | Les commandes **''grep''** (ou **''grep -G''**) ; **''find -regextype "posix-basic" ''** ; |
+ | **''locate --regexp''** ; **''sed''**; **''vi''** utilisent en plus ces caractères-ci : | ||
+ | |||
+ | ^ ^ ^ | ||
+ | |**''<nowiki>\?</nowiki>''** | zéro ou une fois l'élément précédent | | ||
+ | |**''<nowiki>\+</nowiki>''** | une ou plusieurs fois l'élément précédent | | ||
+ | |**''<nowiki>\|</nowiki>''** | alternative | | ||
+ | |||
+ | -> Le caractère **''\''** donne une signification spéciale aux parenthèses et accolades, ?, +, | au lieu de les rendre littérales.\\ | ||
Mais il permet de rendre littéraux les autres caractères des ERb, par exemple ''\.'' permet de sélectionner un point. | Mais il permet de rendre littéraux les autres caractères des ERb, par exemple ''\.'' permet de sélectionner un point. | ||
<note tip> | <note tip> | ||
- | Je présenterai ici les commandes "spécifiques" aux ERb, c'est-à-dire, celles qui n'ont pas la possibilité d'utiliser les ERE, vi (vim) et expr.\\ | + | Je présenterai principalement les commandes qui n'utilisent que les ERb, c'est-à-dire, celles qui n'ont pas besoin d'une option pour utiliser les expressions rationnelles et qui n'ont pas encore été abordées, **''expr''** et **''vi''**.\\ |
- | Elles utilisent bien sûr tous les caractères ERb et pas seulement les caractères spécifiques aux ERb. | + | |
+ | Elles utilisent bien sûr tous [[utilisateurs:hypathie:tutos:erb-et-ere-par-le-contexte-des-commandes?&#caracteres-communs-aux-erb-et-ere|les caractères communs aux ERb et ERe]], leur utilisation avec ces caractères apparaîtra en à côté de l'utilisation des caractères spécifiques aux ERb. | ||
+ | |||
+ | Je ferai ensuite un bref rappel des commandes "à option" qui utilisent tous les caractères spécifiques aux ERb, mais qui peuvent aussi utiliser ces mêmes caractères((parenthèses, accolades, +, ? et |)) sans antislash avec les ERe. | ||
</note> | </note> | ||
Ligne 648: | Ligne 728: | ||
abc2356.99 | abc2356.99 | ||
73000|Savoie | 73000|Savoie | ||
+ | 123456 | ||
+ | 1234567 | ||
index-tel|04|Rhône-Alpe | index-tel|04|Rhône-Alpe | ||
-15 +36 5687 {15} exemple{36} | -15 +36 5687 {15} exemple{36} | ||
il y a un truc et un truc et encore un truc et une chose | il y a un truc et un truc et encore un truc et une chose | ||
- | chose et truc ne font pas bon ménage | + | choses et trucs ne font pas bon ménage |
123.3456.abc | 123.3456.abc | ||
- | trucchosetruc | + | trucschosetruc |
- | tructructruc | + | tructructrucs |
chosechosechose | chosechosechose | ||
</code> | </code> | ||
Ligne 663: | Ligne 745: | ||
<note tip> | <note tip> | ||
* La commande expr utilise l'opérateur **'':''** pour mettre en correspondance une chaîne de caractères avec une //ER//. | * La commande expr utilise l'opérateur **'':''** pour mettre en correspondance une chaîne de caractères avec une //ER//. | ||
- | * Si le nombre de caractères de la chaîne correspond à l'ERb, alors expr affiche à l'écran l'expression régulière basique. | + | * Si le nombre de caractères de la chaîne correspond à l'ERb, alors expr affiche ce nombre à l'écran. |
* Si la correspondance décrite ci-dessus est vraie, le code de retour est 0 (zéro). | * Si la correspondance décrite ci-dessus est vraie, le code de retour est 0 (zéro). | ||
* Si elle est fausse, expr retourne 0 (zéro) pour "zéro correspondance) et le code de retour est 1 (un). | * Si elle est fausse, expr retourne 0 (zéro) pour "zéro correspondance) et le code de retour est 1 (un). | ||
* L'expression rationnelle est comparée par rapport au début de la variable, le caractère **''^''** est toujours implicite. | * L'expression rationnelle est comparée par rapport au début de la variable, le caractère **''^''** est toujours implicite. | ||
* Si une partie de l'expression rationnelle est mémorisée avec **''\( \)''** la commande expr affiche dans le terminal la partie correspondante. | * Si une partie de l'expression rationnelle est mémorisée avec **''\( \)''** la commande expr affiche dans le terminal la partie correspondante. | ||
+ | * **''expr''** utilise tous les [[utilisateurs:hypathie:tutos:erb-et-ere-par-le-contexte-des-commandes?&#caracteres-communs-aux-erb-et-ere|caractères communs aux ERb et ERe]] | ||
+ | * mais elle n'utilise que les caractères spécifiques aux ERb ci-dessous : | ||
+ | |||
+ | |**''<nowiki>\{m\}</nowiki>''** | m fois le caractère précédent | | ||
+ | |**''<nowiki>\{m,\} </nowiki>''** | au moins m fois le caractère précédent | | ||
+ | |**''<nowiki>\{m,n\} </nowiki>''** | entre m et n fois le caractère précédent | | ||
+ | |**''<nowiki>\(ERb\)</nowiki>''** | mémorisation d'une ERb | | ||
+ | |**''<nowiki>\1, \2, ...</nowiki>''** | Rappel de mémorisation | | ||
+ | |||
</note> | </note> | ||
Ligne 703: | Ligne 794: | ||
> Le chiffre "1" est le code de retour. | > Le chiffre "1" est le code de retour. | ||
+ | |||
* sous chaîne avec caractère fin de mot : | * sous chaîne avec caractère fin de mot : | ||
Ligne 736: | Ligne 828: | ||
====L'éditeur de texte vi n'utilise que les ERb ==== | ====L'éditeur de texte vi n'utilise que les ERb ==== | ||
===Préparation === | ===Préparation === | ||
- | <code user>cat liste4-vim</code> | + | <code user>vi liste4-vim</code> |
- | <code> | + | ou |
- | Kc5 T5 c E2* abcd 7 9Abcd | + | <code user>vim liste4-vim</code> |
- | 7 1AAA.AAA.bcdef aBcd6a 123* | + | |
- | abc2356.99 | + | {{http://pix.toile-libre.org/upload/original/1407922486.png?400}} |
- | 73000|Savoie | + | |
- | index-tel|04|Rhône-Alpe | + | |
- | -15 +36 5687 {15} exemple{36} | + | |
- | il y a un truc et un truc et encore un truc et une chose | + | |
- | chose et truc ne font pas bon ménage | + | |
- | 123.3456.abc | + | |
- | trucchosetruc | + | |
- | tructructruc | + | |
- | chosechosechose | + | |
- | </code> | + | |
<note tip> | <note tip> | ||
- | Modes utilises dans ce qui suit\\ | + | Modes utilisés dans ce qui suit :\\ |
Ligne 770: | Ligne 852: | ||
* enregistrez : '' :wq '' et touche <entrée> | * enregistrez : '' :wq '' et touche <entrée> | ||
- | * Pour apprendre les rudiment de l'utilisation de vim (et donc de vi), après l'installation de vim : | + | * vi (vim) utilise tous [[utilisateurs:hypathie:tutos:erb-et-ere-par-le-contexte-des-commandes?&#caracteres-communs-aux-erb-et-ere|les caractères communs aux ERb et ERe]], tous [[utilisateurs:hypathie:tutos:erb-et-ere-par-le-contexte-des-commandes?&#caracteres-specifiques-aux-erb|les caractères spécifiques aux ERb]], y compris ceux ci-dessous (comme "les commandes à option"): |
- | vimtutor | + | |**''<nowiki>\?</nowiki>''** | zéro ou une fois l'élément précédent | |
+ | |**''<nowiki>\+</nowiki>''** | une ou plusieurs fois l'élément précédent | | ||
+ | |**''<nowiki>\|</nowiki>''** | alternative | | ||
+ | * Pour apprendre les rudiments de l'utilisation de vim (et donc de vi), après l'installation de vim : | ||
+ | |||
+ | vimtutor | ||
-> Pour y ajouter l'utilisation des //ER//, suivre ce qui suit. | -> Pour y ajouter l'utilisation des //ER//, suivre ce qui suit. | ||
Ligne 850: | Ligne 937: | ||
>"1,$" est l'adressage qui signifie de la première ligne à la fin | >"1,$" est l'adressage qui signifie de la première ligne à la fin | ||
+ | |||
+ | * utilisation de \| : | ||
+ | <code>/c\|t</code> | ||
+ | |||
+ | >surligne tous les "c" et tous les "t" du fichier. | ||
+ | |||
+ | * Utilisation de \? : | ||
+ | <code>/\.[0-9]\?</code> | ||
+ | |||
+ | ->Une image vaut mieux qu'une description :\\ | ||
+ | {{http://pix.toile-libre.org/upload/original/1407857157.png?400}} | ||
+ | |||
+ | * Utilisation de \+ : | ||
+ | <code>/[A-Z]\+</code> | ||
+ | -> Là aussi :\\ | ||
+ | {{http://pix.toile-libre.org/upload/original/1407856299.png?400}} | ||
<note> | <note> | ||
Ligne 866: | Ligne 969: | ||
===== grep, sed, find, locate et les caractères spécifiques aux ERb ===== | ===== grep, sed, find, locate et les caractères spécifiques aux ERb ===== | ||
- | Les commandes grep et sed sans option, et les commandes locate et locate avec option utilisent les caractères spécifiques aux ERb.\\ Puisqu'il est plus pratique de les utiliser avec les ERe qui sont plus lisibles, je n'en donnerai que quelques exemples. | + | Les commandes **''grep''** et **''sed''**, les commandes **''locate --regexp''** et **''find -regextype “posix-basic”''** utilisent tous les caractères spécifiques aux ERb.\\ Voir leur utilisation avec [[utilisateurs:hypathie:tutos:erb-et-ere-par-le-contexte-des-commandes?&#caracteres-des-ere|les expressions rationnelles étendues]]. |
- | ==== grep ==== | + | * Rappel du fichier "<nowiki>liste4-spec</nowiki>": |
+ | <code> | ||
+ | gdd:a:aa:aaa:aaaa:aaaaaa:aaaaaaaa | ||
+ | T5c Kc5 T5 c E2* abcd 7 9Abcd | ||
+ | 7 1AAA.AAA.bcdef aBcd6a 123* | ||
+ | abc2356.99 | ||
+ | 73000|Savoie | ||
+ | 123456 | ||
+ | 1234567 | ||
+ | index-tel|04|Rhône-Alpe | ||
+ | -15 +36 5687 {15} exemple{36} | ||
+ | il y a un truc et un truc et encore un truc et une chose | ||
+ | choses et trucs ne font pas bon ménage | ||
+ | 123.3456.abc | ||
+ | trucschosetruc | ||
+ | tructructrucs | ||
+ | chosechosechose | ||
+ | </code> | ||
+ | |||
+ | ==== grep ou grep -G et les caractères spécifiques aux ERb==== | ||
* les accolades avec antislash (le caractère précédent un nombre exact de fois) : | * les accolades avec antislash (le caractère précédent un nombre exact de fois) : | ||
Ligne 876: | Ligne 998: | ||
</code> | </code> | ||
- | * le caractère précédent à partir de "n" à "m" fois : | + | * mais on peut utiliser le caractère \+ : |
+ | <code user>grep "\(1A\{3\}\.\)\+.*" liste4-spec</code> | ||
+ | <code> | ||
+ | 7 1AAA.AAA.bcdef aBcd6a 123* | ||
+ | </code> | ||
+ | |||
+ | |||
+ | * le caractère précédent de "n" à "m" fois : | ||
<code user>grep "[0-9]\{1,3\}" liste4-spec</code> | <code user>grep "[0-9]\{1,3\}" liste4-spec</code> | ||
<code> | <code> | ||
Ligne 904: | Ligne 1033: | ||
</code> | </code> | ||
+ | * Le caractère \? : | ||
+ | <code user>grep "trucs\?" liste4-spec</code> | ||
+ | <code> | ||
+ | il y a un truc et un truc et encore un truc et une chose | ||
+ | choses et trucs ne font pas bon ménage | ||
+ | trucschosetruc | ||
+ | tructructrucs | ||
+ | </code> | ||
- | ====sed sans option utilise les ERb ==== | + | >On cherche les lignes qui comporte "truc" au singulier ou au pluriel. |
+ | |||
+ | ====sed et les caractères spécifiques aux ERb ==== | ||
+ | __**Rappel**__\\ | ||
+ | |||
+ | Par défaut sed utilise les ERb.\\ | ||
La syntaxe est la même que pour les caractères communs aux ERe. | La syntaxe est la même que pour les caractères communs aux ERe. | ||
+ | |||
+ | ===Exemples === | ||
* Substituer "Hello" par "OK" : | * Substituer "Hello" par "OK" : | ||
Ligne 929: | Ligne 1073: | ||
</note> | </note> | ||
- | ====locate utilise les ERb avec l'option --regexp ==== | + | ====find et les caractères spécifiques aux ERb " ==== |
- | <code man locate> | + | __**Rappel **__\\ |
- | --regexp REGEXP | + | |
- | Search for a basic regexp REGEXP. No PATTERNs are allowed if | + | Pour utiliser les ERb, il faut utiliser l'option **''-regextype "posix-basic" ''**. |
- | this option is used, but this option can be specified multiple | + | |
- | times. | + | __**Préparation**__\\ |
+ | |||
+ | Dans le répertoire de l'utilisateur soit le répertoire "ERetCMD/" contenant : | ||
+ | |||
+ | <code> | ||
+ | Dossier img-perso-2.jpg liste3-erb-ere sort1.txt | ||
+ | essai.grep2~ liste liste4-spec sort2.txt | ||
+ | image linux - 01.jpg liste1 liste4-vim sort3.txt | ||
+ | image linux - 02.jpg liste1-nom liste-class vim2.png | ||
+ | image linux - 03.jpg liste2 server-0.xkb vim.png | ||
+ | img-perso-1.jpg liste2-nom smolski-exo-sed.txt xxx-sort.txt | ||
</code> | </code> | ||
- | ===Syntaxe === | ||
+ | ===Exemples === | ||
+ | * accolades (depuis le répertoire parent "ERetCMD/" des fichiers recherchés : | ||
+ | <code user>find -regextype "posix-basic" -regex ".*/[a-z]\{,3\}-.*\.jpg$"</code> | ||
<code> | <code> | ||
- | locate --regexp 'ERb' | + | ./img-perso-2.jpg |
+ | ./img-perso-1.jpg | ||
</code> | </code> | ||
- | === Préparation=== | + | * caractère \? : |
- | Dans le répertoire de l'utilisateur et dans le dosssier "ERetCMD/" : | + | <code user>find -regextype "posix-basic" -regex ".*/liste.\?"</code> |
- | + | <code> | |
- | * Création de trois fichiers : "image linux - 01.jpg", "image linux - 02.jpg" et "image linux - 03.jpg" : | + | ./ERetCMD/liste1 |
- | + | ./ERetCMD/liste | |
- | <code user> | + | ./ERetCMD/liste2 |
- | touch image\ linux\ -\ 01.jpg image\ linux\ -\ 02.jpg image\ linux\ -\ 03.jpg | + | |
</code> | </code> | ||
- | * Visualisation : | + | * le caractère \+ (depuis le répertoire parent "ERetCMD/" des fichiers) : |
- | <code user>ls</code> | + | <code user>find -regextype "posix-basic" -regex ".*/liste.\+"</code> |
<code> | <code> | ||
- | Dossier img-perso-1.jpg liste3-erb-ere smolski-exo-sed.txt | + | ./liste2-nom |
- | essai.grep2~ img-perso-2.jpg liste4-spec sort1.txt | + | ./liste1-nom |
- | image linux - 01.jpg liste1-nom liste4-spec~ sort2.txt | + | ./liste3-erb-ere |
- | image linux - 02.jpg liste1-nom~ liste4-vim sort3.txt | + | ./liste4-vim |
- | image linux - 03.jpg liste2-nom server-0.xkb xxx-sort.txt | + | ./liste1 |
+ | ./liste4-spec | ||
+ | ./liste2 | ||
+ | ./liste-class | ||
</code> | </code> | ||
- | * Mise à jour de la base de donnée : | + | ====locate et les caractères spécifiques aux ERb ==== |
+ | __**Rappel**__\\ | ||
+ | |||
+ | Pour utiliser les ERb, il faut utiliser l'option **''--regexp''**.\\ | ||
+ | |||
+ | Soit encore le répertoire "ERetCMD/" contenant les mêmes fichiers (voir find).\\ | ||
+ | |||
+ | Mise à jour de la base de donnée, si besoin : | ||
<code root> | <code root> | ||
updatedb | updatedb | ||
</code> | </code> | ||
- | ===Exemple === | + | ===Exemples === |
- | <code user>locate --regexp '.*\([a-z]\{1,\} \)\{2\}.*\.jpg$'</code> | + | * parenthèses et accolades (depuis n'importe où dans l'arborescence du système de fichiers) : |
+ | |||
+ | <code user>locate --regexp '\([a-z]\{1,\} \)\{2\}.*\.jpg$'</code> | ||
<code> | <code> | ||
/home/Téléchargements/Les utilitaires awk, nawk et gawk - Tutoriel_fichiers/logo.jpg | /home/Téléchargements/Les utilitaires awk, nawk et gawk - Tutoriel_fichiers/logo.jpg | ||
Ligne 975: | Ligne 1143: | ||
</code> | </code> | ||
- | + | * caractère \? : | |
- | + | <code user>locate --regexp '/liste.\?'</code> | |
- | ====find utilise les ERb avec l'option -regextype "posix-basic" ==== | + | |
- | <code man find> | + | |
- | -regextype type | + | |
- | Définir la syntaxe des expressions rationnelles des tests -regex | + | |
- | et -iregex qui seront indiqués plus loin sur la ligne de com‐ | + | |
- | mande. Les types actuellement implémentés sont emacs (type par | + | |
- | défaut), posix-awk, posix-basic, posix-egrep et posix-extended. | + | |
- | + | ||
- | </code> | + | |
- | + | ||
- | ===Syntaxe === | + | |
<code> | <code> | ||
- | find -regextype "posix-basic" -regex "ERb" | + | /home/hypathie/Documents/PYTHON/python2/chap06/liste_et_branch.py |
+ | /home/hypathie/Documents/PYTHON/python3/chap06/liste_et_branch.py | ||
+ | /home/hypathie/ERetCMD/liste | ||
+ | /home/hypathie/ERetCMD/liste-class | ||
+ | /home/hypathie/ERetCMD/liste1 | ||
+ | /home/hypathie/ERetCMD/liste1-nom | ||
+ | /home/hypathie/ERetCMD/liste2 | ||
+ | /home/hypathie/ERetCMD/liste2-nom | ||
+ | /home/hypathie/ERetCMD/liste3-erb-ere | ||
+ | /home/hypathie/ERetCMD/liste4-spec | ||
+ | /home/hypathie/ERetCMD/liste4-vim | ||
+ | /usr/share/man/man2/listen.2.gz | ||
</code> | </code> | ||
- | ===Préparation=== | + | >Le fichier "liste" (sans extension) apparaît. |
- | Dans le répertoire de l'utilisateur et dans le dosssier "ERetCMD/" | + | |
- | * Création de deux fichiers, "img-perso-1.jpg" et "img-perso-2.jpg" : | + | * caractère \+ : |
- | <code user> | + | <code user>locate --regexp '/liste.\+'</code> |
- | touch img-perso-1.jpg img-perso-2.jpg | + | <code> |
+ | /home/hypathie/Documents/PYTHON/python2/chap06/liste_et_branch.py | ||
+ | /home/hypathie/Documents/PYTHON/python3/chap06/liste_et_branch.py | ||
+ | /home/hypathie/ERetCMD/liste-class | ||
+ | /home/hypathie/ERetCMD/liste1 | ||
+ | /home/hypathie/ERetCMD/liste1-nom | ||
+ | /home/hypathie/ERetCMD/liste2 | ||
+ | /home/hypathie/ERetCMD/liste2-nom | ||
+ | /home/hypathie/ERetCMD/liste3-erb-ere | ||
+ | /home/hypathie/ERetCMD/liste4-spec | ||
+ | /home/hypathie/ERetCMD/liste4-vim | ||
+ | /usr/share/man/man2/listen.2.gz | ||
</code> | </code> | ||
- | ===exemples === | ||
- | <code user>find -regextype "posix-basic" -regex ".*/[a-z]\{,3\}-.*\.jpg$"</code> | + | >Le fichier "liste" (sans extension) n'apparaît pas. |
- | <code> | + | |
- | ./img-perso-2.jpg | + | |
- | ./img-perso-1.jpg | + | |
- | </code> | + | |
=====Les classes ===== | =====Les classes ===== | ||
Ligne 1244: | Ligne 1416: | ||
* Recherche : | * Recherche : | ||
- | <code>/[[:alnum:]]\{7\}\.[[:digit:]]\{2\} </code> | + | <code>/[[:alnum:]]\{7\}{[[:digit:]]\{2\}} </code> |
+ | |||
+ | -> sélectionne entièrement la chaîne **''exemple{36}''** | ||
+ | |||
+ | * Substitution <nowiki>[[:graph:]]</nowiki>: | ||
+ | <code>:6,10s/[[:graph:]]/x/g</code> | ||
- | -> sélectionne entièrement la ligne **''abc2356.99''** | + | > Le caractère "ô" n'est pas concerné du fait de la touche morte. |
- | * Substitution : | + | {{http://pix.toile-libre.org/upload/original/1407925315.png?400}} |
- | <code>:3,4s/[[:graph:]]/x/g</code> | + | |
- | -> les ligne 3 et 4 ne présentent plus que des "x", tous les caractères susceptibles d'être concernés par la //ER// sont surlignés, c'est-à-dire tous le texte sauf les espaces. | + | * Substitution <nowiki>[[:print:]]</nowiki> : |
+ | <code>:6,10s/[[:print:]]/x/g</code> | ||
- | -> Information sur les substitutions : ''22 substitutions, sur 2 lignes'' | + | {{http://pix.toile-libre.org/upload/original/1407925697.png?400}} |
====awk utilise les ERe et les classes sans option==== | ====awk utilise les ERe et les classes sans option==== |