Vous n'êtes pas identifié(e).
L'icône rouge permet de télécharger chaque page du wiki visitée au format PDF et la grise au format ODT →
Ci-dessous, les différences entre deux révisions de la page.
Les deux révisions précédentes Révision précédente Prochaine révision | Révision précédente Prochaine révision Les deux révisions suivantes | ||
doc:programmation:shell:regexp [22/09/2013 09:54] smolski [Introduction] |
doc:programmation:shell:regexp [22/09/2013 10:36] smolski [Les caractères regexp] |
||
---|---|---|---|
Ligne 41: | Ligne 41: | ||
Par exemple pour cette commande [[:doc:systeme:ls]] dont l'option **-d** permet à **ls** de lister uniquement les répertoires, sans leur contenu : | Par exemple pour cette commande [[:doc:systeme:ls]] dont l'option **-d** permet à **ls** de lister uniquement les répertoires, sans leur contenu : | ||
- | <code bash> | + | <code user> |
ls -d *</code> | ls -d *</code> | ||
- | C'est bash qui va **interpréter** la regexp * (étoile) et la remplacer par tout le contenu du répertoire rendu ainsi lisible pour la commande ls et son action sur chacun d'eux. | + | C'est bash qui va **interpréter** la regexp * (étoile) et la remplacer par **tout le contenu du répertoire** rendu ainsi lisible pour la commande **ls** et son action sur chacun d'eux comme ici par exemple : |
- | fichier1 fichier2 … dossier1 … | + | fichier1 fichier2 … dossier1 … |
<note important>**ATTENTION !** | <note important>**ATTENTION !** | ||
Ligne 59: | Ligne 59: | ||
==== Syntaxes ==== | ==== Syntaxes ==== | ||
- | Pour ces **regexp**, __différents programmes__ //utilisent// __différentes syntaxes__, de ce fait leurs __symboliques peut être différentes__ il faut donc bien distinguer le contexte où interviennent les **regexp**. | + | Pour ces **regexp**, __différents programmes__ //utilisent// __différentes syntaxes__, de ce fait leurs __symboliques peuvent être différentes__ il faut donc bien distinguer le contexte où interviennent les **regexp**. |
Par exemple, un **regexp** destiné à l'utilisation d'une commande [[:doc:systeme:sed]], [[:doc:systeme:find]], [[:doc:systeme:locate]] ou [[:doc:systeme:grep]], devra être écrit différemment que dans le contexte de __l'utilisation d'une commande **bash**__ (voir : [[commande:les_metacaracteres | Bash - Les metacaractères (Pattern - Glob)]]). | Par exemple, un **regexp** destiné à l'utilisation d'une commande [[:doc:systeme:sed]], [[:doc:systeme:find]], [[:doc:systeme:locate]] ou [[:doc:systeme:grep]], devra être écrit différemment que dans le contexte de __l'utilisation d'une commande **bash**__ (voir : [[commande:les_metacaracteres | Bash - Les metacaractères (Pattern - Glob)]]). | ||
Ligne 87: | Ligne 87: | ||
===== REGEXP - Utilisation pour sed find grep locate ===== | ===== REGEXP - Utilisation pour sed find grep locate ===== | ||
- | Dans ce tuto, nous allons donc nous intéresser aux ''regexp'' utilisées par | + | Dans ce tuto, nous allons donc nous intéresser aux **regexp** utilisées par |
**sed**, **find**, **grep** et **locate** (sensiblement les mêmes). | **sed**, **find**, **grep** et **locate** (sensiblement les mêmes). | ||
==== Préparation pour executer les TP ==== | ==== Préparation pour executer les TP ==== | ||
- | - [[manuel:le_debianiste_qui_papillonne|Utiliser GNU/Linux en ligne de commande, tout commence là !.]] :-) | + | Nous allons ici utiliser [[:doc:editeurs:vim]], l'éditeur fétiche des amoureux du terminal ! ;-) |
- | - [[:doc:editeurs:vim]] - L'éditeur fétiche des amoureux du terminal ! | + | |
- | Pour réaliser les TP mis en exemple dans ce tuto, il vous faut préparer ces répertoires et fichiers, permettant d'accomplir les TP qui vont suivre. \\ | + | Pour réaliser les TP mis en exemple dans ce tuto, il vous faut préparer ces répertoires et fichiers. \\ |
- | Créer le repertoire ''tuto_regexp'' dans votre ''/home/user'' : | + | Créer le repertoire ''/home/user/tuto_regexp'' : |
- | <code bash> | + | <code user> |
- | mkdir /home/user/tuto_regexp</code> | + | mkdir ~/tuto_regexp</code> |
- | Compléter ce répertoire avec les TP qui suivent. \\ | + | Compléter ce répertoire comme indiqué dans les TP qui suivent. \\ |
- | Nous seront ainsi fin prêts pour réaliser les TP mis en exemple dans ce tuto ! ;-) | + | Nous seront ainsi fin prêts pour réaliser les TP mis en exemple dans ce tuto ! :-) |
=== TP-01 === | === TP-01 === | ||
Créer le fichier abraca et y inscrire le mot : ''Abracadabrantesque'' ainsi : | Créer le fichier abraca et y inscrire le mot : ''Abracadabrantesque'' ainsi : | ||
- | <code bash> | + | <code user> |
- | vim /home/user/tuto_regexp/abraca</code> | + | vim ~/tuto_regexp/abraca</code> |
- | et taper : | + | et écrire : |
Abracadabrantesque | Abracadabrantesque | ||
Ligne 121: | Ligne 120: | ||
Ces caractères suivants ont un statut particulier dans les **regexp** : | Ces caractères suivants ont un statut particulier dans les **regexp** : | ||
- | ^ . [ ] $ * { } \ | + | * L'accent circonflexe : '' ^ '' |
+ | * Le point : '' . '' | ||
+ | * Les crochets doubles : ''[ ] '' | ||
+ | * Le signe dollar : '' $ '' | ||
+ | * L'étoile : '' * '' | ||
+ | * Les accolades doubles : '' { } '' | ||
+ | * L'anti-slash : '' \ '' | ||
- | Avec les **regexp**, les shells (lignes de commande) effectuent certaines substitutions dans les commandes entrées par les utilisateurs avant de les exécuter. | + | Avec les **regexp**, les //shells// effectuent certaines substitutions dans les commandes entrées par les utilisateurs avant de les exécuter. |
==== Les caractères ==== | ==== Les caractères ==== | ||
- | La première chose que l'on veut pouvoir reconnaître avec des motif, ce sont les | + | La première chose que l'on veut pouvoir reconnaître avec des motif, ce sont les mots que l'on peut écrire sans **REGEXP**. \\ |
- | mots que l'on peut écrire sans **regexp**. \\ | + | **Exemple :** |
- | Exemple : | + | |
Abracadabrantesque | Abracadabrantesque | ||
Toutes ces lettres sont des caractères pouvant former une ''regexp''. \\ | Toutes ces lettres sont des caractères pouvant former une ''regexp''. \\ | ||
- | ''Abracadantesque'' est donc déjà en soi une ''regexp'' reconnaissant exactement | + | ''Abracadantesque'' est donc déjà en soi une ''REGEXP'' reconnaissant exactement le mot ''Abracadabrantesque''. |
- | le mot ''Abracadabrantesque''. | + | |
==== Les jokers ==== | ==== Les jokers ==== | ||
- | |||
''A.racadabrant....e'' | ''A.racadabrant....e'' | ||
- | Comme vous l'aurez compris, les ''.'' (points) signifient //n'importe quel caractère//. \\ | + | Comme vous l'aurez compris, les points ''.'' signifient //n'importe quel caractère//. \\ |
- | La chaîne ci-dessus est une ''regexp'' qui reconnaît exactement les caractères entrant dans le mot recherché. \\ | + | La chaîne ci-dessus est dans son ensemble une **REGEXP** qui reconnaît exactement les caractères entrant dans le mot recherché. \\ |
- | En effet, ''.'' (le point) est un caractère spécial reconnaissant //n'importe quel caractère//. On appelle aussi ce caractère un ''joker''((En bash, le caractère joker est ''?'')) | + | En effet, ''.'' (le point) est un caractère spécial reconnaissant //n'importe quel caractère//. |
+ | <note tip>On appelle aussi ce caractère un ''joker''((En bash, le caractère joker est ''?''))</note> | ||
+ | |||
+ | ==== Les caractères échappés ==== | ||
+ | |||
+ | Tous nos caractères spéciaux ont des significations particulières, nous l'avons vu avec le .((point)), c'est vrai pour les autres. \\ | ||
+ | Ainsi, pour reconnaître chacun d'eux en tant que caractère non spécial, il faut l'échapper par un \((anti-slash)). | ||
- | === TP 01 : === | + | Ainsi la combinaison : ''\.''((anti-slash point)) reconnaît simplement ''.''((point)) \\ |
+ | Comme la combinaison : ''\\''((anti-slash antislash)) reconnaît ''\''((anti-slash)) \\ | ||
+ | Ou encore la combinaison : ''\\\.''((anti-slash anti-slash anti-slash point)) reconnaît \.((anti-slash point)) | ||
+ | //Eh oui !// :-D | ||