Debian Debian-France Debian-Facile Debian-fr.org Forum-Debian.fr Debian ? Communautés

Debian-facile

Bienvenue sur Debian-Facile, site d'aide pour les nouveaux utilisateurs de Debian.

Vous n'êtes pas identifié(e).

Contributions : Récentes | Sans réponse

L'icône rouge permet de télécharger chaque page du wiki visitée au format PDF et la grise au format ODT →

Ceci est une ancienne révision du document !

ERb et ERe par le contexte des commandes

Objet : maîtriser les expressions rationnelles basiques et étendues
Niveau requis : avise
Commentaires : Il s'agira de distinguer ERb et ERe et de savoir les utiliser en fonction des commandes.

Introduction

Pour apprendre à utiliser les expressions régulières, il faut en passer par l'exercice.
Mais pour être en mesure d'en passer par l'exercice, il faut nécessairement en passer par les programmes utilisant les expressions régulières. C'est là que les choses se compliquent pour le néophyte.

Il faut savoir en effet que :

la configuration locale affecte la façon dont les expressions régulières sont interprétées¹⁾.
qu'il y a également plusieurs types d'expression régulière, PCRE, posix-awk, posix-basic, posix-egrep et posix-extended, et les différents programmes permettant de s'y exercer, grep, egrep, find, locate, sed, awk, etc. n'utilisent pas tous le même type d'expression régulière.

Heureusement pour s'éviter d'assimiler en même temps tous ces différents types, il est possible sous GNU/Linux, d'utiliser avec chacun des programmes, soit par défaut, soit en le spécifiant au programme au moyen d'une option, les expressions régulière basiques (ERb) et les expressions régulière étendues (ERe).

Heureusement encore les ERb et ERe donnent un très bon aperçu de ce que permet les ER, et permettent d'acquérir une base solide quant à la signification des caractères utilisables, et sont POSIX, c'est-à-dire portables.

Le contexte de cet apprentissage, se limitera donc à l'utilisation des expressions rationnelles au moyen des commandes les utilisant pour la gestion des fichiers, et n'appréhendera pas l'utilisation de ER au sein des langages spécialisés pour la programmation avancée.

Panorama exhaustif des programmes utilisant les ER en ligne de commandes ou avec des scripts shell

grep : rechercher un fichier à partir de son contenu
find : Rechercher des fichiers sur le système en fonction de paramètres spécifiques
find et grep : rechercher une chaîne et le fichier en une ligne
locate : rechercher un fichier dans un index des fichiers du système
commande sed :
commande awk :
et la commande expr :

Dans un première temps, je donnerai la liste des ERb et ERe, puis je montrerai comment les utiliser avec chacun de ces programmes.

Avant de commencer un rappel des métacaractères, leur signification pour le shell et pour ces commandes

Les expressions rationnelles basiques

Tableau récapitulatif des caractères ERb

caractères communs au ERb et ERe

expressions	Modèles reconnus
c	Tout non métacaractère c.
`\`	Échappement du caractère spécial. Par exemple `\.` sélectionne un point littéral.
`^`	Test effectué au début de la chaîne.
`$`	Test effectué à la fin de la chaîne.
`.`	Tout caractère sauf une fin de ligne.
*``**	Zéro à n chaînes consécutives validées par l’expression régulière r.
`\<`	début d'un mot (caractères pouvant faire partie de [A-Z-z0-9]
`\>`	Fin d'un mot
`[liste_de_caractères]`	Un caractère cité dans la liste
`[^liste_de_caractères]`	Un carcatère qui n'est pas dans la liste

caractère spécifiques aux ERb

expressions	Modèles reconnus
`\{m\}`	m fois le caractère précédent
`\{m,\}`	au moins m fois le caractère précédent
`\{m,n\}`	entre m et n fois le caractère précédent
`$ERb$`	mémorisation d'une ERb
`\1, \2, ...`	Rappel de mémorisation

→ Le caractère \ donne une signification spéciale aux parenthèses et accolades, au lieu de les rendre littérales.

find

locate

grep

sed

Les classes


`[[:alnum:]]`	Alpha-numerique [a-z A-Z 0-9]
`[[:alpha:]]`	Alphabetic [a-z A-Z]
`[[:blank:]]`	Espaces ou tabulations
`[[:cntrl:]]`	Caractères de contrôle
`[[:digit:]]`	Nombres [0-9]
`[[:graph:]]`	Tous les caractères visibles (à l'exclusion des espaces)
`[[:lower:]]`	Lettres minuscules [a-z]
`[[:print:]]`	Caractères imprimables (tous caractères sauf ceux de contrôle)
`[[:punct:]]`	Les caractères de ponctuation
`[[:space:]]`	Les espaces
`[[:upper:]]`	Les lettres majuscules [A-Z]
`[[:xdigit:]]`	Chiffres hexadécimaux [0-9 a-f A-F]

Avec grep, elles ne nécessitent pas l'option -R ou egrep.
Avec sed il faut l'option -r, bien que les classes relèvent des ERb.
Avec find
Avec locate

exemple avec grep

exemple avec sed

exemple avec find

exemple avec locate

Expressions rationnelles étendues

grep -E

sed -r

awk

find -regextype type

Les  types actuellement implémentés sont emacs (type par
            défaut), posix-awk, posix-basic, posix-egrep et posix-extended.

locate --regex

Interpréter tous les "PATTERNs" (modèles) comme des expressions rationnelles étendues.

¹⁾

Voir Variables d'environnement, pour une description de la façon dont la configuration de votre environnement local influe sur l'interprétation des expressions régulières

utilisateurs/hypathie/tutos/erb-et-ere-par-le-contexte-des-commandes.1407492375.txt.gz · Dernière modification: 08/08/2014 12:06 par Hypathie