logo Debian Debian Debian-France Debian-Facile Debian-fr.org Forum-Debian.fr Debian ? Communautés logo inclusivité

Debian-facile

Bienvenue sur Debian-Facile, site d'aide pour les nouveaux utilisateurs de Debian.

Vous n'êtes pas identifié(e).


L'icône rouge permet de télécharger chaque page du wiki visitée au format PDF et la grise au format ODT → ODT PDF Export

Ceci est une ancienne révision du document !


ERb et ERe par le contexte des commandes

  • Objet : maîtriser les expressions rationnelles basiques et étendues
  • Niveau requis : avise
  • Commentaires : Il s'agira de distinguer ERb et ERe et de savoir les utiliser en fonction des commandes de gestion de fichier.

Introduction

Pour apprendre à utiliser les expressions rationnelles, il faut en passer par l'exercice.
Mais pour être en mesure d'en passer par l'exercice, il faut nécessairement en passer par les programmes utilisant les expressions rationnelles. C'est là que les choses se compliquent pour le néophyte.

Il faut savoir en effet que :

  • la configuration locale affecte la façon dont les expressions rationnelles sont interprétées1).
  • qu'il y a également plusieurs types d'expressions rationnelles, PCRE, posix-awk, posix-basic, posix-egrep et posix-extended.
  • Enfin, les différents programmes permettant de s'y exercer, grep, egrep, find, locate, sed, awk, etc. n'utilisent pas tous le même type d'expressions rationnelles.

Heureusement, pour s'éviter d'assimiler en même temps tous ces différents types, il est possible sous GNU/Linux, d'utiliser avec chacun des programmes spécifiques à la gestion des fichiers, soit par défaut, soit au moyen d'une option, les expressions rationnelles basiques (ERb) et les expressions rationnelles étendues (ERe).

Heureusement encore, les ERb et ERe donnent un très bon aperçu de ce que permettent les ER, et les étudier permet d'acquérir une base solide quant à la signification des caractères utilisables; ils sont de plus POSIX, c'est-à-dire portables.

Le contexte de cet apprentissage, se limitera donc à l'utilisation des expressions rationnelles au moyen des commandes de gestion des fichiers, et n'appréhendera pas l'utilisation des ER au sein des langages spécialisés pour la programmation avancée.

Panorama exhaustif des programmes utilisant les ER en ligne de commandes ou avec des scripts shell

  • grep : rechercher un fichier à partir de son contenu
  • find : Rechercher des fichiers sur le système en fonction de paramètres spécifiques
  • find et grep : rechercher une chaîne et le fichier en une ligne
  • locate : rechercher un fichier dans un index des fichiers du système
  • commande sed : sélectionner ou modifier les chaînes sélectionnées d'un ficher par une ERb ou une ERE.
  • commande awk : sélectionner les colonnes, lignes, mots d'un fichier, et modifier l'affichage en fonction de la sélection.
  • et la commande expr : uniquement pour sélectionner une variable au moyen d'une ER basique.

Dans un premier temps, je donnerai la liste des ERb et ERe, puis je montrerai comment les utiliser avec chacun de ces programmes.

Avant de commencer un rappel des métacaractères, leur signification pour le shell et pour les commandes évoquées ci-dessus

Les caractères des ERb et ERe

Les expressions rationnelles basiques

caractères communs au ERb et ERe

expressions Modèles reconnus
c Tout non métacaractère c.
\ Échappement du caractère spécial.
Par exemple \. sélectionne un point littéral.
^ Test effectué au début de la chaîne.
$ Test effectué à la fin de la chaîne.
. Tout caractère sauf une fin de ligne.
* Zéro à n chaînes consécutives validées par l’expression régulière r.
\< début d'un mot (caractères pouvant faire partie de [A-Z-z0-9]
\> Fin d'un mot
[liste_de_caractères] Un caractère cité dans la liste
[^liste_de_caractères] Un carcatère qui n'est pas dans la liste

caractère spécifiques aux ERb

expressions Modèles reconnus
\{m\} m fois le caractère précédent
\{m,\} au moins m fois le caractère précédent
\{m,n\} entre m et n fois le caractère précédent
\(ERb\) mémorisation d'une ERb
\1, \2, ... Rappel de mémorisation

→ Le caractère \ donne une signification spéciale aux parenthèses et accolades, au lieu de les rendre littérales.

  • Avec grep, sed, expr : sans option
  • Avec find option -regextype “posix-basic”
  • Avec locate option -r (–regexp) : Rechercher une expression rationnelle REGEXP de base

Les classes

[[:alnum:]] Alpha-numerique [a-z A-Z 0-9]
[[:alpha:]] Alphabetic [a-z A-Z]
[[:blank:]] Espaces ou tabulations
[[:cntrl:]] Caractères de contrôle
[[:digit:]] Nombres [0-9]
[[:graph:]] Tous les caractères visibles (à l'exclusion des espaces)
[[:lower:]] Lettres minuscules [a-z]
[[:print:]] Caractères imprimables (tous caractères sauf ceux de contrôle)
[[:punct:]] Les caractères de ponctuation
[[:space:]] Les espaces
[[:upper:]] Les lettres majuscules [A-Z]
[[:xdigit:]] Chiffres hexadécimaux [0-9 a-f A-F]
  • Avec grep, elles ne nécessitent pas l'option -R ou egrep.
  • Avec sed il faut l'option -r, bien que les classes relèvent des ERb.
  • Avec find option : -regextype “posix-extended”
  • Avec locate : –regex : Interpréter tous les “PATTERNs” (modèles) comme des expressions rationnelles étendues.

Caractères des ERe

expressions Modèles reconnus
? zéro ou une fois le caractère ou le regroupement précédent
+ une à n fois le caractère ou regroupement précédent
{m} m fois le caractère précédent
{m,} m fois le caractère précédent
{m,n} entre m et n fois le caractère précédent
( er1) regroupement
er1|er2|er3 alternative
(er)+Une ou plus de une chaîne(s) consécutive(s) validée(s) “er”.
(er)*zéro ou plus de zéro chaîne(s) consécutive(s) validée(s) par “er”
(er)?une chaîne bulle ou toute chaîne validée par “er”.
[c1c2...]Tout caractère expressément listé entre les crochets.
[^c1c2...]Tout caractère excepté ceux qui sont expressément listés entre les crochets.
[c1-c2]Tout caractère appartenant à l’intervalle c1 c2, bornes comprises.
er1|er2Toute chaîne de caractères validée soit par er1 soit par er2.
(er)(er)Toute chaîne validée par l’expression er, chaîne vide exclue.
(er1)(er2)Toute chaîne de caractères de type AB, dans laquelle l’expression régulière er1 valide A et l’expression régulière er2 valide B.
Avec awk uniquement

Excepté (er1)(er2) :

  • utilisables avec awk (sans option)
  • utilisables avec grep -E et egrep
  • utilisables avec sed -r

Les raccourcis ne sont pas posix

  • sed :
Séquences Séquences
\f Produit ou correspond à un saut
\n Produit ou correspond à un retour à la ligne
\t Produit ou correspond à un onglet horizontal
\v Produit ou correspond à une tabulation verticale
\w Synonyme de [[:alnum:]] → correspond à un mot.
\W Synonyme de [^[:alnum]] → ce qui autre qu'un mot.
\b Correspond à une chaîne vide (blanc) à l'extrémité d'un mot
  • awk :
Séquences Séquences
\b backspace (supprime le dernier caractère d'une chaîne)
\f formfeed (nouvelle page)
\r carriage return (retour à la ligne)
\t tabulation (crée une tabulation de dix espaces)
\c tout caractère pris sous sa forme littérale
excepté \

Excepté (er1)(er2) :

  • Tous sont utilisables avec grep -E et egrep
  • Tous sont utilisable avec awk
  • Certains posent problème avec sed -r

Avec find et locate :

  • find -regextype “posix-extended”

Les types actuellement implémentés sont emacs (type par

            défaut), posix-awk, posix-basic, posix-egrep et posix-extended.
  • locate –regex : Interpréter tous les “PATTERNs” (modèles) comme des expressions rationnelles étendues.
1)
Voir Variables d'environnement, pour une description de la façon dont la configuration de votre environnement local influe sur l'interprétation des expressions rationnelles
utilisateurs/hypathie/tutos/erb-et-ere-par-le-contexte-des-commandes.1407499588.txt.gz · Dernière modification: 08/08/2014 14:06 par Hypathie

Pied de page des forums

Propulsé par FluxBB