logo Debian Debian Debian-France Debian-Facile Debian-fr.org Forum-Debian.fr Debian ? Communautés logo inclusivité

Debian-facile

Bienvenue sur Debian-Facile, site d'aide pour les nouveaux utilisateurs de Debian.

Vous n'êtes pas identifié(e).


L'icône rouge permet de télécharger chaque page du wiki visitée au format PDF et la grise au format ODT → ODT PDF Export

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
Prochaine révision
Révision précédente
utilisateurs:hypathie:tutos:sed-et-les-expressions-rationnelles [23/07/2014 06:35]
Hypathie [L'adressage]
utilisateurs:hypathie:tutos:sed-et-les-expressions-rationnelles [09/08/2014 07:30] (Version actuelle)
Hypathie [Sed et les regexp simples]
Ligne 6: Ligne 6:
  
 =====Contexte d'​utilisation des ER ===== =====Contexte d'​utilisation des ER =====
 +On utilise les expressions rationnelles simples ou étendues (//ERE//) avec sed
  
->Avec sed les ER s'utilisent lorsqu'​on veut modifier un fichier texte+  * pour les adressages par l'encadrement,​ [[utilisateurs:​hypathie:​tutos:​sed-par-la-methode-structuraliste?&#​adressage-simple|simple]] et [[utilisateurs:​hypathie:​tutos:​sed-par-la-methode-structuraliste?&#​adressage-double|double]]
->​Il ​s'agit de matcher un ou des éléments d'un fichier texte par une REGEXP et de remplacer, ce ou ces éléments ciblés du texte, par autres choses ou rien.  +  * avec la commande ​:  
->Ou encoreelles servent à ajouter, à un endroit précisé ​par la regexp, un ou des éléments au texte.+    * ''​s/​motif/​substitut/​[options_de_s]''​ où "​motif"​ peut être une //​ER// ​ou une //ERE// 
 +    * qui utilise aussi des ER pour ses adressages
 + 
 +Dans ce qui suitseule [[utilisateurs:​hypathie:​tutos:​sed-par-la-methode-structuraliste?&#​la-commande-s|la commande s]] servira pour illustrer d'​exemples l'​utilisation ​des //ER// et //ERE//.\\  
 +Pour l'​utilisation globale de sed voir [[utilisateurs:​hypathie:​tutos:​sed-par-la-methode-structuraliste|sed par la méthode structuraliste]].
  
 ====Les caractères utilisés pour créer des regexp avec sed ==== ====Les caractères utilisés pour créer des regexp avec sed ====
Ligne 27: Ligne 32:
  
 -> __**utilisation des expressions régulières de basiques**__,​\\ c'​est-à-dire,​ celles qui utilisent les métacaractères simples (POSIX) qui sont en communs à tous les programmes utilisant les expressions régulières.\\ En voici un rappel : -> __**utilisation des expressions régulières de basiques**__,​\\ c'​est-à-dire,​ celles qui utilisent les métacaractères simples (POSIX) qui sont en communs à tous les programmes utilisant les expressions régulières.\\ En voici un rappel :
-**''​.''​** ; **''​*''​**,​ **''​^''​**, ​ **''​$''​**,​ **''​[ ]''​**\\+**''​.''​** ; **''​*''​**,​ **''​^''​**, ​ **''​$''​**,​ **''​[ ]''​**,​**''​\<''​** , **''​\>​''​** \\
  
 __Attention au caractère__ ''​*''​ :\\ __Attention au caractère__ ''​*''​ :\\
Ligne 33: Ligne 38:
   - expression régulière :\\ ''​*''​ -> zéro ou plusieurs fois l'​élément précédent (b*BABA -> BABA, bBABA, bbBABA, bbbBABA, etc.)   - expression régulière :\\ ''​*''​ -> zéro ou plusieurs fois l'​élément précédent (b*BABA -> BABA, bBABA, bbBABA, bbbBABA, etc.)
   - expression régulière :\\ ''​.*''​ -> zéro ou plusieurs occurrence(s) de n'​importe quel caractère   - expression régulière :\\ ''​.*''​ -> zéro ou plusieurs occurrence(s) de n'​importe quel caractère
- 
--> **Il s'y ajoute pour sed __le caractère__ ''&''​ :**\\  
-- **''&''​** : Représente la chaîne à remplacer((ce qu'on ajoute autour de ''&''​ est ajouté à la chaîne remplacée)). 
  
 -> __**utilisation des classes**__ : -> __**utilisation des classes**__ :
Ligne 89: Ligne 91:
 Pour utiliser les REGEXP, il faut avant tout maîtriser les syntaxes de substitution,​ et l'​adressage. Pour utiliser les REGEXP, il faut avant tout maîtriser les syntaxes de substitution,​ et l'​adressage.
  
-=====La substitution===== 
-===Syntaxes de substitution=== 
-<​code>​ 
-s/​modèle/​remplacement/​[drapeau] fichier 
-</​code>​ 
-ou 
-<​code>​ 
-cmd | s/​modèle/​remplacement/​[drapeau] 
-</​code>​ 
->Voir : [[doc:​systeme:​sed#​la-fonction-de-substitution-s]] 
  
-=== Détail === 
-<code user> 
-s/​motif/​substitut/ ​   
- -> si motif = une regexp 
- -> alors subtitut = une chaîne de caractère 
-</​code>​ 
->Pour REGEXP, on peut utiliser la syntaxe habituelle, ou la syntaxe étendue avec l'​option ''​-r''​. 
  
-=====L'​adressage ===== 
-===Préparation=== 
-<code user> 
-echo "aaaa BBB cCcC # 12345" > ~/​sed1.txt ​ 
-</​code>​ 
- 
-<code user> 
-sed -i 's+ +\n+g' ~/sed1.txt && cat sed1.txt 
-</​code>​ 
-<​code>​ 
-aaaa 
-BBB 
-cCcC 
-# 
-12345 
-</​code>​ 
- 
-<note tip> 
-Tout cela revient au même ;-) 
- 
-<code user> 
-echo "aaaa BBB cCcC # 12345" | sed 's+ +\n+g' 
-</​code>​ 
- 
-<code user> 
-echo "aaaa BBB cCcC # 12345" | sed 's/ /\n/g' 
-</​code>​ 
- 
-<code user> 
-echo "aaaa BBB cCcC # 12345" | sed 's_ _\n_g' 
-</​code>​ 
- 
-</​note>​ 
- 
-=== Adressage avec numéro de lignes === 
- 
-  * Exemple avec la commande de suppression ''​d''​ 
- 
-<code user> 
-sed '3,4 d' ~/sed1.txt 
-</​code>​ 
-<​code>​ 
-aaaa 
-BBB 
-12345 
-</​code>​ 
-> pas d'​option : rien n'est modifié 
->''​d''​ : commande de suppression 
->''​3,​4''​ : ligne 3 et 4 
- 
-  * option ''​-e''​ et répétition le commande ''​d''​ : 
- 
-<code user> 
-sed -e '3d; 4d' ~/sed1.txt 
-</​code>​ 
-<​code>​ 
-aaaa 
-BBB 
-12345 
-</​code>​ 
-=== Adressage avec n° d'​occurrence (fonctionne sur une ligne)=== 
-<code user> 
-echo "​lalalala"​ | sed -e '​s/​la/​li/​2'​ 
-</​code>​ 
-<​code>​ 
-lalilala 
-</​code>​ 
- 
-===Adressage du n° de ligne pour la substitution=== 
-Idem que précédemment,​ on place le n° devant la commande !\\  
-Mais attention ici il s'agit de la substitution ''​s''​ : 
- 
-<code user> 
-sed -r '​6s/​BBB/​toto/'​ sed1.txt 
- 
-</​code>​ 
-<​code>​ 
-aaaa 
-BBB 
-cCcC 
-# 
-12345 
-toto 
-titi cCcC 
-/​coucou/​titi 
-</​code>​ 
-===Adressage avec délimiteurs "/ /" :=== 
-soit le fichier sed2.txt 
-<​code>​ 
-aaaa 
-BBB titi 
-cCcC 
-# 
-12345 
-BBB 
-titi cCcC 
-titi BBB 
-/​coucou/​titi 
-</​code>​ 
-<code user> 
-sed '/​^B/​d'​ ~/sed2.txt 
-</​code>​ 
-> Dans le délimiteur,​ on place la chaîne de caractères ou la regexp qui indique à sed où doit être fait l'​action de la commande. 
-<​code>​ 
-aaaa 
-cCcC 
-# 
-12345 
-titi cCcC 
-titi BBB 
-</​code>​ 
- 
-===Adressage d'une plage avec délimiteurs "/ /,/ /" :=== 
-<code user> 
-sed '/​^B/,/​^1/​d'​ ~/sed1.txt 
-</​code>​ 
-<​code>​ 
-aaaa 
-</​code>​ 
- 
-===Adressage mixte=== 
-''​n''​ et ''​m''​ sont des nombres entiers naturels 
- 
-  * sed '​n,​ms/​chaine 1/chaine 2/' fichier 
- 
->On remplace chaine 1 par chaine 2 de la ligne n à la ligne m. 
- 
-  * sed '/​chaine 1/s/chaine 2/chaine 3/' fichier 
- 
->On remplace chaine 2 par chaine 3 pour la ou les ligne(s) adressées par chaine 1. 
- 
-<code user> 
-cat sed1.txt 
-aaaa 
-BBB 
-cCcC 
-# 
-12345 
-BBB 
-titi cCcC 
-</​code>​ 
- 
-<code user> 
-sed '​2,​6s/​BBB/​GAGA/'​ sed1.txt 
-</​code>​ 
-ou 
-<code user> 
-sed -r '​2,​6s/​B{3}/​GAGA/'​ sed1.txt 
-</​code>​ 
-<​code>​ 
-aaaa 
-GAGA 
-cCcC 
-# 
-12345 
-GAGA 
-titi cCcC 
-</​code>​ 
- 
-<code user> 
-sed '/​BBB/​s/​BBB/​GAGA/'​ sed1.txt 
-</​code>​ 
-ou  
-<code user> 
-sed -r '/​B{3}/​s/​BBB/​GAGA/'​ sed1.txt 
-</​code>​ 
-<​code>​ 
-aaaa 
-GAGA 
-cCcC 
-# 
-12345 
-GAGA 
-titi cCcC 
-</​code>​ 
- 
-=== Adressage avec le tilde=== 
-<code text man sed> 
-first~step 
- Match every step' th line starting with line first. 
-</​code>​ 
-Remplaçons "​first"​ et step" par "​n"​ et "​m"​ qui sont toujours des nombres ! 
- 
-L'​expression ''​n ~ m''​ ou ''​n~m''​ signifie simplement :\\ 
- 
- "​ la E.R matche toutes les ''​n''​ième ligne(s) d'un fichier et cela en sautant un nombre de ligne égal à un écart (~) qui est lui-même égal, à la différence entre le nombre ''​m''​ avec la première ligne du fichier (c'​est-à-dire la position ordinal 1). On connaît donc le nombre de ligne sautée en faisant toujours ''​m - 1''​."​ 
- 
-Et si ''​n''​ est égal à zéro, alors le E.R. match toutes les ''​m''​ièmes lignes à partir de la ligne ''​m''​ et saute ''​m''​ - 1 ligne(s). 
- 
-  * ''​1 ~ 2''​ : matche les lignes impaires : 1ière, 3ième, 5ième, etc.\\ En effet, de la première ligne du fichier à ''​m''​ (''​m''​ = 2), il y a 1. Il sera sauté 1 ligne non-matchée et cela à partir de la ligne n°1 (''​n''​ = 1). Donc la sélection concerne la première ligne et saute 1 ligne, matche la 3ième ligne et saute 1 ligne, etc. 
-  * ''​2~3''​ : matche les lignes 2 ; 5 ; 8 ; 11\\ L'​écart sauté sera de 2 car de la position 3 (''​m''​ = 3) à la première ligne du fichier, il y a deux lignes (3-1=2), et cela commence à la deuxième ligne (''​n''​ = 2). Donc la deuxième ligne est matchée, deux lignes sont sautées (3ième et 4 ième), la 5 ième est matchée, etc. 
-  * 10 ~ 5 : sélection des lignes 10 ; 15 ; 20 ; 25 etc. 5 - 1 = 4 : Il sera sauté 4 lignes non-matchées à partir de la ligne 10. 
-  
-  * 0~5 : sélection des lignes 5 ; 10 ; 15 etc.\\ m-1 = 5-1 = 4 lignes sautées, à partir de la cinquième ligne (''​m''​ = 5 ). 
- 
-  * Exemple 1: 
-<code user> 
-sed '1~2 s_.*[coucou]_OK_'​ essai-tilde 
-</​code>​ 
-<​code>​ 
-OK/1 
-/​titi/​coucou/​2 
-OK/3 
-/​tutu/​coucou/​4 
-OK/5 
-/​nono/​coucou/​6 
-OK/7 
-/​lili/​coucou/​8 
-OK/9 
-/​fofo/​coucou/​10 
-OK/11 
-/​bibi/​coucou/​12 
-OK/13 
-/​sisi/​coucou/​14 
-OK/15 
-</​code>​ 
-  * Exemple 2 : 
-<code user> 
-sed '2~3 s_.*[coucou]_OK_'​ essai-tilde 
-</​code>​ 
-<​code>​ 
-/​toto/​coucou/​1 
-OK/2 
-/​tati/​coucou/​3 
-/​tutu/​coucou/​4 
-OK/5 
-/​nono/​coucou/​6 
-/​lulu/​coucou/​7 
-OK/8 
-/​fifi/​coucou/​9 
-/​fofo/​coucou/​10 
-OK/11 
-/​bibi/​coucou/​12 
-/​zaza/​coucou/​13 
-OK/14 
-/​baba/​coucou/​15 
-</​code>​ 
-  * Exemple 3 : 
-<code user> 
-sed '10~5 s_.*[coucou]_OK_'​ essai-tilde 
-</​code>​ 
-<​code>​ 
-/​toto/​coucou/​1 
-/​titi/​coucou/​2 
-/​tati/​coucou/​3 
-/​tutu/​coucou/​4 
-/​nani/​coucou/​5 
-/​nono/​coucou/​6 
-/​lulu/​coucou/​7 
-/​lili/​coucou/​8 
-/​fifi/​coucou/​9 
-OK/10 
-/​dodu/​coucou/​11 
-/​bibi/​coucou/​12 
-/​zaza/​coucou/​13 
-/​sisi/​coucou/​14 
-OK/15 
-</​code>​ 
-  * Exemple 4 : 
-<code user> 
-sed '0~5 s_.*[coucou]_OK_'​ essai-tilde 
-</​code>​ 
-<​code>​ 
-/​toto/​coucou/​1 
-/​titi/​coucou/​2 
-/​tati/​coucou/​3 
-/​tutu/​coucou/​4 
-OK/5 
-/​nono/​coucou/​6 
-/​lulu/​coucou/​7 
-/​lili/​coucou/​8 
-/​fifi/​coucou/​9 
-OK/10 
-/​dodu/​coucou/​11 
-/​bibi/​coucou/​12 
-/​zaza/​coucou/​13 
-/​sisi/​coucou/​14 
-OK/15 
-</​code>​ 
  
 =====Sed et les regexp simples ===== =====Sed et les regexp simples =====
Ligne 433: Ligne 139:
 <​code>​ <​code>​
 abc abc
-</​code>​ 
- 
-=== le point (.)=== 
- Un point ''​.''​ est une E.R. d'un seul caractère qui correspond à n'​importe quel caractère sauf le saut de ligne. 
- 
-  * Exemple 1 : 
-<code user> 
-echo "a B 2 ! * & : ?" | sed '​s/​./​Gaga/​g'​ 
-</​code>​ 
-<​code>​ 
-GagaGagaGagaGagaGagaGagaGagaGagaGagaGagaGagaGagaGagaGagaGaga 
-</​code>​ 
-  * Exemple 2, point<​espace>​ : 
-<code user> 
-echo "C " | sed 's/. /​Coucou/'​ 
-</​code>​ 
-<​code>​ 
-Coucou 
 </​code>​ </​code>​
  
Ligne 456: Ligne 144:
 Une E.R. d'un seul caractère suivie d'un ''​*''​ est une E.R. qui recherche zéro occurrence ou plusieurs de ce caractère.\\ ​ Une E.R. d'un seul caractère suivie d'un ''​*''​ est une E.R. qui recherche zéro occurrence ou plusieurs de ce caractère.\\ ​
 ''​c*123''​ -> ''​123''​ ou ''​c123''​ ou ''​cc123''​ ou ''​ccc123'',​ etc. ''​c*123''​ -> ''​123''​ ou ''​c123''​ ou ''​cc123''​ ou ''​ccc123'',​ etc.
 +L'​expression régulière précédente,​ doit être un caractère ordinaire, un caractère spécial précédé par ''​\'',​ ''​a.'',​ une expression rationnelle groupés((voir les parenthèses)),​ ou une expression entre crochets.
 <note important>​ <note important>​
   * S'il y a plusieurs choix, alors la chaîne de gauche la plus longue est choisie.   * S'il y a plusieurs choix, alors la chaîne de gauche la plus longue est choisie.
   * La E.R ''​.*''​ représente zéro ou plusieurs occurrences de n'​importe quel caractère.   * La E.R ''​.*''​ représente zéro ou plusieurs occurrences de n'​importe quel caractère.
 </​note>​ </​note>​
 +
  
 ===Les crochets=== ===Les crochets===
 La chaîne non-vide encadrée par ''​[ ]''​ est considérée comme une ''​E.R.''​ d'un seul caractère pouvant avoir n'​importe quelle valeur définie entre ces ''​[]''​.\\ La chaîne non-vide encadrée par ''​[ ]''​ est considérée comme une ''​E.R.''​ d'un seul caractère pouvant avoir n'​importe quelle valeur définie entre ces ''​[]''​.\\
 +
 +<code user>​echo "1 B 2 b à bB" | sed '​s/​[Bb]/​gaga/​g'</​code>​
 +
 +  1 gaga 2 gaga à gagagaga
  
 À l'​inverse,​ la E.R représentée par ''​[^...]''​ est une chaîne composée de tous caractères à l'​exclusion de ceux encadrés.\\ ​ À l'​inverse,​ la E.R représentée par ''​[^...]''​ est une chaîne composée de tous caractères à l'​exclusion de ceux encadrés.\\ ​
 //( le caractère ''​^''​ ne spécifie cette fonctionnalité d'​exclusion que s'il se trouve en première position, immédiatement après le ''​[''​ )// //( le caractère ''​^''​ ne spécifie cette fonctionnalité d'​exclusion que s'il se trouve en première position, immédiatement après le ''​[''​ )//
 +
 +>À l'​exclusion de tous caractères ! Y compris l'​espace :
 +
 +<code user>​echo "1 B 2 b à bB" | sed '​s/​[^Bb]/​gaga/​g'</​code>​
 +
 +  gagagagaBgagagagagagabgagagagagagabB
  
 Une combinaison de plusieurs E.R. d'un seul caractère est une E.R. qui correspond à l'​ensemble de ce que chaque E.R. désigne.\\ Par exemple ''​a[bB]''​ recherche ''​ab''​ ou ''​aB''​. Une combinaison de plusieurs E.R. d'un seul caractère est une E.R. qui correspond à l'​ensemble de ce que chaque E.R. désigne.\\ Par exemple ''​a[bB]''​ recherche ''​ab''​ ou ''​aB''​.
Ligne 476: Ligne 176:
  
 </​note>​ </​note>​
 +=== le point (.)===
 + Un point ''​.''​ est une E.R. d'un seul caractère qui correspond à n'​importe quel caractère sauf le saut de ligne.
  
-===Le caractère & === +  * Exemple 1 :
 <code user> <code user>
-sed 's/[0-9][0-9]*$/[&]/' ​sed1.txt+echo "a B 2 ! * & : ?" | sed 's/./Gaga/g'
 </​code>​ </​code>​
 <​code>​ <​code>​
-aaaa +GagaGagaGagaGagaGagaGagaGagaGagaGagaGagaGagaGagaGagaGagaGaga
-BBB +
-cCcC +
-+
-[12345] +
-BBB +
-titi cCcC+
 </​code>​ </​code>​
 +  * Exemple 2, point<​espace>​ :
 <code user> <code user>
-sed 's/[0-9][0-9]*$/(&)/' ​sed1.txt+echo "C " | sed 's//Coucou/'
 </​code>​ </​code>​
 <​code>​ <​code>​
-aaaa +Coucou
-BBB +
-cCcC +
-+
-(12345) +
-BBB +
-titi cCcC+
 </​code>​ </​code>​
  
utilisateurs/hypathie/tutos/sed-et-les-expressions-rationnelles.1406090105.txt.gz · Dernière modification: 23/07/2014 06:35 par Hypathie

Pied de page des forums

Propulsé par FluxBB