logo Debian Debian Debian-France Debian-Facile Debian-fr.org Forum-Debian.fr Debian ? Communautés logo inclusivité

Debian-facile

Bienvenue sur Debian-Facile, site d'aide pour les nouveaux utilisateurs de Debian.

Vous n'êtes pas identifié(e).


L'icône rouge permet de télécharger chaque page du wiki visitée au format PDF et la grise au format ODT → ODT PDF Export

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
Prochaine révision
Révision précédente
utilisateurs:hypathie:tutos:sed-et-les-expressions-rationnelles [27/07/2014 10:08]
Hypathie [Les adressages de la commande s]
utilisateurs:hypathie:tutos:sed-et-les-expressions-rationnelles [09/08/2014 07:30] (Version actuelle)
Hypathie [Sed et les regexp simples]
Ligne 6: Ligne 6:
  
 =====Contexte d'​utilisation des ER ===== =====Contexte d'​utilisation des ER =====
 +On utilise les expressions rationnelles simples ou étendues (//ERE//) avec sed
  
->Avec sed les ER s'utilisent lorsqu'​on veut modifier un fichier texte+  * pour les adressages par l'encadrement,​ [[utilisateurs:​hypathie:​tutos:​sed-par-la-methode-structuraliste?&#​adressage-simple|simple]] et [[utilisateurs:​hypathie:​tutos:​sed-par-la-methode-structuraliste?&#​adressage-double|double]]
->​Il ​s'agit de matcher un ou des éléments d'un fichier texte par une REGEXP et de remplacer, ce ou ces éléments ciblés du texte, par autres choses ou rien.  +  * avec la commande ​:  
->Ou encoreelles servent à ajouter, à un endroit précisé ​par la regexp, un ou des éléments au texte.+    * ''​s/​motif/​substitut/​[options_de_s]''​ où "​motif"​ peut être une //​ER// ​ou une //ERE// 
 +    * qui utilise aussi des ER pour ses adressages
 + 
 +Dans ce qui suitseule [[utilisateurs:​hypathie:​tutos:​sed-par-la-methode-structuraliste?&#​la-commande-s|la commande s]] servira pour illustrer d'​exemples l'​utilisation ​des //ER// et //ERE//.\\  
 +Pour l'​utilisation globale de sed voir [[utilisateurs:​hypathie:​tutos:​sed-par-la-methode-structuraliste|sed par la méthode structuraliste]].
  
 ====Les caractères utilisés pour créer des regexp avec sed ==== ====Les caractères utilisés pour créer des regexp avec sed ====
Ligne 27: Ligne 32:
  
 -> __**utilisation des expressions régulières de basiques**__,​\\ c'​est-à-dire,​ celles qui utilisent les métacaractères simples (POSIX) qui sont en communs à tous les programmes utilisant les expressions régulières.\\ En voici un rappel : -> __**utilisation des expressions régulières de basiques**__,​\\ c'​est-à-dire,​ celles qui utilisent les métacaractères simples (POSIX) qui sont en communs à tous les programmes utilisant les expressions régulières.\\ En voici un rappel :
-**''​.''​** ; **''​*''​**,​ **''​^''​**, ​ **''​$''​**,​ **''​[ ]''​**\\+**''​.''​** ; **''​*''​**,​ **''​^''​**, ​ **''​$''​**,​ **''​[ ]''​**,​**''​\<''​** , **''​\>​''​** \\
  
 __Attention au caractère__ ''​*''​ :\\ __Attention au caractère__ ''​*''​ :\\
Ligne 86: Ligne 91:
 Pour utiliser les REGEXP, il faut avant tout maîtriser les syntaxes de substitution,​ et l'​adressage. Pour utiliser les REGEXP, il faut avant tout maîtriser les syntaxes de substitution,​ et l'​adressage.
  
-=====La substitution===== 
-===Syntaxes de substitution=== 
-<​code>​ 
-s/​modèle/​remplacement/​[drapeau] fichier 
-</​code>​ 
-ou 
-<​code>​ 
-cmd | s/​modèle/​remplacement/​[drapeau] 
-</​code>​ 
->Voir : [[doc:​systeme:​sed#​la-fonction-de-substitution-s]] 
  
-=== Détail === 
-<code user> 
-s/​motif/​substitut/ ​   
- -> si motif = une regexp 
- -> alors subtitut = une chaîne de caractère 
-</​code>​ 
->Pour REGEXP, on peut utiliser la syntaxe habituelle, ou la syntaxe étendue avec l'​option ''​-r''​. 
  
-=====Les adressages de la commande s ===== 
-===Préparation=== 
-<code user> 
-echo "aaaa BBB cCcC # 12345" > ~/​sed1.txt ​ 
-</​code>​ 
  
-<code user> 
-sed -i 's+ +\n+g' ~/sed1.txt && cat sed1.txt 
-</​code>​ 
-<​code>​ 
-aaaa 
-BBB 
-cCcC 
-# 
-12345 
-</​code>​ 
- 
-<note tip> 
-Tout cela revient au même ;-) 
- 
-<code user> 
-echo "aaaa BBB cCcC # 12345" | sed 's+ +\n+g' 
-</​code>​ 
- 
-<code user> 
-echo "aaaa BBB cCcC # 12345" | sed 's/ /\n/g' 
-</​code>​ 
- 
-<code user> 
-echo "aaaa BBB cCcC # 12345" | sed 's_ _\n_g' 
-</​code>​ 
- 
-</​note>​ 
-===Adressage du n° de ligne=== 
- 
-<code user> 
-sed -r '​6s/​BBB/​toto/'​ sed1.txt 
- 
-</​code>​ 
-<​code>​ 
-aaaa 
-BBB 
-cCcC 
-# 
-12345 
-toto 
-titi cCcC 
-/​coucou/​titi 
-</​code>​ 
- 
-=== Adressage d'un champ avec numéro de lignes === 
- 
-  * Exemple de la ligne 2 à la ligne 4 
-<code user> 
-sed '​2,​4s/​.*/​GAGA/'​ sed1.txt 
-</​code>​ 
-<​code>​ 
-aaaa 
-GAGA 
-GAGA 
-GAGA 
-12345 
-</​code>​ 
- 
-===Adressage de ligne(s) avec délimiteur "/​regexp/"​=== 
-On remplace chaineB par chaineC pour la ou les ligne(s) adressées par chaineA 
- 
-  sed '/​chaineA/​s/​chaineB/​chaineC/'​ fichier 
- 
-<code user> 
-sed '/​BBB/​s/​BBB/​GAGA/'​ sed1.txt 
-</​code>​ 
-ou  
-<code user> 
-sed -r '/​B{3}/​s/​BBB/​GAGA/'​ sed1.txt 
-</​code>​ 
-<​code>​ 
-aaaa 
-GAGA 
-cCcC 
-# 
-12345 
-GAGA 
-titi cCcC 
-</​code>​ 
- 
-===Adressage d'une plage avec délimiteurs "/ /,/ /" :=== 
-<code user> 
-sed '/​^B/,/​^1/​d'​ ~/sed1.txt 
-</​code>​ 
-<​code>​ 
-aaaa 
-</​code>​ 
- 
-===Adressages mixtes : '​n,/​regexp/' ​ ou '/​regexp/,​n'​ === 
- 
-__1) '​n,/​regexp/​s/​chaineA/​chaineB'​__ 
- 
-''​n''​ est un nombre entier. 
-On remplace chaîneA par chaîneB de la ligne ''​n''​ à la ligne comportant /regexp/.\\ 
- 
-  * Préparation : fichier "​sed1.txt 
-<​code>​ 
-AAAA 2 fraise 
-3 BBB orange 
-AAAA 6 cerise 
-BBB 1 abricot 
-9 AAAA pomme 
-BBB 5 poire 
-</​code>​ 
- 
-  * Substitution de la ligne n° 2 jusqu'​à la ligne de chaîne "​cerise"​ 
-<code user> 
-sed '​2,/​cerise/​s/​[[:​digit:​]]/​GAGA/'​ sed1.txt 
-</​code>​ 
-<​code>​ 
-AAAA 2 fraise 
-GAGA BBB orange 
-AAAA GAGA cerise 
-BBB 1 abricot 
-9 AAAA pomme 
-BBB 5 poire 
-</​code>​ 
- 
-__2) '/​regexp/​ns/​chaîneA/​chaîneB/'​__ 
- 
-  * Substitution à partir de la chaîne "​orange"​ jusqu'​à la ligne n° 5 
- 
-<code user> 
-sed '/​orange/,​5s/​[[:​digit:​]]/​GAGA/'​ sed1.txt 
-</​code>​ 
-<​code>​ 
-AAAA 2 fraise 
-GAGA BBB orange 
-AAAA GAGA cerise 
-BBB GAGA abricot 
-GAGA AAAA pomme 
-BBB 5 poire 
-</​code>​ 
- 
-<note important>​ 
-Il faut trois "​genres d'​objets"​. Car si /regexp/ d'​adressage correspond à chaîne, alors n n'​arrêtera pas la substitution. 
-<code user> 
-sed '/​[[:​digit:​]]/,​3s/​[[:​digit:​]]/​GAGA/'​ sed1.txt 
-</​code>​ 
-> Cette ligne ne remplacera pas un chiffre par "​GAGA"​ de la première ligne où il y a un chiffre à la ligne 3. 
-<​code>​ 
-AAAA GAGA fraise 
-GAGA BBB orange 
-AAAA GAGA cerise 
-BBB GAGA abricot 
-GAGA AAAA pomme 
-BBB GAGA poire 
-</​code>​ 
-</​note>​ 
- 
-=== Adressage avec n° d'​occurrence (fonctionne sur une ligne)=== 
-<code user> 
-echo "​lalalala"​ | sed -e '​s/​la/​li/​2'​ 
-</​code>​ 
-<​code>​ 
-lalilala 
-</​code>​ 
- 
-===Adressage du retour chariot === 
-Par exemple, pour matcher une chaîne constituée de deux chaînes égales séparées par un retour à la ligne, du fichier essai : 
-<​code>​ 
-abcd 
-abcd 
-coucou coucou 
-</​code>​ 
-<code user> 
-  sed -r '​N;​s/​^(.*)\n\1$/​X/​g'​ essai 
-</​code>​ 
-<​code>​ 
-X 
-coucou coucou 
-</​code>​ 
- 
-=== Adressage avec le tilde=== 
-<code text man sed> 
-first~step 
- Match every step' th line starting with line first. 
-</​code>​ 
-Remplaçons "​first"​ et step" par "​n"​ et "​m"​ qui sont toujours des nombres ! 
- 
-L'​expression ''​n ~ m''​ ou ''​n~m''​ signifie simplement :\\ 
- 
- "​ la E.R matche toutes les ''​n''​ième ligne(s) d'un fichier et cela en sautant un nombre de ligne égal à un écart (~) qui est lui-même égal, à la différence entre le nombre ''​m''​ avec la première ligne du fichier (c'​est-à-dire la position ordinal 1). On connaît donc le nombre de ligne sautée en faisant toujours ''​m - 1''​."​ 
- 
-Et si ''​n''​ est égal à zéro, alors le E.R. match toutes les ''​m''​ièmes lignes à partir de la ligne ''​m''​ et saute ''​m''​ - 1 ligne(s). 
- 
-  * ''​1 ~ 2''​ : matche les lignes impaires : 1ière, 3ième, 5ième, etc.\\ En effet, de la première ligne du fichier à ''​m''​ (''​m''​ = 2), il y a 1. Il sera sauté 1 ligne non-matchée et cela à partir de la ligne n°1 (''​n''​ = 1). Donc la sélection concerne la première ligne et saute 1 ligne, matche la 3ième ligne et saute 1 ligne, etc. 
-  * ''​2~3''​ : matche les lignes 2 ; 5 ; 8 ; 11\\ L'​écart sauté sera de 2 car de la position 3 (''​m''​ = 3) à la première ligne du fichier, il y a deux lignes (3-1=2), et cela commence à la deuxième ligne (''​n''​ = 2). Donc la deuxième ligne est matchée, deux lignes sont sautées (3ième et 4 ième), la 5 ième est matchée, etc. 
-  * 10 ~ 5 : sélection des lignes 10 ; 15 ; 20 ; 25 etc. 5 - 1 = 4 : Il sera sauté 4 lignes non-matchées à partir de la ligne 10. 
-  
-  * 0~5 : sélection des lignes 5 ; 10 ; 15 etc.\\ m-1 = 5-1 = 4 lignes sautées, à partir de la cinquième ligne (''​m''​ = 5 ). 
- 
-  * Exemple 1: 
-<code user> 
-sed '1~2 s_.*[coucou]_OK_'​ essai-tilde 
-</​code>​ 
-<​code>​ 
-OK/1 
-/​titi/​coucou/​2 
-OK/3 
-/​tutu/​coucou/​4 
-OK/5 
-/​nono/​coucou/​6 
-OK/7 
-/​lili/​coucou/​8 
-OK/9 
-/​fofo/​coucou/​10 
-OK/11 
-/​bibi/​coucou/​12 
-OK/13 
-/​sisi/​coucou/​14 
-OK/15 
-</​code>​ 
-  * Exemple 2 : 
-<code user> 
-sed '2~3 s_.*[coucou]_OK_'​ essai-tilde 
-</​code>​ 
-<​code>​ 
-/​toto/​coucou/​1 
-OK/2 
-/​tati/​coucou/​3 
-/​tutu/​coucou/​4 
-OK/5 
-/​nono/​coucou/​6 
-/​lulu/​coucou/​7 
-OK/8 
-/​fifi/​coucou/​9 
-/​fofo/​coucou/​10 
-OK/11 
-/​bibi/​coucou/​12 
-/​zaza/​coucou/​13 
-OK/14 
-/​baba/​coucou/​15 
-</​code>​ 
-  * Exemple 3 : 
-<code user> 
-sed '10~5 s_.*[coucou]_OK_'​ essai-tilde 
-</​code>​ 
-<​code>​ 
-/​toto/​coucou/​1 
-/​titi/​coucou/​2 
-/​tati/​coucou/​3 
-/​tutu/​coucou/​4 
-/​nani/​coucou/​5 
-/​nono/​coucou/​6 
-/​lulu/​coucou/​7 
-/​lili/​coucou/​8 
-/​fifi/​coucou/​9 
-OK/10 
-/​dodu/​coucou/​11 
-/​bibi/​coucou/​12 
-/​zaza/​coucou/​13 
-/​sisi/​coucou/​14 
-OK/15 
-</​code>​ 
-  * Exemple 4 : 
-<code user> 
-sed '0~5 s_.*[coucou]_OK_'​ essai-tilde 
-</​code>​ 
-<​code>​ 
-/​toto/​coucou/​1 
-/​titi/​coucou/​2 
-/​tati/​coucou/​3 
-/​tutu/​coucou/​4 
-OK/5 
-/​nono/​coucou/​6 
-/​lulu/​coucou/​7 
-/​lili/​coucou/​8 
-/​fifi/​coucou/​9 
-OK/10 
-/​dodu/​coucou/​11 
-/​bibi/​coucou/​12 
-/​zaza/​coucou/​13 
-/​sisi/​coucou/​14 
-OK/15 
-</​code>​ 
- 
-===Le caractère & === 
- ​**''&''​** : Représente la chaîne à remplacer.\\ ​ 
-Si le signe ''&''​ est présent dans le motif de remplacement,​ alors, il sera substitué par le motif de recherche en entier. 
-<code text sed1.txt>​ 
-aaaa 
-BBB titi 
-cCcC 
-# 
-12345 
-BBB 
-titi cCcC 
-titi BBB 
-/​coucou/​titi 
-</​code>​ 
- 
-  * Entourer de crochet la chaîne "​12345"​ 
- 
-<code user> 
-sed '​s/​[0-9][0-9]*$/​[&​]/'​ sed1.txt 
-</​code>​ 
-<​code>​ 
-aaaa 
-BBB 
-cCcC 
-# 
-[12345] 
-BBB 
-titi cCcC 
-</​code>​ 
- 
-  * Faire ensorte que le fichier "​sed1.txt"​ ne comporte deux lignes "titi grominet"​ 
-<code user> 
-sed -re '​s/​titi/&​ grosminet/'​ -e\ 
- '/​titi/​!d'​ -e\ 
- '​s/​(BBB|cCcC)//'​ -e\ 
- '/​^ /d' -e\ 
- '/​^\/​.*/​d'​ -i\ 
- ​sed1.txt 
-</​code>​ 
- 
-<code user> 
-cat sed1.txt 
-</​code>​ 
-<​code>​ 
-titi grosminet ​ 
-titi grosminet 
-</​code>​ 
- 
-===le caractère de désignation de champ \n === 
-''​n''​ est le numéro de champ d'une partie du motif de recherche, chaque partie du motif de recherche étant délimitée ainsi ''​\(sous-motif\)''​. 
-  * Exemple inverser la deuxième ligne de "​sed1.txt"​ 
-<code user> 
- 
-</​code>​ 
-sed -e '​2s/​\(titi\) \(grosminet\)/​\2 \1/g' sed1.txt 
-<​code>​ 
-titi grosminet ​ 
-grosminet titi 
-</​code>​ 
 =====Sed et les regexp simples ===== =====Sed et les regexp simples =====
 ====Explications==== ====Explications====
Ligne 506: Ligne 153:
 ===Les crochets=== ===Les crochets===
 La chaîne non-vide encadrée par ''​[ ]''​ est considérée comme une ''​E.R.''​ d'un seul caractère pouvant avoir n'​importe quelle valeur définie entre ces ''​[]''​.\\ La chaîne non-vide encadrée par ''​[ ]''​ est considérée comme une ''​E.R.''​ d'un seul caractère pouvant avoir n'​importe quelle valeur définie entre ces ''​[]''​.\\
 +
 +<code user>​echo "1 B 2 b à bB" | sed '​s/​[Bb]/​gaga/​g'</​code>​
 +
 +  1 gaga 2 gaga à gagagaga
  
 À l'​inverse,​ la E.R représentée par ''​[^...]''​ est une chaîne composée de tous caractères à l'​exclusion de ceux encadrés.\\ ​ À l'​inverse,​ la E.R représentée par ''​[^...]''​ est une chaîne composée de tous caractères à l'​exclusion de ceux encadrés.\\ ​
 //( le caractère ''​^''​ ne spécifie cette fonctionnalité d'​exclusion que s'il se trouve en première position, immédiatement après le ''​[''​ )// //( le caractère ''​^''​ ne spécifie cette fonctionnalité d'​exclusion que s'il se trouve en première position, immédiatement après le ''​[''​ )//
 +
 +>À l'​exclusion de tous caractères ! Y compris l'​espace :
 +
 +<code user>​echo "1 B 2 b à bB" | sed '​s/​[^Bb]/​gaga/​g'</​code>​
 +
 +  gagagagaBgagagagagagabgagagagagagabB
  
 Une combinaison de plusieurs E.R. d'un seul caractère est une E.R. qui correspond à l'​ensemble de ce que chaque E.R. désigne.\\ Par exemple ''​a[bB]''​ recherche ''​ab''​ ou ''​aB''​. Une combinaison de plusieurs E.R. d'un seul caractère est une E.R. qui correspond à l'​ensemble de ce que chaque E.R. désigne.\\ Par exemple ''​a[bB]''​ recherche ''​ab''​ ou ''​aB''​.
utilisateurs/hypathie/tutos/sed-et-les-expressions-rationnelles.1406448517.txt.gz · Dernière modification: 27/07/2014 10:08 par Hypathie

Pied de page des forums

Propulsé par FluxBB