logo Debian Debian Debian-France Debian-Facile Debian-fr.org Forum-Debian.fr Debian ? Communautés logo inclusivité

Debian-facile

Bienvenue sur Debian-Facile, site d'aide pour les nouveaux utilisateurs de Debian.

Vous n'êtes pas identifié(e).


L'icône rouge permet de télécharger chaque page du wiki visitée au format PDF et la grise au format ODT → ODT PDF Export

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
Prochaine révision
Révision précédente
Prochaine révision Les deux révisions suivantes
utilisateurs:hypathie:tutos:accueil [20/07/2014 13:28]
Hypathie [Contexte d'utilisation des ER]
utilisateurs:hypathie:tutos:accueil [21/07/2014 00:40]
Hypathie [Sed et les regexp simples]
Ligne 31: Ligne 31:
 **''​.''​** ; **''​*''​**,​ **''​^''​**, ​ **''​$''​**,​ **''​[ ]''​**\\ **''​.''​** ; **''​*''​**,​ **''​^''​**, ​ **''​$''​**,​ **''​[ ]''​**\\
  
-__Attention au caractère ​''​*''​__:\\ +__Attention au caractère__ ​''​*''​ :\\ 
-  - comme métacaractère :\\ ''​*''​ -> zéro ou plus occurrences ​de n'​importe quel caractère +  - comme métacaractère :\\ ''​*''​ -> zéro ou plusieurs occurrence(s) ​de n'​importe quel caractère 
-  - pour une ER du shell :\\ ''​*''​ -> zéro ou plusieurs fois l'​élément précédent (ab*-> abbcabbbc, etc. +  - expression régulière ​:\\ ''​*''​ -> zéro ou plusieurs fois l'​élément précédent (b*BABA -> BABAbBABA, bbBABA, bbbBABA, etc.) 
-  - expression régulière :\\ ''​x*''​ -> zéro occurrence ou plus de "​x"​ +  - expression régulière :\\ ''​.*''​ -> zéro ou plusieurs occurrence(s) ​de n'​importe quel caractère
-  - expression régulière :\\ ''​.*''​ -> zéro ou plus occurrences ​de n'​importe quel caractère+
  
 -> **Il s'y ajoute pour sed __le caractère__ ''&''​ :**\\  -> **Il s'y ajoute pour sed __le caractère__ ''&''​ :**\\ 
Ligne 59: Ligne 58:
 |''<​nowiki>​[[:​xdigit:​]]</​nowiki>''​ | Chiffres hexadécimaux [0-9 a-f A-F] | |''<​nowiki>​[[:​xdigit:​]]</​nowiki>''​ | Chiffres hexadécimaux [0-9 a-f A-F] |
  
-  * **avec ''​-r''​ :** +  * **Avec ''​-r''​ :** 
 +  
 +-> **On peut utiliser tous les __caractères vus précédemment__.**\\  
 +L'​ajout de l'​option -r ne change pas leur signification.
  
 -> **On peut utiliser __les caractères POSIX étendus__ :**\\ -> **On peut utiliser __les caractères POSIX étendus__ :**\\
Ligne 139: Ligne 141:
 </​code>​ </​code>​
  
-voir : [[utilisateurs:​hypathie:​tutos:​accueil#​changer-de-selecteur-d-adressage|changer de sélecteur d'​adressage]] 
 </​note>​ </​note>​
  
Ligne 168: Ligne 169:
 12345 12345
 </​code>​ </​code>​
-===Adressage avec délimiteurs "/ /" :===+=== Adressage avec n° occurrence (fonctionne sur une ligne)===
 <code user> <code user>
-sed '/^B/d' ~/sed1.txt+echo "​lalalala"​ | sed -e 's/la/li/2'
 </​code>​ </​code>​
 <​code>​ <​code>​
-aaaa +lalilala
-cCcC +
-+
-12345+
 </​code>​ </​code>​
  
-===Changer de sélecteur d'​adressage ​===+===Adressage du n° ligne pour la substitution=== 
 +Idem que précédemment,​ on place le n° devant la commande !\\  
 +Mais attention ici il s'agit de la substitution ''​s''​ : 
 <code user> <code user>
-echo "/coucou/titi" >> sed1.txt && cat sed1.txt+sed -r '6s/BBB/toto/' ​sed1.txt 
 + 
 +</​code>​ 
 +<​code>​
 aaaa aaaa
 BBB BBB
Ligne 187: Ligne 191:
 # #
 12345 12345
-BBB+toto
 titi cCcC titi cCcC
 /​coucou/​titi /​coucou/​titi
 </​code>​ </​code>​
-<code user> +===Adressage avec délimiteurs "/ /" :=== 
-sed 's/\/coucou\/​titi/​gaga/'​ sed1.txt +soit le fichier sed2.txt
-</​code>​+
 <​code>​ <​code>​
 aaaa aaaa
-BBB+BBB titi
 cCcC cCcC
 # #
Ligne 202: Ligne 205:
 BBB BBB
 titi cCcC titi cCcC
-gaga+titi BBB 
 +/​coucou/​titi
 </​code>​ </​code>​
- 
-> Qu'on peut remplacer par : 
- 
 <code user> <code user>
- sed 's_/coucou/titi_gaga_' ​sed1.txt+sed '/^B/d' ​~/sed2.txt
 </​code>​ </​code>​
 +> Dans le délimiteur,​ on place la chaîne de caractères ou la regexp qui indique à sed où doit être fait l'​action de la commande.
 <​code>​ <​code>​
 aaaa aaaa
-BBB 
 cCcC cCcC
 # #
 12345 12345
-BBB 
 titi cCcC titi cCcC
-gaga +titi BBB
- +
 </​code>​ </​code>​
 +
 ===Adressage d'une plage avec délimiteurs "/ /,/ /" :=== ===Adressage d'une plage avec délimiteurs "/ /,/ /" :===
 <code user> <code user>
Ligne 285: Ligne 285:
 </​code>​ </​code>​
  
-=====Exercices : Sed et les regexp simples ===== +=====Sed et les regexp simples ===== 
- +====Explications==== 
-=== le point (.)===+===le caractère ^ === 
 +Le caractère ''​^''​ n'est spécial qu'en début d'E.R. ou immédiatement à gauche dans une chaîne encadrée par des '​[]'​ (voir : "les crochets"​). 
 +  * Exemple 1 : supprimer la ligne comprenant le caractère "#",​ du fichier :
 <code user> <code user>
-cat sed1.txt +cat >> ~/sed.txt <<EOF 
-aaaa +> abc 
-BBB +#ABC 
-cCcC +> EOF
-+
-12345 +
-BBB +
-titi cCcC+
 </​code>​ </​code>​
-  * Exemple 1 :+
 <code user> <code user>
-sed 's/./GAGA/' ​sed1.txt+sed '/^#d' ​sed.txt
 </​code>​ </​code>​
 <​code>​ <​code>​
-GAGAaaa +abc
-GAGABB +
-GAGACcC +
-GAGA +
-GAGA2345 +
-GAGABB +
-GAGAiti cCcC+
 </​code>​ </​code>​
-  * Exemple 2, point<​espace> ​:+  * Exemple 2 : supprimer le caractère # seulement du fichier sed.txt
 <code user> <code user>
-sed 's/. /​GAGA/'​ sed1.txt +sed -e '/^#/s/#ABC/ABC/' sed.txt 
-aaaa +</code
-BBB +
-cCcC +
-# +
-12345 +
-BBB +
-titGAGAcCcC +
-</​code>​ +
-  * Exemple 3 : +
-<code user> +
-sed '/./s/#/GAGA/' ​sed1.txt +
-aaaa +
-BBB +
-cCcC +
-GAGA +
-12345 +
-BBB +
-titi cCcC +
-</​code>​ +
- +
-=== le caractère ^ === +
-  * suppression de la ligne commençant par #  +
- +
-<code user> +
-sed '/^#/ d' ~/sed1.txt +
-</code>+
 <​code>​ <​code>​
-aaaa +abc 
-BBB +ABC
-cCcC +
-12345 +
-BBB +
-titi cCcC+
 </​code>​ </​code>​
  
-  * Ne pas supprimer le ligne qui commence par #+  * Exemple 3 : ne pas supprimer le ligne qui commence par #
  
 <code user> <code user>
-sed '/^#/ !d' ~/sed1.txt+sed '/^#/ !d' ~/sed.txt
 </​code>​ </​code>​
 <​code>​ <​code>​
 # #
 </​code>​ </​code>​
 +===Le caractère $ ===
 +Le caractère ''​$''​ représente la fin de la ligne.
 +//(Le caractères ''​$''​ n'est spécial qu'en fin d'E.R ou d'un ensemble d'​E.R.)//​
  
-===le caractère ($)===+  * Exemple : supprimer la ligne finissant par "​C"​
 <code user> <code user>
-sed '/[C]$/s/[Cc]./GAGA/g' ​sed1.txt+sed -e 's/.*C$//' -e '/^$d' ​sed.txt 
 </​code>​ </​code>​
 <​code>​ <​code>​
-aaaa +abc
-BBB +
-GAGAGAGA +
-+
-12345 +
-BBB +
-titi GAGAGAGA+
 </​code>​ </​code>​
  
-=== Point, étoile, crochets===+=== le point (.)=== 
 + Un point ''​.''​ est une E.R. d'un seul caractère qui correspond à n'​importe quel caractère sauf le saut de ligne. 
 + 
 +  * Exemple 1 :
 <code user> <code user>
-sed '/[C]$/s/[Cc]./GAGA/​g' ​sed1.txt+echo "a B 2 ! * & : ?" | sed 's/./Gaga/g'
 </​code>​ </​code>​
 <​code>​ <​code>​
-aaaa +GagaGagaGagaGagaGagaGagaGagaGagaGagaGagaGagaGagaGagaGagaGaga
-BBB +
-GAGAGAGA +
-+
-12345 +
-BBB +
-titi GAGAGAGA+
 </​code>​ </​code>​
 +  * Exemple 2, point<​espace>​ :
 <code user> <code user>
-sed '/[C]$/s/[Cc].*/GAGA/g' ​sed1.txt+echo "C " | sed 's/. /Coucou/'
 </​code>​ </​code>​
 <​code>​ <​code>​
-aaaa +Coucou
-BBB +
-GAGA +
-+
-12345 +
-BBB +
-titi GAGA+
 </​code>​ </​code>​
 +
 +===L'​étoile (*)===
 +Une E.R. d'un seul caractère suivie d'un ''​*''​ est une E.R. qui recherche zéro occurrence ou plusieurs de ce caractère.\\ ​
 +''​c*123''​ -> ''​123''​ ou ''​c123''​ ou ''​cc123''​ ou ''​ccc123'',​ etc.
 +<note important>​
 +  * S'il y a plusieurs choix, alors la chaîne de gauche la plus longue est choisie.
 +  * La E.R ''​.*''​ représente zéro ou plusieurs occurrences de n'​importe quel caractère.
 +</​note>​
 +
 +===Les crochets===
 +La chaîne non-vide encadrée par ''​[ ]''​ est considérée comme une ''​E.R.''​ d'un seul caractère pouvant avoir n'​importe quelle valeur définie entre ces ''​[]''​.\\
 +
 +À l'​inverse,​ la E.R représentée par ''​[^...]''​ est une chaîne composée de tous caractères à l'​exclusion de ceux encadrés.\\ ​
 +//( le caractère ''​^''​ ne spécifie cette fonctionnalité d'​exclusion que s'il se trouve en première position, immédiatement après le ''​[''​ )//
 +
 +Une combinaison de plusieurs E.R. d'un seul caractère est une E.R. qui correspond à l'​ensemble de ce que chaque E.R. désigne.\\ Par exemple ''​a[bB]''​ recherche ''​ab''​ ou ''​aB''​.
 +
 +<​note>​
 +Les caractères ​ ''​.''​ , ''​*''​ , ''​[''​ et ''​\''​ sont toujours spéciaux sauf s'ils sont encadrés entre ''​[]''​.
 +
 +  * ''​[A-Za-z-]''​ -> Tout caractère alpha ou le ''​-''​.
 +  * ''​[]a-z]''​ -> Tout caractère alpha ou le ''​]''​.
 +
 +</​note>​
 +
 +===Le caractère & ===
  
 <code user> <code user>
-sed '/[1-5]/ d' ~/sed1.txt+sed 's/[0-9][0-9]*$/[&]/' ​sed1.txt
 </​code>​ </​code>​
 <​code>​ <​code>​
Ligne 406: Ligne 384:
 cCcC cCcC
 # #
 +[12345]
 BBB BBB
 titi cCcC titi cCcC
 </​code>​ </​code>​
- 
 <code user> <code user>
-sed 's/[1-5]/gaga/g' sed1.txt+sed 's/[0-9][0-9]*$/(&)/' sed1.txt
 </​code>​ </​code>​
 <​code>​ <​code>​
Ligne 418: Ligne 396:
 cCcC cCcC
 # #
-gagagagagagagagagaga+(12345)
 BBB BBB
 titi cCcC titi cCcC
 </​code>​ </​code>​
 +
 +
 +
 +=====Sed -r : les caractères étendues =====
 +Rappel :
 +
 + ''​+''​ ; ''?''​ ; ''​|''​ ; ''​( ​  ​)''​ ; ''​[''​ ; ''​{ ​  ​}''​
 +
 +=== le caractère (+)===
 +
 +  * substituer une ou plusieurs fois "​z"​ par OK
  
 <code user> <code user>
-sed '/[1-5]/s/[1-5]*/gaga/​g' ​sed1.txt+echo "abc azbc azzbc azzzbc azzzzbc"​ | sed -r 's/az+bc/OK/g' 
 +abc OK OK OK OK
 </​code>​ </​code>​
-<​code>​ + 
-aaaa +=== Le caractère ( ? )=== 
-BBB + 
-cCcC +  * substituer zéro ou une fois "​z"​ par OK 
-# + 
-gaga +<code user> 
-BBB +echo "abc azbc azzbc azzzbc azzzzbc"​ | sed -r '​s/​az?​bc/​OK/​g'​ 
-titi cCcC+OK OK azzbc azzzbc azzzzbc
 </​code>​ </​code>​
  
-===Le caractère & ===+=== Le ou ( | )=== 
 + 
 +  * substituer ​ ab ou cd par OK
  
 <code user> <code user>
-sed 's/[0-9][0-9]*$/[&]/' ​sed1.txt+echo "abef cdef efgh abcd" | sed -r 's/ab|cd/OK/g' 
 +OKef OKef efgh OKOK
 </​code>​ </​code>​
-<​code>​ + 
-aaaa +  * substituer ab ou cd par OK et effacer le reste 
-BBB + 
-cCcC +<​code ​user
-# +echo "​lflfabef cdef efgh ftyabcdopm"​ | sed -r\ 
-[12345+ 's/^.*[ab|cd]*/​OK/​g'​ 
-BBB +OK
-titi cCcC+
 </​code>​ </​code>​
 +
 +===Les parenthèses ===
 <code user> <code user>
-sed 's/​[0-9][0-9]*$/(&)/' ​sed1.txt+echo "a b c d e f" | sed -r 's/(b|e)/X/g'
 </​code>​ </​code>​
 <​code>​ <​code>​
-aaaa +a X c d X f
-BBB +
-cCcC +
-+
-(12345) +
-BBB +
-titi cCcC+
 </​code>​ </​code>​
  
-===Les classes===+===Parenthèses et inversion de champs=== 
 +Avec la commande ''​s''​ (substitution),​ on peut de définir plusieurs E.R mises entre parenthèses.\\ 
 +Cela permet de faire une inversion en se servant du séparateur de chaque champ à matcher.\\ 
 + 
 +  * Exemple :
 <code user> <code user>
-sed 's/[[:digit:]]/gaga/g' ​sed1.txt+echo "​coucou:​toto"​ | sed -r 's/^(.*):(.*)/\2:\1/'
 </​code>​ </​code>​
 <​code>​ <​code>​
-aaaa +toto:coucou
-BBB +
-cCcC +
-+
-gagagagagagagagagaga +
-BBB +
-titi cCcC+
 </​code>​ </​code>​
  
 +===Les accolades { et } ===
 +Un seul caractère suivie par ''​{m}'',​ ''​{m,​}'',​ ou ''​{m,​n}''​ est une E.R. qui correspond au caractère précédant ''​{''​ s'il est présent, exactement m fois (''​m''​);​ au moins m fois (''​m,''​);​ entre "​m"​ et "​n"​ fois (''​m,​n''​).\\ ​
 +'​m'​ et '​n'​ doivent être des entiers positifs ou nuls inférieurs à 256.
 +
 +   * substituer seulement "aaa, aaaa et aaaaa" par OK
 <code user> <code user>
-sed 's/[[:​alpha:​]]*/gaga/​g' ​sed1.txt+echo "a aa aaa aaaa aaaaaa aaaaaaaa aaaaaaa"​ | sed -r\ 
 + 's/a{3,5}/OK/g' 
 +a aa OK OK OKa OKOK OKaa
 </​code>​ </​code>​
-<​code>​ + 
-gaga +  * substituer trois "​a"​ et plus par OK 
-gaga + 
-gaga +<​code ​user
-gaga#gaga +echo "a aa aaa aaaa aaaaaa aaaaaaaa"​ | sed -r 's/a{3,}/OK/​g'​ 
-gaga1gaga2gaga3gaga4gaga5gaga +a aa OK OK OK OK
-gaga +
-gaga gaga +
-gaga/gaga/gaga+
 </​code>​ </​code>​
  
-====Sed -les caractères étendues ==== +====Les sous-chaînes ​associer ​( )], { }==== 
-===Rappel=== +  * substituer "Hello" par OK
-''​|''​ ; ''​^''​ ; ''​$''​ ; ''​.''​ ; ''​*''​ ; ''​+''​ ; ''?''​ ; ''​  ​)''​ ; ''​[''​ ; ''​  ​}''​ +
-===Exercices : matcher et remplacer une chaîne par OK === +
-  * Hello+
 <code user> <code user>
 echo "​coucou Hello Yep" | sed -r '​s/​[A-Z]{1}[a-z]{4}/​OK/​g'​ echo "​coucou Hello Yep" | sed -r '​s/​[A-Z]{1}[a-z]{4}/​OK/​g'​
Ligne 503: Ligne 490:
 </​code>​ </​code>​
  
-  * ABC-123 abc-123+  * substituer "ABC-123 abc-123" par OK
  
 <code user> <code user>
Ligne 520: Ligne 507:
 </​note>​ </​note>​
  
-  * ab efab ef+  * substituer "ab efab ef" par OK
  
 <code user> <code user>
Ligne 527: Ligne 514:
 </​code>​ </​code>​
  
-  * 123ab efab ef123 par trois "​OK"​+  * substituer "123ab efab ef123" ​par trois "​OK"​
  
 <code user> <code user>
Ligne 535: Ligne 522:
 </​code>​ </​code>​
  
-  * ab ou cd par OK +  * substituer ​jusqu'​à trois "​a"​ par OK
- +
-<code user> +
-echo "abef cdef efgh abcd" | sed -r '​s/​ab|cd/​OK/​g'​ +
-OKef OKef efgh OKOK +
-</​code>​ +
- +
-  * ab ou cd par OK et efface le reste +
- +
-<code user> +
-echo "​lflfabef cdef efgh ftyabcdopm"​ | sed -r\ +
- '​s/​^.*[ab|cd]*/​OK/​g'​ +
-OK +
-</​code>​ +
- +
-  * seulement aaa, aaaa et aaaaa par OK +
-<code user> +
-echo "a aa aaa aaaa aaaaaa aaaaaaaa aaaaaaa"​ | sed -r\ +
- '​s/​a{3,​5}/​OK/​g'​ +
-a aa OK OK OKa OKOK OKaa +
-</​code>​ +
- +
-  * trois "​a"​ et plus par OK +
- +
-<code user> +
-echo "a aa aaa aaaa aaaaaa aaaaaaaa"​ | sed -r '​s/​a{3,​}/​OK/​g'​ +
-a aa OK OK OK OK +
-</​code>​ +
- +
-  * jusqu'​à trois "​a"​ par OK+
 <note tip> <note tip>
-Attention !\\ Les chaînes comportant plus de trois "​a"​ contiennent aussi moins de trois "​a"​.+Attention !\\ La E.R ''​{,​m}''​ n'est pas utilisée avec sed.\\ Les chaînes comportant plus de trois "​a"​ contiennent aussi moins de trois "​a" ​!
 <code user> <code user>
 echo "a aa aaa aaaa aaaaaa aaaaaaaa"​ | sed -r '​s/​a{,​3}/​OK/​g'​ echo "a aa aaa aaaa aaaaaa aaaaaaaa"​ | sed -r '​s/​a{,​3}/​OK/​g'​
Ligne 577: Ligne 535:
 OKOKaOKaaOKaaaaOKaaaaaaaa OKOKaOKaaOKaaaaOKaaaaaaaa
 </​code>​ </​code>​
- 
 </​note>​ </​note>​
 <code user> <code user>
Ligne 583: Ligne 540:
  -e '​s/​(a{1}[[:​blank:​]])/​OK/'​ -e '​s/​(a{2}[[:​blank:​]])/​OK/' ​  -e '​s/​(a{1}[[:​blank:​]])/​OK/'​ -e '​s/​(a{2}[[:​blank:​]])/​OK/' ​
 OKOKaaa aaaa aaaaaa aaaaaaaa OKOKaaa aaaa aaaaaa aaaaaaaa
-</​code>​ 
- 
-  * zéro ou une fois "​z"​ par OK 
- 
-<code user> 
-echo "abc azbc azzbc azzzbc azzzzbc"​ | sed -r '​s/​az?​bc/​OK/​g'​ 
-OK OK azzbc azzzbc azzzzbc 
-</​code>​ 
- 
-  * une ou plusieurs fois "​z"​ par OK 
- 
-<code user> 
-echo "abc azbc azzbc azzzbc azzzzbc"​ | sed -r '​s/​az+bc/​OK/​g'​ 
-abc OK OK OK OK 
-</​code>​ 
- 
-=====Sed et les expressions rationnelles étendues ===== 
-=== le "​ou"​ (|)=== 
-<code user> 
-sed -r '​s/​a|c/​gaga/​g'​ sed1.txt 
-</​code>​ 
-<​code>​ 
-gagagagagagagaga 
-BBB 
-gagaCgagaC 
-# 
-12345 
-BBB 
-titi gagaCgagaC 
-</​code>​ 
-===Parenthèses=== 
-<code user> 
-sed -r '​s/​(a|B).*/​gaga/​g'​ sed1.txt 
-</​code>​ 
-<​code>​ 
-gaga 
-gaga 
-cCcC 
-# 
-12345 
-gaga 
-titi cCcC 
-hypathie@debian:​~$ 
-</​code>​ 
-===Les accolades === 
-<​code>​ 
-sed '​s/​a{1,​4}/​gaga/​g'​ sed1.txt 
-</​code>​ 
-<​code>​ 
-aaaa 
-BBB 
-cCcC 
-# 
-12345 
-BBB 
-titi cCcC 
-</​code>​ 
-<code user> 
-sed -r '​s/​(a|B).*/​gaga/​g'​ sed1.txt 
-</​code>​ 
-<​code>​ 
-gaga 
-gaga 
-cCcC 
-# 
-12345 
-gaga 
-titi cCcC 
 </​code>​ </​code>​
  

Pied de page des forums

Propulsé par FluxBB