L'icône rouge permet de télécharger chaque page du wiki visitée au format PDF et la grise au format ODT →

Différences

Ci-dessous, les différences entre deux révisions de la page.

--- utilisateurs:hypathie:tutos:accueil [20/07/2014 23:57]
Hypathie [Sed et les regexp simples]
+++ utilisateurs:hypathie:tutos:accueil [21/07/2014 11:57]
Hypathie [L'adressage]
@@ Ligne 31: / Ligne 31: @@
 **''.''** ; **''*''**, **''^''**,  **''$''**, **''[ ]''**\\
-__Attention au caractère ''*''__:\\
+__Attention au caractère__ ''*'' :\\
   - comme métacaractère :\\ ''*'' -> zéro ou plusieurs occurrence(s) de n'importe quel caractère
   - expression régulière :\\ ''*'' -> zéro ou plusieurs fois l'élément précédent (b*BABA -> BABA, bBABA, bbBABA, bbbBABA, etc.)
@@ Ligne 169: / Ligne 169: @@
 </code>
-=== Adressage avec n° occurrence (fonctionne sur une ligne)===
+=== Adressage avec n° d'occurrence (fonctionne sur une ligne)===
 <code user>
 echo "lalalala" | sed -e 's/la/li/2'
@@ Ligne 177: / Ligne 177: @@
 </code>
-===Adressage du n° ligne pour la substitution===
+===Adressage du n° de ligne pour la substitution===
 Idem que précédemment, on place le n° devant la commande !\\
 Mais attention ici il s'agit de la substitution ''s'' :
@@ Ligne 285: / Ligne 285: @@
 </code>
+=== Adressage avec le tilde===
+<code text man sed>
+first~step
+ Match every step' th line starting with line first.
+</code>
+Remplaçons "first" et step" par "n" et "m" qui sont toujours des nombres !
+L'expression ''n ~ m'' ou ''n~m'' signifie simplement :\\
+ " la E.R matche toutes les ''n''ième ligne(s) d'un fichier et cela en sautant un nombre de ligne égal à un écart (~) qui est lui-même égal, à la différence entre le nombre ''m'' avec la première ligne du fichier (c'est-à-dire la position ordinal 1). On connaît donc le nombre de ligne sautée en faisant toujours ''m - 1''."
+Et si ''n'' est égal à zéro, alors le E.R. match toutes les ''m''ièmes lignes à partir de la ligne ''m'' et saute ''m'' - 1 ligne(s).
+  * ''1 ~ 2'' : matche les lignes impaires : 1ière, 3ième, 5ième, etc.\\ En effet, de la première ligne du fichier à ''m'' (''m'' = 2), il y a 1. Il sera sauté 1 ligne non-matchée et cela à partir de la ligne n°1 (''n'' = 1). Donc la sélection concerne la première ligne et saute 1 ligne, matche la 3ième ligne et saute 1 ligne, etc.
+  * ''2~3'' : matche les lignes 2 ; 5 ; 8 ; 11\\ L'écart sauté sera de 2 car de la position 3 (''m'' = 3) à la première ligne du fichier, il y a deux lignes (3-1=2), et cela commence à la deuxième ligne (''n'' = 2). Donc la deuxième ligne est matchée, deux lignes sont sautées (3ième et 4 ième), la 5 ième est matchée, etc.
+  * 10 ~ 5 : sélection des lignes 10 ; 15 ; 20 ; 25 etc. 5 - 1 = 4 : Il sera sauté 4 lignes non-matchées à partir de la ligne 10.
+  * 0~5 : sélection des lignes 5 ; 10 ; 15 etc.\\ m-1 = 5-1 = 4 lignes sautées, à partir de la cinquième ligne (''m'' = 5 ).
+  * Exemple 1:
+<code user>
+sed '1~2 s_.*[coucou]_OK_' essai-tilde
+</code>
+<code>
+OK/1
+/titi/coucou/2
+OK/3
+/tutu/coucou/4
+OK/5
+/nono/coucou/6
+OK/7
+/lili/coucou/8
+OK/9
+/fofo/coucou/10
+OK/11
+/bibi/coucou/12
+OK/13
+/sisi/coucou/14
+OK/15
+</code>
+  * Exemple 2 :
+<code user>
+sed '2~3 s_.*[coucou]_OK_' essai-tilde
+</code>
+<code>
+/toto/coucou/1
+OK/2
+/tati/coucou/3
+/tutu/coucou/4
+OK/5
+/nono/coucou/6
+/lulu/coucou/7
+OK/8
+/fifi/coucou/9
+/fofo/coucou/10
+OK/11
+/bibi/coucou/12
+/zaza/coucou/13
+OK/14
+/baba/coucou/15
+</code>
+  * Exemple 3 :
+<code user>
+sed '10~5 s_.*[coucou]_OK_' essai-tilde
+</code>
+<code>
+/toto/coucou/1
+/titi/coucou/2
+/tati/coucou/3
+/tutu/coucou/4
+/nani/coucou/5
+/nono/coucou/6
+/lulu/coucou/7
+/lili/coucou/8
+/fifi/coucou/9
+OK/10
+/dodu/coucou/11
+/bibi/coucou/12
+/zaza/coucou/13
+/sisi/coucou/14
+OK/15
+</code>
+  * exemple :
+<code user>
+sed '0~5 s_.*[coucou]_OK_' essai-tilde
+</code>
+<code>
+/toto/coucou/1
+/titi/coucou/2
+/tati/coucou/3
+/tutu/coucou/4
+OK/5
+/nono/coucou/6
+/lulu/coucou/7
+/lili/coucou/8
+/fifi/coucou/9
+OK/10
+/dodu/coucou/11
+/bibi/coucou/12
+/zaza/coucou/13
+/sisi/coucou/14
+OK/15
+</code>
 =====Sed et les regexp simples =====
 ====Explications====
@@ Ligne 374: / Ligne 477: @@
 </note>
-===Les accolades { et } ===
+===Le caractère & ===
-Un seul caractère suivie par ''{m}'', ''{m,}'', ou ''{m,n}'' est une E.R. qui correspond au caractère précédant ''{'' s'il est présent, exactement m fois (''m''); au moins m fois (''m,''); entre "m" et "n" fois (''m,n'').\\
-'m' et 'n' doivent être des entiers positifs ou nuls inférieurs à 256.
-===Traitement des mots ===
+<code user>
-  * le caractère ''\<''
+sed 's/[0-9][0-9]*$/[&]/' sed1.txt
+</code>
+<code>
+aaaa
+BBB
+cCcC
+#
+[12345]
+BBB
+titi cCcC
+</code>
+<code user>
+sed 's/[0-9][0-9]*$/(&)/' sed1.txt
+</code>
+<code>
+aaaa
+BBB
+cCcC
+#
+(12345)
+BBB
+titi cCcC
+</code>
-  * le caractère  ''\>''
+=====Sed -r : les caractères étendues =====
+Rappel :
+ ''+'' ; ''?'' ; ''|'' ; ''(   )'' ; ''['' ; ''{   }''
+=== le caractère (+)===
-=====Sed -r : les caractères étendues =====
+  * substituer une ou plusieurs fois "z" par OK
-Rappel :
+<code user>
+echo "abc azbc azzbc azzzbc azzzzbc" | sed -r 's/az+bc/OK/g'
+abc OK OK OK OK
+</code>
+=== Le caractère ( ? )===
+  * substituer zéro ou une fois "z" par OK
+<code user>
+echo "abc azbc azzbc azzzbc azzzzbc" | sed -r 's/az?bc/OK/g'
+OK OK azzbc azzzbc azzzzbc
+</code>
+=== Le ou ( | )===
+  * substituer  ab ou cd par OK
+<code user>
+echo "abef cdef efgh abcd" | sed -r 's/ab|cd/OK/g'
+OKef OKef efgh OKOK
+</code>
+  * substituer ab ou cd par OK et effacer le reste
+<code user>
+echo "lflfabef cdef efgh ftyabcdopm" | sed -r\
+ 's/^.*[ab|cd]*/OK/g'
+OK
+</code>
- ''+'' ; ''?'' ; ''(   )'' ; ''['' ; ''{   }''
 ===Les parenthèses ===
 <code user>
@@ Ligne 410: / Ligne 565: @@
 toto:coucou
 </code>
-===Exercices : matcher et remplacer une chaîne par OK ===
-  * Hello
+<note tip>
+/^\(.*\)\1$/ : correspond à une ligne contenant au moins deux fois la même sous-chaîne de caractères
+</note>
+===Les accolades { et } ===
+Un seul caractère suivie par ''{m}'', ''{m,}'', ou ''{m,n}'' est une E.R. qui correspond au caractère précédant ''{'' s'il est présent, exactement m fois (''m''); au moins m fois (''m,''); entre "m" et "n" fois (''m,n'').\\
+'m' et 'n' doivent être des entiers positifs ou nuls inférieurs à 256.
+   * substituer seulement "aaa, aaaa et aaaaa" par OK
+<code user>
+echo "a aa aaa aaaa aaaaaa aaaaaaaa aaaaaaa" | sed -r\
+ 's/a{3,5}/OK/g'
+a aa OK OK OKa OKOK OKaa
+</code>
+  * substituer trois "a" et plus par OK
+<code user>
+echo "a aa aaa aaaa aaaaaa aaaaaaaa" | sed -r 's/a{3,}/OK/g'
+a aa OK OK OK OK
+</code>
+===Traitement des mots ===
+  * le caractère ''\<''
+Le caractère ''\<'' oblige l'E.R. à correspondre avec le début d'un mot (mot = chaîne de caractères chiffres, lettres ou '_').\\ ''\<'' doit figurer devant la sous-chaîne désirée.
+<code user>
+echo "info pour tous informatique" | sed -r 's/\<info/OK/g'
+</code>
+<code>
+OK pour tous OKrmatique
+</code>
+  * le caractère  ''\>''
+Le caractère  ''\>'' oblige l'E.R. à correspondre à la fin d'un mot.\\ ''\>'' doit figurer en fin de la sous-chaîne désirée.
+<code user>
+echo "métrique cosmétique" | sed -r 's/métique\>/OK/g'
+</code>
+<code>
+métrique cosOK
+</code>
+====Les sous-chaînes : associer ( ), [ ], { }====
+  * substituer "Hello" par OK
 <code user>
 echo "coucou Hello Yep" | sed -r 's/[A-Z]{1}[a-z]{4}/OK/g'
@@ Ligne 419: / Ligne 616: @@
 </code>
-  * ABC-123 abc-123
+  * substituer "ABC-123 abc-123" par OK
 <code user>
@@ Ligne 436: / Ligne 633: @@
 </note>
-  * ab efab ef
+  * substituer "ab efab ef" par OK
 <code user>
@@ Ligne 443: / Ligne 640: @@
 </code>
-  * 123ab efab ef123 par trois "OK"
+  * substituer "123ab efab ef123" par trois "OK"
 <code user>
@@ Ligne 451: / Ligne 648: @@
 </code>
-  * ab ou cd par OK
+  * substituer jusqu'à trois "a" par OK
-<code user>
-echo "abef cdef efgh abcd" | sed -r 's/ab|cd/OK/g'
-OKef OKef efgh OKOK
-</code>
-  * ab ou cd par OK et efface le reste
-<code user>
-echo "lflfabef cdef efgh ftyabcdopm" | sed -r\
- 's/^.*[ab|cd]*/OK/g'
-OK
-</code>
-  * seulement aaa, aaaa et aaaaa par OK
-<code user>
-echo "a aa aaa aaaa aaaaaa aaaaaaaa aaaaaaa" | sed -r\
- 's/a{3,5}/OK/g'
-a aa OK OK OKa OKOK OKaa
-</code>
-  * trois "a" et plus par OK
-<code user>
-echo "a aa aaa aaaa aaaaaa aaaaaaaa" | sed -r 's/a{3,}/OK/g'
-a aa OK OK OK OK
-</code>
-  * jusqu'à trois "a" par OK
 <note tip>
-Attention !\\ Les chaînes comportant plus de trois "a" contiennent aussi moins de trois "a".
+Attention !\\ La E.R ''{,m}'' n'est pas utilisée avec sed.\\ Les chaînes comportant plus de trois "a" contiennent aussi moins de trois "a" !
 <code user>
 echo "a aa aaa aaaa aaaaaa aaaaaaaa" | sed -r 's/a{,3}/OK/g'
@@ Ligne 493: / Ligne 661: @@
 OKOKaOKaaOKaaaaOKaaaaaaaa
 </code>
 </note>
 <code user>
@@ Ligne 500: / Ligne 667: @@
 OKOKaaa aaaa aaaaaa aaaaaaaa
 </code>
-  * zéro ou une fois "z" par OK
-<code user>
-echo "abc azbc azzbc azzzbc azzzzbc" | sed -r 's/az?bc/OK/g'
-OK OK azzbc azzzbc azzzzbc
-</code>
-  * une ou plusieurs fois "z" par OK
-<code user>
-echo "abc azbc azzbc azzzbc azzzzbc" | sed -r 's/az+bc/OK/g'
-abc OK OK OK OK
-</code>

Debian-facile

Différences

Pied de page des forums