L'icône rouge permet de télécharger chaque page du wiki visitée au format PDF et la grise au format ODT →

Différences

Ci-dessous, les différences entre deux révisions de la page.

--- doc:programmation:awk [27/10/2013 15:53]
smolski [Programmation]
+++ doc:programmation:awk [01/06/2015 19:34]
milou [awk]
@@ Ligne 1: / Ligne 1: @@
 ====== awk ======
-(//testé// - **smolski** 18/10/2012) Le retour sur le forum est ici :
-  * [[http://debian-facile.org/viewtopic.php?id=6057 | Lien vers le forum concernant ce tuto]] N'hésitez pas à y faire part de vos remarques, succès, améliorations ou échecs !
   * Objet : awk
-  * Niveau requis : AVISÉ
+  * Niveau requis : {{tag>débutant avisé}}
   * Commentaires : // Cet utilitaire a été créé dans le but de remplacer les commandes [[:doc:systeme:grep]] et [[:doc:systeme:sed]]. //
-  * Débutant, à savoir :
+  * Débutant, à savoir : [[:doc:systeme:commandes:le_debianiste_qui_papillonne|Utiliser GNU/Linux en ligne de commande, tout commence là !.]] :-)
-[[:doc:systeme:commandes:le_debianiste_qui_papillonne|Utiliser GNU/Linux en ligne de commande, tout commence là !.]] :-)
+  * Suivi : {{tag>}}
-    * Création par **smolski** 18/10/2012)
+    * Création par [[user>smolski]] 18/10/2012)
-    * Testé par **smolski** le 18/10/2012)
+    * Testé par **[[user>smolski]]** le 28/10/2013)
+    * Testé par **[[user>MicP]]** le 28/10/2013)
   * Commentaires sur le forum : [[http://debian-facile.org/viewtopic.php?id=6057 | Lien vers le forum concernant ce tuto]]((N'hésitez pas à y faire part de vos remarques, succès, améliorations ou échecs !))
-=== Nota ===
-Contributeurs, les FIXME sont là pour vous aider, supprimez-les une fois le problème corrigé ou le champ rempli !
 ===== Introduction =====
@@ Ligne 25: / Ligne 21: @@
 ===== Exercices =====
-Créez le fichier(([[:doc:systeme:touch]])) file.txt ainsi :
+Créez((Vous pouvez faire cela avec votre éditeur de texte favori, voire avec [[:doc:systeme:cat]] ou simplement en téléchargeant la liste.)) le fichier ''file.txt'' contenant la liste suivante :
-<code user>
+<code raw file.txt>
-touch file.txt</code>
-Et rédigez(([[:doc:systeme:cat]])) dedans cette liste ainsi :
-<code user tp_awk1>
-cat >  file.txt <<EOS
 Nom             Genre           Age
 ---------------------------------------
@@ Ligne 40: / Ligne 31: @@
 EMMA            F               6
 THEO            M               8
-EOS</code>
+</code>
 ==== Extraire des colonnes ====
@@ Ligne 46: / Ligne 37: @@
 Extraire des données d'un fichier, par exemple les 2 premières colonnes :
 <code user>
-awk '{ print $1, $2 }' file.txt
+awk '{ print $1, $2 }' file.txt</code>
+<code>
 Nom Genre
 ---------------------------------------
@@ Ligne 57: / Ligne 48: @@
 THEO M</code>
-<note>
+<note pip>
   * $1 correspond à la première colonne, $2 la seconde, $3 la troisième...
   * $0 correspond à la ligne entière
@@ Ligne 63: / Ligne 54: @@
 Dans le format de la sortie, les tabulations sont remplacées par un espace qui est le séparateur de sortie par défaut.
-<note important>Par défaut, les espaces et tabulations contigüs sont considérés comme un séparateur unique. Il s'agit de la seule exception.</note>
+<note important>Par défaut, les espaces et tabulations contigües sont considérées comme un séparateur unique. Il s'agit de la seule exception.</note>
 ==== Filtres et regexp ====
+<note warning>**ATTENTION** ! Vérifiez toujours l'écriture de chaque script donné ici avant de l'appliquer ! \\
+Lien utile : **[[doc:programmation:shell:regexp | Les Regexp.]]** //Et c'est pas la peine de faire Ouch..! Tuto inévitable à ce niveau.// :-P</note>
 Précédemment, des colonnes ont été filtrées, mais awk est aussi principalement utilisé pour filtrer des lignes grâce aux syntaxes des expressions régulières.
@@ Ligne 71: / Ligne 65: @@
 Retrouver les lignes qui contiennent CAMILLE :
 <code user>
-awk '/CAMILLE/ { print $1, $3, $2 }' file.txt
+awk '/CAMILLE/ { print $1, $3, $2 }' file.txt</code>
+<code>
 CAMILLE 7 M</code>
@@ Ligne 80: / Ligne 74: @@
 Un autre filtre plus complexe, rechercher les lignes qui commencent par C et qui contiennent la lettre A ou la lettre O :
 <code user>
-awk '/^C.*[AO]/ { print $1, $3, $2 }' file.txt
+awk '/^C.*[AO]/ { print $1, $3, $2 }' file.txt</code>
+<code>
 CAMILLE 7 M
 CHLOE 12 F
@@ Ligne 89: / Ligne 83: @@
 Pour récupérer les lignes de CL à E, tapez :
 <code user>
-awk '/^CL/,/^E/ { print $0 }' file.txt
+awk '/^CL/,/^E/ { print $0 }' file.txt</code>
+<code>
 CLARA F 11
 CLEMENT M 7
@@ Ligne 105: / Ligne 99: @@
 <code user>
-awk '{ print NR, NF, $0 }' file.txt
+awk '{ print NR, NF, $0 }' file.txt</code>
+<code>
 3 Nom         Genre           Age
 1 ---------------------------------------
@@ Ligne 121: / Ligne 115: @@
   * OFS : Séparateur de champ en sortie (par défaut : espace).
 <code user>
-awk '/CAMILLE/ { OFS="," ; print $2,$1 }' file.txt
+awk '/CAMILLE/ { OFS="," ; print $2,$1 }' file.txt</code>
+<code>
 M,CAMILLE</code>
-<note>À noter le caractère ";" pour séparer les instructions dans la même ligne et la façon dont on assigne une valeur à une variable (OFS=",").</note>
+<note tip>À noter le caractère ";" pour séparer les instructions dans la même ligne et la façon dont on assigne une valeur à une variable (OFS=",").</note>
 ==== Scripts awk ====
-<note warning>**ATTENTION** ! Vérifiez toujours l'écriture de chaque script donné ici avant de l'appliquer !</note>
 awk a été utilisé précédemment en mode lignes de commande. Lorsque le programme awk devient complexe, ce dernier peut être stocké dans un fichier ''prog.awk'' comme ici :
-<code user prog.awk>
+<code awk prog.awk>
-cat > prog.awk <<EOS
 /^CL/,/^E/ {
-     print NR, \$0
+     print NR, $0
 }
-EOS</code>
+</code>
 Puis interprété grâce à l'option -f :
 <code user>
-awk -f prog.awk file.txt
+awk -f prog.awk file.txt</code>
+<code>
 CLARA F 11
 CLEMENT M 7
@@ Ligne 148: / Ligne 139: @@
 ==== Pré et Post opérations ====
-<note warning>**ATTENTION** ! Vérifiez toujours l'écriture de chaque script donné ici avant de l'appliquer !</note>
 awk offre des sections pré-traitement (BEGIN) et post-traitement (END) lors de l'analyse d'un fichier. La structure du script awk est :
-<code user prog_awk>
+<code awk prog.awk>
-cat > prog.awk <<EOS
 /^CL/,/^E/
 BEGIN {
@@ Ligne 166: / Ligne 154: @@
         action
 }
-EOS</code>
+</code>
 Donne :
 <code user>
-awk -f prog.awk file.txt
+awk -f prog.awk file.txt</code>
+<code>
 CLARA           F               11
 CLEMENT         M               7
@@ Ligne 179: / Ligne 167: @@
 Des scripts bien plus complexes peuvent alors être écrits. Par exemple, extraire 2 colonnes en remplaçant les tabulations par des ";" et afficher le nombre de lignes à la fin :
-<code user prog_awk>
+<code awk prog.awk>
-cat > prog.awk <<EOS
 BEGIN {
         FS=" "
@@ Ligne 186: / Ligne 173: @@
 }
 {
-        print \$1, \$3
+        print $1, $3
 }
 END {
         printf "\nThe file has %d lines\n", NR
 }
-EOS</code>
+</code>
 <code user>
-awk -f prog.awk file.txt
+awk -f prog.awk file.txt</code>
+<code>
 Nom;Age
 ---------------------------------------;
@@ Ligne 208: / Ligne 195: @@
 The file has 8 lines </code>
-<note warning>**ATTENTION** ! Vérifiez toujours l'écriture de chaque script donné ici avant de l'appliquer !</note>
+<note warning>**ATTENTION** ! Vérifiez toujours l'écriture de chaque script donné ici avant de l'appliquer ! //Bis.// :-P</note>
@@ Ligne 220: / Ligne 207: @@
 Convertir du texte en majuscules ou en minuscules avec les fonctions toupper et tolower
 <code user>
-awk '/THEO/ { print $1, tolower($1) }' file.txt
+awk '/THEO/ { print $1, tolower($1) }' file.txt</code>
+<code>
 THEO theo</code>
@@ Ligne 228: / Ligne 215: @@
 Convertir une valeur en entier avec la fonction **int** :
 <code user>
-awk '/CHLOE/ { print $3, int($3/5)}' file.txt
+awk '/CHLOE/ { print $3, int($3/5)}' file.txt</code>
+<code>
 2</code>
@@ Ligne 249: / Ligne 236: @@
 Afficher la taille d'une chaîne de caractères avec la fonction length :
 <code user>
-awk '/CLEM/ { print $1, length($1) }' file.txt
+awk '/CLEM/ { print $1, length($1) }' file.txt</code>
+<code>
 CLEMENT 7</code>
@@ Ligne 257: / Ligne 244: @@
 Retourne la position d'une chaîne de caractères remplissant les critères d'une expression régulière avec la fonction match :
 <code user>
-awk 'NR >2 { print $1, match($1,"A")}' file.txt
+awk 'NR >2 { print $1, match($1,"A")}' file.txt</code>
+<code>
 CAMILLE 2
 CHLOE 0
@@ Ligne 270: / Ligne 257: @@
 Remplacer des chaînes de caractères avec la fonction gsub :
 <code user>
-awk 'NR >2 { gsub("A","_",$1) ; print $1 }' file.txt
+awk 'NR >2 { gsub("A","_",$1) ; print $1 }' file.txt</code>
+<code>
 C_MILLE
 CHLOE
@@ Ligne 283: / Ligne 270: @@
 Extraire une portion de texte avec la fonction substr :
 <code user>
-awk '{ print $1, substr($1,2,3) }' file.txt
+awk '{ print $1, substr($1,2,3) }' file.txt</code>
+<code>
 Nom om
 --------------------------------------- ---
@@ Ligne 297: / Ligne 284: @@
 La possibilité de créer des fonctions utilisateur est une des fonctionnalités les plus importantes de l'utilitaire awk. Les fonctions sont définies avec le mot clé **function**.
-<code user prog_awk>
+<code awk prog.awk>
-cat > prog.awk <<EOS
 function gentag(nom,age) {
         tmp=tolower(substr(nom,1,3))
@@ Ligne 310: / Ligne 296: @@
 {
-        print \$1, \$3, gentag(\$1,\$3)
+        print $1, $3, gentag($1,$3)
 }
@@ Ligne 316: / Ligne 302: @@
 print NR , "lines"
 }
-EOS
 </code>
-<code bash>
+<code user>
-awk -f prog.awk file.txt
+awk -f prog.awk file.txt</code>
+<code>
 Nom;Age;nom_Age
 ---------------------------------------;;---_
@@ Ligne 339: / Ligne 324: @@
 Les enfants sont ils en primaire ou au collège avec if() {} else {} ?
-<code user prog_awk>
+<code awk prog.awk>
-cat > prog.awk <<EOS
 BEGIN {
         OFS=","
@@ Ligne 346: / Ligne 330: @@
 NR <=2 { next }
 {
-        if ( \$3 < 11 ) {
+        if ( $3 < 11 ) {
                 ecole="primaire"
         } else {
@@ Ligne 352: / Ligne 336: @@
         }
-        print \$1, ecole
+        print $1, ecole
 }
-EOS </code>
+</code>
 <code user>
-nawk -f prog.awk file.txt
+awk -f prog.awk file.txt</code>
+<code>
 CAMILLE,primaire
 CHLOE,college
@@ Ligne 366: / Ligne 350: @@
 THEO,primaire</code>
-Remarquer la façon dont l'entête est écartée : NR <=2 { next }
+<note tip>Remarquer la façon dont l'entête est écartée : NR <=2 { next }</note>
 ==== Boucles ====
 Remplacer l'âge de l'enfant par un nombre de points avec while() {}.
-<code user prog_awk>
+<code awk prog.awk>
-cat > prog.awk
 NR <=2 { next }
 {
         min=1
-        printf "%-10s", \$1
+        printf "%-10s", $1
-        while  ( min <= \$3 ) {
+        while  ( min <= $3 ) {
                 printf "."
                 min++
@@ Ligne 383: / Ligne 366: @@
         printf "\n"
 }
-<code user>
+</code>
-awk -f prog.awk file.txt
+<code user>
+awk -f prog.awk file.txt</code>
+<code>
 CAMILLE   .......
 CHLOE     ............
@@ Ligne 396: / Ligne 381: @@
 Remplacer l'âge de l'enfant par un nombre de points avec for (i= ; i< ; i++ ) { }.
-<code user prog_awk>
+<code awk prog.awk>
-cat > prog.awk <<EOS
 NR <=2 { next }
 {
-        printf "%-10s", \$1
+        printf "%-10s", $1
-        for ( min=1 ; min <= \$3; min++ ) {
+        for ( min=1 ; min <= $3; min++ ) {
                 printf "."
         }
         printf "\n"
-}EOS
+}
 </code>
 <code user>
-awk -f prog.awk file.txt<
+awk -f prog.awk file.txt</code>
+<code>
 CAMILLE   .......
 CHLOE     ............
@@ Ligne 426: / Ligne 410: @@
 Calculer la moyenne d'âge des enfants par sexe :
-<code user prog_awk>
+<code awk prog.awk>
-cat > prog.awk <<EOS
 {
         if ( NR <= 2 ) { next } # skip first 2 lines
@@ Ligne 437: / Ligne 420: @@
         print genre, " : ", "Moy :", int(tab_age[genre]/tab_cpt[genre]), "ans", "nb :", tab_cpt[genre]
         }
-}EOS
+}
 </code>
 <code user>
-awk -f prog.awk file.txt
+awk -f prog.awk file.txt</code>
+<code>
 F : Moy : 9 ans nb : 3
 M : Moy : 7 ans nb : 3</code>
-Remarquer comment les 2 tableaux sont remplis et traités à la fin.
+<note tip>Remarquer comment les 2 tableaux sont remplis et traités à la fin.</note>

doc/programmation/awk.txt · Dernière modification: 02/06/2015 18:44 par milou

Debian-facile

Différences

Pied de page des forums