L'icône rouge permet de télécharger chaque page du wiki visitée au format PDF et la grise au format ODT →

Différences

Ci-dessous, les différences entre deux révisions de la page.

--- doc:programmation:awk [18/10/2012 13:01]
smolski
+++ doc:programmation:awk [18/10/2012 13:40]
smolski
@@ Ligne 39: / Ligne 39: @@
 Extraire des données d'un fichier, par exemple les 2 premières colonnes :
 <code bash>
-awk '{ print $1, $2 }' file.txt
+awk '{ print $1, $2 }' file.txt</code>
+<code>
 Nom Genre
 ---------------------------------------
@@ Ligne 63: / Ligne 64: @@
 Retrouver les lignes qui contiennent CAMILLE :
 <code bash>
-awk '/CAMILLE/ { print $1, $3, $2 }' file.txt
+awk '/CAMILLE/ { print $1, $3, $2 }' file.txt</code>
+<code>
 CAMILLE 7 M</code>
@@ Ligne 71: / Ligne 73: @@
 Un autre filtre plus complexe, rechercher les lignes qui commencent par C et qui contiennent la lettre A ou la lettre O :
 <code bash>
-awk '/^C.*[AO]/ { print $1, $3, $2 }' file.txt
+awk '/^C.*[AO]/ { print $1, $3, $2 }' file.txt</code>
+<code>
 CAMILLE 7 M
 CHLOE 12 F
@@ Ligne 79: / Ligne 82: @@
 Pour récupérer les lignes de CL à E, tapez :
 <code bash>
-awk '/^CL/,/^E/ { print $0 }' file.txt
+awk '/^CL/,/^E/ { print $0 }' file.txt</code>
+<code>
 CLARA F 11
 CLEMENT M 7
@@ Ligne 94: / Ligne 98: @@
 <code bash>
-awk '{ print NR, NF, $0 }' file.txt
+awk '{ print NR, NF, $0 }' file.txt</code>
+<code>
 3 Nom         Genre           Age
 1 ---------------------------------------
@@ Ligne 109: / Ligne 114: @@
   * OFS : Séparateur de champ en sortie (par défaut : espace).
 <code bash>
-awk '/CAMILLE/ { OFS="," ; print $2,$1 }' file.txt
+awk '/CAMILLE/ { OFS="," ; print $2,$1 }' file.txt</code>
+<code>
 M,CAMILLE</code>
@@ Ligne 123: / Ligne 129: @@
 cat > prog.awk <<EOS
 /^CL/,/^E/ {
-     print NR, $0
+     print NR, \$0
 }
 EOS</code>
@@ Ligne 129: / Ligne 135: @@
 Puis interprété grâce à l'option -f :
 <code bash>
-awk -f prog.awk file.txt
+awk -f prog.awk file.txt</code>
+<code>
 CLARA F 11
 CLEMENT M 7
@@ Ligne 157: / Ligne 164: @@
 Donne :
 <code bash>
-awk -f prog.awk file.txt
+awk -f prog.awk file.txt </code>
+<code>
 CLARA           F               11
 CLEMENT         M               7
@@ Ligne 172: / Ligne 180: @@
 }
 {
-        print $1, $3
+        print \$1, \$3
 }
 END {
@@ Ligne 181: / Ligne 189: @@
 <code bash>
-awk -f prog.awk file.txt
+awk -f prog.awk file.txt</code>
+<code>
 Nom;Age
 ---------------------------------------;
@@ Ligne 280: / Ligne 288: @@
 THEO HEO</code>
+==== Fonctions utilisateur ====
+La possibilité de créer des fonctions utilisateur est une des fonctionnalités les plus importantes de l'utilitaire awk. Les fonctions sont définies avec le mot clé **function**.
+<code bash>
+cat > prog.awk <<EOS
+function gentag(nom,age) {
+        tmp=tolower(substr(nom,1,3))
+        return tmp "_" age
+}
+BEGIN {
+        FS=" "
+        OFS=";"
+}
+{
+        print \$1, \$3, gentag(\$1,\$3)
+}
+END {
+print NR , "lines"
+}
+EOS
+</code>
+<code bash>
+awk -f prog.awk file.txt</code>
+<code>
+Nom;Age;nom_Age
+---------------------------------------;;---_
+CAMILLE;7;cam_7
+CHLOE;12;chl_12
+CLARA;11;cla_11
+CLEMENT;7;cle_7
+EMMA;6;emm_6
+THEO;8;the_8
+;lines</code>
+===== Programmation =====
+Le parseur awk offre toutes les structures de programmation : conditions, boucles, itérations.
+==== Condition ====
+Les enfants sont ils en primaire ou au collège avec if() {} else {} ?
+<code bash>
+cat prog.awk <<EOS
+BEGIN {
+        OFS=","
+}
+NR <=2 { next }
+{
+        if ( \$3 < 11 ) {
+                ecole="primaire"
+        } else {
+                ecole="college"
+        }
+        print \$1, ecole
+}
+EOS </code>
+<code bash>
+nawk -f prog.awk file.txt</code>
+<code>
+CAMILLE,primaire
+CHLOE,college
+CLARA,college
+CLEMENT,primaire
+EMMA,primaire
+THEO,primaire</code>
+Remarquer la façon dont l'entête est écartée : NR <=2 { next }
+==== Boucles ====
+Remplacer l'âge de l'enfant par un nombre de points avec while() {}.
+<code bash>
+cat > prog.awk
+NR <=2 { next }
+{
+        min=1
+        printf "%-10s", \$1
+        while  ( min <= \$3 ) {
+                printf "."
+                min++
+        }
+        printf "\n"
+}
+<code bash>
+awk -f prog.awk file.txt</code>
+<code>
+CAMILLE   .......
+CHLOE     ............
+CLARA     ...........
+CLEMENT   .......
+EMMA      ......
+THEO      ........</code>
+==== Itérations ====
+Remplacer l'âge de l'enfant par un nombre de points avec for (i= ; i< ; i++ ) { }.
+<code bash>
+cat > prog.awk <<EOS
+NR <=2 { next }
+{
+        printf "%-10s", \$1
+        for ( min=1 ; min <= \$3; min++ ) {
+                printf "."
+        }
+        printf "\n"
+}EOS
+</code>
+<code bash>
+awk -f prog.awk file.txt</code>
+<code>
+CAMILLE   .......
+CHLOE     ............
+CLARA     ...........
+CLEMENT   .......
+EMMA      ......
+THEO      ........</code>
+==== Tableaux (Arrays) ====
+Pour terminer cette brève présentation : les tableaux avec awk, particulièrement pratiques pour calculer des agrégats. \\
+La structure d'un tableau avec awk est très simple :
+tab[indice] = value
+Calculer la moyenne d'âge des enfants par sexe :
+<code bash>
+cat < prog.awk <<EOS
+{
+        if ( NR <= 2 ) { next } # skip first 2 lines
+        tab_age[$2]+=$3
+        tab_cpt[$2]++
+}
+END {
+        for ( genre in tab_age ) {
+        print genre, " : ", "Moy :", int(tab_age[genre]/tab_cpt[genre]), "ans", "nb :", tab_cpt[genre]
+        }
+}EOS
+</code>
+<code bash>
+awk -f prog.awk file.txt</code>
+<code>
+F : Moy : 9 ans nb : 3
+M : Moy : 7 ans nb : 3</code>
+Remarquer comment les 2 tableaux sont remplis et traités à la fin.
+===== Lien =====
+Un lieu formidable là :
+  * [[http://www.sqlpac.com/articles/unix-linux/outils | Outil Linux - **SQLPAC** SQL Pour Administrateurs & Concepteurs]]
-//À suivre...// **Jojo** ;-)

doc/programmation/awk.txt · Dernière modification: 02/06/2015 18:44 par milou

Debian-facile

Différences

Pied de page des forums