L'icône rouge permet de télécharger chaque page du wiki visitée au format PDF et la grise au format ODT →

Différences

Ci-dessous, les différences entre deux révisions de la page.

--- doc:programmation:awk [18/10/2012 08:38]
smolski
+++ doc:programmation:awk [20/10/2012 09:59]
paskal
@@ Ligne 2: / Ligne 2: @@
 (//testé// - **smolski** 18/10/2012) Le retour sur le forum est ici :
-  * [[http://debian-facile.org/viewtopic.php?id=6057 | Lien vers le forum concernant ce tuto]] N'hésitez pas à y faire par de vos remarques, succès, améliorations ou échecs !
+  * [[http://debian-facile.org/viewtopic.php?id=6057 | Lien vers le forum concernant ce tuto]] N'hésitez pas à y faire part de vos remarques, succès, améliorations ou échecs !
   * Objet : awk
   * Niveau requis : AVISÉ
@@ Ligne 39: / Ligne 39: @@
 Extraire des données d'un fichier, par exemple les 2 premières colonnes :
 <code bash>
-awk '{ print $1, $2 }' file.txt
+awk '{ print $1, $2 }' file.txt</code>
+<code>
 Nom Genre
 ---------------------------------------
@@ Ligne 63: / Ligne 64: @@
 Retrouver les lignes qui contiennent CAMILLE :
 <code bash>
-awk '/CAMILLE/ { print $1, $3, $2 }' file.txt
+awk '/CAMILLE/ { print $1, $3, $2 }' file.txt</code>
+<code>
 CAMILLE 7 M</code>
@@ Ligne 71: / Ligne 73: @@
 Un autre filtre plus complexe, rechercher les lignes qui commencent par C et qui contiennent la lettre A ou la lettre O :
 <code bash>
-awk '/^C.*[AO]/ { print $1, $3, $2 }' file.txt
+awk '/^C.*[AO]/ { print $1, $3, $2 }' file.txt</code>
+<code>
 CAMILLE 7 M
 CHLOE 12 F
@@ Ligne 79: / Ligne 82: @@
 Pour récupérer les lignes de CL à E, tapez :
 <code bash>
-awk '/^CL/,/^E/ { print $0 }' file.txt
+awk '/^CL/,/^E/ { print $0 }' file.txt</code>
+<code>
 CLARA F 11
 CLEMENT M 7
@@ Ligne 94: / Ligne 98: @@
 <code bash>
-awk '{ print NR, NF, $0 }' file.txt
+awk '{ print NR, NF, $0 }' file.txt</code>
+<code>
 3 Nom         Genre           Age
 1 ---------------------------------------
@@ Ligne 109: / Ligne 114: @@
   * OFS : Séparateur de champ en sortie (par défaut : espace).
 <code bash>
-awk '/CAMILLE/ { OFS="," ; print $2,$1 }' file.txt
+awk '/CAMILLE/ { OFS="," ; print $2,$1 }' file.txt</code>
+<code>
 M,CAMILLE</code>
@@ Ligne 123: / Ligne 129: @@
 cat > prog.awk <<EOS
 /^CL/,/^E/ {
-     print NR, $0
+     print NR, \$0
 }
 EOS</code>
@@ Ligne 129: / Ligne 135: @@
 Puis interprété grâce à l'option -f :
 <code bash>
-awk -f prog.awk file.txt
+awk -f prog.awk file.txt</code>
+<code>
 CLARA F 11
 CLEMENT M 7
@@ Ligne 157: / Ligne 164: @@
 Donne :
 <code bash>
-awk -f prog.awk file.txt
+awk -f prog.awk file.txt </code>
+<code>
 CLARA           F               11
 CLEMENT         M               7
@@ Ligne 172: / Ligne 180: @@
 }
 {
-        print $1, $3
+        print \$1, \$3
 }
 END {
@@ Ligne 181: / Ligne 189: @@
 <code bash>
-awk -f prog.awk file.txt
+awk -f prog.awk file.txt</code>
+<code>
 Nom;Age
 ---------------------------------------;
@@ Ligne 201: / Ligne 209: @@
 Le parseur awk offre beaucoup de fonctions internes très utiles pour traiter les données. \\
 Consulter les manuels de l'utilitaire awk pour la liste complète des fonctions internes, en voici une liste partielle :
+==== toupper tolower ====
+Convertir du texte en majuscules ou en minuscules avec les fonctions toupper et tolower
+<code bash>
+awk '/THEO/ { print $1, tolower($1) }' file.txt</code>
+<code>
+THEO theo</code>
 ==== int ====
@@ Ligne 206: / Ligne 222: @@
 Convertir une valeur en entier avec la fonction **int** :
 <code bash>
-awk '/CHLOE/ { print $3, int($3/5)}' file.txt
+awk '/CHLOE/ { print $3, int($3/5)}' file.txt</code>
+<code>
 2</code>
+==== printf ====
+La fonction printf avec awk fonctionne comme la fonction printf en C afin de formater la sortie :
+<code bash>
+awk 'NR > 2 { printf "%10s %02d %-10s\n", $1,$3, $1}' file.txt</code>
+<code>
+   CAMILLE 07 CAMILLE
+     CHLOE 12 CHLOE
+     CLARA 11 CLARA
+   CLEMENT 07 CLEMENT
+      EMMA 06 EMMA
+      THEO 08 THEO </code>
+==== length ====
+Afficher la taille d'une chaîne de caractères avec la fonction length :
+<code bash>
+awk '/CLEM/ { print $1, length($1) }' file.txt</code>
+<code>
+CLEMENT 7</code>
+==== match ====
+Retourne la position d'une chaîne de caractères remplissant les critères d'une expression régulière avec la fonction match :
+<code bash>
+awk 'NR >2 { print $1, match($1,"A")}' file.txt</code>
+<code>
+CAMILLE 2
+CHLOE 0
+CLARA 3
+CLEMENT 0
+EMMA 4
+THEO 0</code>
+==== gsub ====
+Remplacer des chaînes de caractères avec la fonction gsub :
+<code bash>
+awk 'NR >2 { gsub("A","_",$1) ; print $1 }' file.txt</code>
+<code>
+C_MILLE
+CHLOE
+CL_R_
+CLEMENT
+EMM_
+THEO</code>
+==== substr ====
+Extraire une portion de texte avec la fonction substr :
+<code bash>
+awk '{ print $1, substr($1,2,3) }' file.txt</code>
+<code>
+Nom om
+--------------------------------------- ---
+CAMILLE AMI
+CHLOE HLO
+CLARA LAR
+CLEMENT LEM
+EMMA MMA
+THEO HEO</code>
+==== Fonctions utilisateur ====
+La possibilité de créer des fonctions utilisateur est une des fonctionnalités les plus importantes de l'utilitaire awk. Les fonctions sont définies avec le mot clé **function**.
+<code bash>
+cat > prog.awk <<EOS
+function gentag(nom,age) {
+        tmp=tolower(substr(nom,1,3))
+        return tmp "_" age
+}
+BEGIN {
+        FS=" "
+        OFS=";"
+}
+{
+        print \$1, \$3, gentag(\$1,\$3)
+}
+END {
+print NR , "lines"
+}
+EOS
+</code>
+<code bash>
+awk -f prog.awk file.txt</code>
+<code>
+Nom;Age;nom_Age
+---------------------------------------;;---_
+CAMILLE;7;cam_7
+CHLOE;12;chl_12
+CLARA;11;cla_11
+CLEMENT;7;cle_7
+EMMA;6;emm_6
+THEO;8;the_8
+;lines</code>
+===== Programmation =====
+Le parseur awk offre toutes les structures de programmation : conditions, boucles, itérations.
+==== Condition ====
+Les enfants sont ils en primaire ou au collège avec if() {} else {} ?
+<code bash>
+cat prog.awk <<EOS
+BEGIN {
+        OFS=","
+}
+NR <=2 { next }
+{
+        if ( \$3 < 11 ) {
+                ecole="primaire"
+        } else {
+                ecole="college"
+        }
+        print \$1, ecole
+}
+EOS </code>
+<code bash>
+nawk -f prog.awk file.txt</code>
+<code>
+CAMILLE,primaire
+CHLOE,college
+CLARA,college
+CLEMENT,primaire
+EMMA,primaire
+THEO,primaire</code>
+Remarquer la façon dont l'entête est écartée : NR <=2 { next }
+==== Boucles ====
+Remplacer l'âge de l'enfant par un nombre de points avec while() {}.
+<code bash>
+cat > prog.awk
+NR <=2 { next }
+{
+        min=1
+        printf "%-10s", \$1
+        while  ( min <= \$3 ) {
+                printf "."
+                min++
+        }
+        printf "\n"
+}
+<code bash>
+awk -f prog.awk file.txt</code>
+<code>
+CAMILLE   .......
+CHLOE     ............
+CLARA     ...........
+CLEMENT   .......
+EMMA      ......
+THEO      ........</code>
+==== Itérations ====
+Remplacer l'âge de l'enfant par un nombre de points avec for (i= ; i< ; i++ ) { }.
+<code bash>
+cat > prog.awk <<EOS
+NR <=2 { next }
+{
+        printf "%-10s", \$1
+        for ( min=1 ; min <= \$3; min++ ) {
+                printf "."
+        }
+        printf "\n"
+}EOS
+</code>
+<code bash>
+awk -f prog.awk file.txt</code>
+<code>
+CAMILLE   .......
+CHLOE     ............
+CLARA     ...........
+CLEMENT   .......
+EMMA      ......
+THEO      ........</code>
+==== Tableaux (Arrays) ====
+Pour terminer cette brève présentation : les tableaux avec awk, particulièrement pratiques pour calculer des agrégats. \\
+La structure d'un tableau avec awk est très simple :
+tab[indice] = value
+Calculer la moyenne d'âge des enfants par sexe :
+<code bash>
+cat < prog.awk <<EOS
+{
+        if ( NR <= 2 ) { next } # skip first 2 lines
+        tab_age[$2]+=$3
+        tab_cpt[$2]++
+}
+END {
+        for ( genre in tab_age ) {
+        print genre, " : ", "Moy :", int(tab_age[genre]/tab_cpt[genre]), "ans", "nb :", tab_cpt[genre]
+        }
+}EOS
+</code>
+<code bash>
+awk -f prog.awk file.txt</code>
+<code>
+F : Moy : 9 ans nb : 3
+M : Moy : 7 ans nb : 3</code>
+Remarquer comment les 2 tableaux sont remplis et traités à la fin.
+===== Lien =====
-==== Titre ====
+Un lieu formidable là :
+  * [[http://www.sqlpac.com/articles/unix-linux/outils | Outil Linux - **SQLPAC** SQL Pour Administrateurs & Concepteurs]]
-//À suivre...// **Jojo** ;-)

doc/programmation/awk.txt · Dernière modification: 02/06/2015 18:44 par milou

Debian-facile

Différences

Pied de page des forums