L'icône rouge permet de télécharger chaque page du wiki visitée au format PDF et la grise au format ODT →

Différences

Ci-dessous, les différences entre deux révisions de la page.

--- doc:programmation:awk [18/10/2012 13:23]
smolski
+++ doc:programmation:awk [27/10/2013 18:25]
smolski [awk]
@@ Ligne 1: / Ligne 1: @@
 ====== awk ======
-(//testé// - **smolski** 18/10/2012) Le retour sur le forum est ici :
-  * [[http://debian-facile.org/viewtopic.php?id=6057 | Lien vers le forum concernant ce tuto]] N'hésitez pas à y faire par de vos remarques, succès, améliorations ou échecs !
   * Objet : awk
-  * Niveau requis : AVISÉ
+  * Niveau requis : {{tag>avisé}}
-  * Commentaires : // Cet utilitaire a été créé dans le but de remplacer les commandes [[commande:grep]] et [[commande:sed]]. //
+  * Commentaires : // Cet utilitaire a été créé dans le but de remplacer les commandes [[:doc:systeme:grep]] et [[:doc:systeme:sed]]. //
-  * Débutant, à savoir :
+  * Suivi : {{tag>à-compléter}}
-[[manuel:le_debianiste_qui_papillonne|Utiliser GNU/Linux en ligne de commande, tout commence là !.]] :-)
+  * Débutant, à savoir : [[:doc:systeme:commandes:le_debianiste_qui_papillonne|Utiliser GNU/Linux en ligne de commande, tout commence là !.]] :-)
+    * Création par **smolski** 18/10/2012)
+    * Testé par **smolski** le 28/10/2013)
+  * Commentaires sur le forum : [[http://debian-facile.org/viewtopic.php?id=6057 | Lien vers le forum concernant ce tuto]]((N'hésitez pas à y faire part de vos remarques, succès, améliorations ou échecs !))
+=== Nota ===
+Contributeurs, les FIXME sont là pour vous aider, supprimez-les une fois le problème corrigé ou le champ rempli !
 ===== Introduction =====
-awk est un langage de programmation datant de 1977, date de son apparition dans le monde Unix. Il tire son nom des trois programmeurs qui l'ont développé : Alfred V. Aho, Peter J. Weinberger et Brian W. Kernighan. \\
+**awk** est un langage de programmation datant de 1977, date de son apparition dans le monde Unix. Il tire son nom des trois programmeurs qui l'ont développé : Alfred V. Aho, Peter J. Weinberger et Brian W. Kernighan. \\
 Cet utilitaire a été créé dans le but de remplacer les commandes grep et sed. Sa grande souplesse lui a permis de connaître un succès immédiat. Et de nouvelles versions sont apparues au fil du temps : nawk et gawk aujourd'hui.
@@ Ligne 18: / Ligne 23: @@
 ===== Exercices =====
-Créez le fichier(([[commande:touch]])) file.txt ainsi :
+Créez((Vous pouvez faire cela avec votre éditeur de texte favori, voire avec [[:doc:systeme:cat]] ou simplement en téléchargeant la liste.)) le fichier ''file.txt'' contenant la liste suivante :
-<code bash>
+<code raw file.txt>
-touch file.txt</code>
-Et rédigez(([[commande:cat]])) dedans cette liste ainsi :
-<code bash>
-cat >  file.txt <<EOS
 Nom             Genre           Age
 ---------------------------------------
@@ Ligne 33: / Ligne 33: @@
 EMMA            F               6
 THEO            M               8
-EOS</code>
+</code>
 ==== Extraire des colonnes ====
 Extraire des données d'un fichier, par exemple les 2 premières colonnes :
-<code bash>
+<code user>
 awk '{ print $1, $2 }' file.txt</code>
 <code>
@@ Ligne 63: / Ligne 63: @@
 Retrouver les lignes qui contiennent CAMILLE :
-<code bash>
+<code user>
 awk '/CAMILLE/ { print $1, $3, $2 }' file.txt</code>
 <code>
@@ Ligne 72: / Ligne 72: @@
 Un autre filtre plus complexe, rechercher les lignes qui commencent par C et qui contiennent la lettre A ou la lettre O :
-<code bash>
+<code user>
 awk '/^C.*[AO]/ { print $1, $3, $2 }' file.txt</code>
 <code>
@@ Ligne 81: / Ligne 81: @@
 awk est également très utile et puissant pour gérer des filtres sur des paragraphes. \\
 Pour récupérer les lignes de CL à E, tapez :
-<code bash>
+<code user>
 awk '/^CL/,/^E/ { print $0 }' file.txt</code>
 <code>
@@ Ligne 97: / Ligne 97: @@
   * NF : nombre de champs (nombre de colonnes).
-<code bash>
+<code user>
 awk '{ print NR, NF, $0 }' file.txt</code>
 <code>
@@ Ligne 113: / Ligne 113: @@
   * FS : Séparateur de champ (par défaut : espace/tabulation).
   * OFS : Séparateur de champ en sortie (par défaut : espace).
-<code bash>
+<code user>
 awk '/CAMILLE/ { OFS="," ; print $2,$1 }' file.txt</code>
 <code>
@@ Ligne 122: / Ligne 122: @@
 ==== Scripts awk ====
-<note warning>**ATTENTION** ! Vérifiez toujours l'écriture de chaque script donné ici avant de l'appliquer !</note>
+<note warning>**ATTENTION** ! Vérifiez toujours l'écriture de chaque script donné ici avant de l'appliquer ! \\
+Voir : **[[doc:programmation:shell:regexp#les_caracteres_echappes | Les Regexp.]]** //Et c'est pas la peine de faire Ouch..! Tuto inévitable à ce niveau.// :-P</note>
-awk a été utilisé précédemment en mode lignes de commande. Lorsque le programme awk devient complexe, ce dernier peut être stocké dans un fichier :
+awk a été utilisé précédemment en mode lignes de commande. Lorsque le programme awk devient complexe, ce dernier peut être stocké dans un fichier ''prog.awk'' comme ici :
-   prog.awk
+<code awk prog.awk>
-<code bash>
-cat > prog.awk <<EOS
 /^CL/,/^E/ {
      print NR, \$0
 }
-EOS</code>
+</code>
 Puis interprété grâce à l'option -f :
-<code bash>
+<code user>
 awk -f prog.awk file.txt</code>
 <code>
@@ Ligne 146: / Ligne 145: @@
 awk offre des sections pré-traitement (BEGIN) et post-traitement (END) lors de l'analyse d'un fichier. La structure du script awk est :
-<code bash>
+<code awk prog.awk>
-cat > prog.awk <<EOS
 /^CL/,/^E/
 BEGIN {
@@ Ligne 160: / Ligne 158: @@
         action
 }
-EOS</code>
+</code>
 Donne :
-<code bash>
+<code user>
-awk -f prog.awk file.txt </code>
+awk -f prog.awk file.txt</code>
 <code>
 CLARA           F               11
@@ Ligne 173: / Ligne 171: @@
 Des scripts bien plus complexes peuvent alors être écrits. Par exemple, extraire 2 colonnes en remplaçant les tabulations par des ";" et afficher le nombre de lignes à la fin :
-<code bash>
+<code awk prog.awk>
-cat > prog.awk <<EOS
 BEGIN {
         FS=" "
@@ Ligne 180: / Ligne 177: @@
 }
 {
-        print \$1, \$3
+        print $1, $3
 }
 END {
         printf "\nThe file has %d lines\n", NR
 }
-EOS</code>
+</code>
-<code bash>
+<code user>
 awk -f prog.awk file.txt</code>
 <code>
@@ Ligne 213: / Ligne 210: @@
 Convertir du texte en majuscules ou en minuscules avec les fonctions toupper et tolower
-<code bash>
+<code user>
 awk '/THEO/ { print $1, tolower($1) }' file.txt</code>
 <code>
@@ Ligne 221: / Ligne 218: @@
 Convertir une valeur en entier avec la fonction **int** :
-<code bash>
+<code user>
 awk '/CHLOE/ { print $3, int($3/5)}' file.txt</code>
 <code>
@@ Ligne 229: / Ligne 226: @@
 La fonction printf avec awk fonctionne comme la fonction printf en C afin de formater la sortie :
-<code bash>
+<code user>
-awk 'NR > 2 { printf "%10s %02d %-10s\n", $1,$3, $1}' file.txt</code>
+awk 'NR > 2 { printf "%10s %02d %-10s\n", $1,$3, $1}' file.txt
-<code>
    CAMILLE 07 CAMILLE
      CHLOE 12 CHLOE
@@ Ligne 242: / Ligne 239: @@
 Afficher la taille d'une chaîne de caractères avec la fonction length :
-<code bash>
+<code user>
 awk '/CLEM/ { print $1, length($1) }' file.txt</code>
 <code>
@@ Ligne 250: / Ligne 247: @@
 Retourne la position d'une chaîne de caractères remplissant les critères d'une expression régulière avec la fonction match :
-<code bash>
+<code user>
 awk 'NR >2 { print $1, match($1,"A")}' file.txt</code>
 <code>
@@ Ligne 263: / Ligne 260: @@
 Remplacer des chaînes de caractères avec la fonction gsub :
-<code bash>
+<code user>
 awk 'NR >2 { gsub("A","_",$1) ; print $1 }' file.txt</code>
 <code>
@@ Ligne 276: / Ligne 273: @@
 Extraire une portion de texte avec la fonction substr :
-<code bash>
+<code user>
 awk '{ print $1, substr($1,2,3) }' file.txt</code>
 <code>
@@ Ligne 291: / Ligne 288: @@
 La possibilité de créer des fonctions utilisateur est une des fonctionnalités les plus importantes de l'utilitaire awk. Les fonctions sont définies avec le mot clé **function**.
-<code bash>
+<code awk prog.awk>
-cat > prog.awk <<EOS
 function gentag(nom,age) {
         tmp=tolower(substr(nom,1,3))
@@ Ligne 304: / Ligne 300: @@
 {
-        print \$1, \$3, gentag(\$1,\$3)
+        print $1, $3, gentag($1,$3)
 }
@@ Ligne 312: / Ligne 308: @@
 </code>
-<code bash>
+<code user>
-awk -f prog.awk file.txt
+awk -f prog.awk file.txt</code>
-EOS
 <code>
 Nom;Age;nom_Age
@@ Ligne 325: / Ligne 320: @@
 THEO;8;the_8
 ;lines</code>
+===== Programmation =====
+Le parseur awk offre toutes les structures de programmation : conditions, boucles, itérations.
+==== Condition ====
+Les enfants sont ils en primaire ou au collège avec if() {} else {} ?
+<code awk prog.awk>
+BEGIN {
+        OFS=","
+}
+NR <=2 { next }
+{
+        if ( $3 < 11 ) {
+                ecole="primaire"
+        } else {
+                ecole="college"
+        }
+        print $1, ecole
+}
+</code>
+<code user>
+awk -f prog.awk file.txt</code>
+<code>
+CAMILLE,primaire
+CHLOE,college
+CLARA,college
+CLEMENT,primaire
+EMMA,primaire
+THEO,primaire</code>
+<note tip>Remarquer la façon dont l'entête est écartée : NR <=2 { next }</note>
+==== Boucles ====
+Remplacer l'âge de l'enfant par un nombre de points avec while() {}.
+<code awk prog.awk>
+NR <=2 { next }
+{
+        min=1
+        printf "%-10s", $1
+        while  ( min <= $3 ) {
+                printf "."
+                min++
+        }
+        printf "\n"
+}
+</code>
+<code user>
+awk -f prog.awk file.txt</code>
+<code>
+CAMILLE   .......
+CHLOE     ............
+CLARA     ...........
+CLEMENT   .......
+EMMA      ......
+THEO      ........</code>
+==== Itérations ====
+Remplacer l'âge de l'enfant par un nombre de points avec for (i= ; i< ; i++ ) { }.
+<code awk prog.awk>
+NR <=2 { next }
+{
+        printf "%-10s", $1
+        for ( min=1 ; min <= $3; min++ ) {
+                printf "."
+        }
+        printf "\n"
+}
+</code>
+<code user>
+awk -f prog.awk file.txt</code>
+<code>
+CAMILLE   .......
+CHLOE     ............
+CLARA     ...........
+CLEMENT   .......
+EMMA      ......
+THEO      ........</code>
+==== Tableaux (Arrays) ====
+Pour terminer cette brève présentation : les tableaux avec awk, particulièrement pratiques pour calculer des agrégats. \\
+La structure d'un tableau avec awk est très simple :
+tab[indice] = value
+Calculer la moyenne d'âge des enfants par sexe :
+<code awk prog.awk>
+{
+        if ( NR <= 2 ) { next } # skip first 2 lines
+        tab_age[$2]+=$3
+        tab_cpt[$2]++
+}
+END {
+        for ( genre in tab_age ) {
+        print genre, " : ", "Moy :", int(tab_age[genre]/tab_cpt[genre]), "ans", "nb :", tab_cpt[genre]
+        }
+}
+</code>
+<code user>
+awk -f prog.awk file.txt</code>
+<code>
+F : Moy : 9 ans nb : 3
+M : Moy : 7 ans nb : 3</code>
+<note tip>Remarquer comment les 2 tableaux sont remplis et traités à la fin.</note>
+===== Lien =====
+Un lieu formidable là :
+  * [[http://www.sqlpac.com/articles/unix-linux/outils | Outil Linux - **SQLPAC** SQL Pour Administrateurs & Concepteurs]]
-//À suivre...// **Jojo** ;-)

doc/programmation/awk.txt · Dernière modification: 02/06/2015 18:44 par milou

Debian-facile

Différences

Pied de page des forums