Vous n'êtes pas identifié(e).
L'icône rouge permet de télécharger chaque page du wiki visitée au format PDF et la grise au format ODT →
Ci-dessous, les différences entre deux révisions de la page.
Les deux révisions précédentes Révision précédente Prochaine révision | Révision précédente Prochaine révision Les deux révisions suivantes | ||
doc:programmation:awk [18/10/2012 04:45] smolski |
doc:programmation:awk [18/10/2012 08:39] smolski |
||
---|---|---|---|
Ligne 1: | Ligne 1: | ||
====== awk ====== | ====== awk ====== | ||
- | (//non testé// - **smolski** 18/10/2012) Le retour sur le forum est ici : | + | (//testé// - **smolski** 18/10/2012) Le retour sur le forum est ici : |
- | * [[//url// | Lien vers le forum concernant ce tuto]] N'hésitez pas à y faire par de vos remarques, succès, améliorations ou échecs ! | + | * [[http://debian-facile.org/viewtopic.php?id=6057 | Lien vers le forum concernant ce tuto]] N'hésitez pas à y faire par de vos remarques, succès, améliorations ou échecs ! |
- | * Objet : awk - awk | + | * Objet : awk |
* Niveau requis : AVISÉ | * Niveau requis : AVISÉ | ||
- | * Commentaires : // Cet utilitaire a été créÉ dans le but de remplacer les commandes [[commande:grep]] et [[commande:sed]]. // | + | * Commentaires : // Cet utilitaire a été créé dans le but de remplacer les commandes [[commande:grep]] et [[commande:sed]]. // |
* Débutant, à savoir : | * Débutant, à savoir : | ||
[[manuel:le_debianiste_qui_papillonne|Utiliser GNU/Linux en ligne de commande, tout commence là !.]] :-) | [[manuel:le_debianiste_qui_papillonne|Utiliser GNU/Linux en ligne de commande, tout commence là !.]] :-) | ||
Ligne 66: | Ligne 66: | ||
CAMILLE 7 M</code> | CAMILLE 7 M</code> | ||
+ | **Nota** : \\ | ||
L'ordre des colonnes a été modifié pour l'exemple. | L'ordre des colonnes a été modifié pour l'exemple. | ||
Ligne 82: | Ligne 83: | ||
CLEMENT M 7 | CLEMENT M 7 | ||
EMMA F 6</code> | EMMA F 6</code> | ||
+ | |||
+ | ==== Variables awk ==== | ||
+ | |||
+ | awk fournit des variables utiles qui peuvent être utilisées, affichées, calculées ou assignées. | ||
+ | |||
+ | === Variable NR NF === | ||
+ | |||
+ | * NR : nombre d'enregistrements (numéro de ligne). | ||
+ | * NF : nombre de champs (nombre de colonnes). | ||
+ | |||
+ | <code bash> | ||
+ | awk '{ print NR, NF, $0 }' file.txt | ||
+ | 1 3 Nom Genre Age | ||
+ | 2 1 --------------------------------------- | ||
+ | 3 3 CAMILLE M 7 | ||
+ | 4 3 CHLOE F 12 | ||
+ | 5 3 CLARA F 11 | ||
+ | 6 3 CLEMENT M 7 | ||
+ | 7 3 EMMA F 6 | ||
+ | 8 3 THEO M 8</code> | ||
+ | |||
+ | === Variable FS OFS === | ||
+ | |||
+ | * FS : Séparateur de champ (par défaut : espace/tabulation). | ||
+ | * OFS : Séparateur de champ en sortie (par défaut : espace). | ||
+ | <code bash> | ||
+ | awk '/CAMILLE/ { OFS="," ; print $2,$1 }' file.txt | ||
+ | M,CAMILLE</code> | ||
+ | |||
+ | <note>À noter le caractère ";" pour séparer les instructions dans la même ligne et la façon dont on assigne une valeur à une variable (OFS=",").</note> | ||
+ | |||
+ | ==== Scripts awk ==== | ||
+ | |||
+ | <note warning>**ATTENTION** ! Vérifiez toujours l'écriture de chaque script donné ici avant de l'appliquer !</note> | ||
+ | |||
+ | awk a été utilisé précédemment en mode lignes de commande. Lorsque le programme awk devient complexe, ce dernier peut être stocké dans un fichier : | ||
+ | prog.awk | ||
+ | <code bash> | ||
+ | cat > prog.awk <<EOS | ||
+ | /^CL/,/^E/ { | ||
+ | print NR, $0 | ||
+ | } | ||
+ | EOS</code> | ||
+ | |||
+ | Puis interprété grâce à l'option -f : | ||
+ | <code bash> | ||
+ | awk -f prog.awk file.txt | ||
+ | 5 CLARA F 11 | ||
+ | 6 CLEMENT M 7 | ||
+ | 7 EMMA F 6</code> | ||
+ | |||
+ | ==== Pré et Post opérations ==== | ||
+ | |||
+ | <note warning>**ATTENTION** ! Vérifiez toujours l'écriture de chaque script donné ici avant de l'appliquer !</note> | ||
+ | |||
+ | awk offre des sections pré-traitement (BEGIN) et post-traitement (END) lors de l'analyse d'un fichier. La structure du script awk est : | ||
+ | <code bash> | ||
+ | cat > prog.awk <<EOS | ||
+ | /^CL/,/^E/ | ||
+ | BEGIN { | ||
+ | action | ||
+ | } | ||
+ | |||
+ | /filter/,/filter/ { action } | ||
+ | |||
+ | { action} | ||
+ | |||
+ | END { | ||
+ | action | ||
+ | } | ||
+ | EOS</code> | ||
+ | |||
+ | Donne : | ||
+ | <code bash> | ||
+ | awk -f prog.awk file.txt | ||
+ | CLARA F 11 | ||
+ | CLEMENT M 7 | ||
+ | EMMA F 6</code> | ||
+ | |||
+ | Les blocs BEGIN et END ne sont pas obligatoires. Il peut y avoir un bloc BEGIN sans bloc END, un bloc END sans bloc BEGIN, ou aucun de ces 2 blocs. | ||
+ | |||
+ | Des scripts bien plus complexes peuvent alors être écrits. Par exemple, extraire 2 colonnes en remplaçant les tabulations par des ";" et afficher le nombre de lignes à la fin : | ||
+ | <code bash> | ||
+ | cat > prog.awk <<EOS | ||
+ | BEGIN { | ||
+ | FS=" " | ||
+ | OFS=";" | ||
+ | } | ||
+ | { | ||
+ | print $1, $3 | ||
+ | } | ||
+ | END { | ||
+ | printf "\nThe file has %d lines\n", NR | ||
+ | } | ||
+ | EOS</code> | ||
+ | |||
+ | |||
+ | <code bash> | ||
+ | awk -f prog.awk file.txt | ||
+ | |||
+ | Nom;Age | ||
+ | ---------------------------------------; | ||
+ | CAMILLE;7 | ||
+ | CHLOE;12 | ||
+ | CLARA;11 | ||
+ | CLEMENT;7 | ||
+ | EMMA;6 | ||
+ | THEO;8 | ||
+ | |||
+ | The file has 8 lines </code> | ||
+ | |||
+ | <note warning>**ATTENTION** ! Vérifiez toujours l'écriture de chaque script donné ici avant de l'appliquer !</note> | ||
+ | |||
+ | |||
+ | ===== Fonctions ===== | ||
+ | |||
+ | Le parseur awk offre beaucoup de fonctions internes très utiles pour traiter les données. \\ | ||
+ | Consulter les manuels de l'utilitaire awk pour la liste complète des fonctions internes, en voici une liste partielle : | ||
+ | |||
+ | ==== int ==== | ||
+ | |||
+ | Convertir une valeur en entier avec la fonction **int** : | ||
+ | <code bash> | ||
+ | awk '/CHLOE/ { print $3, int($3/5)}' file.txt | ||
+ | 12 2</code> | ||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | //À suivre...// **Jojo** ;-) |