Vous n'êtes pas identifié(e).
L'icône rouge permet de télécharger chaque page du wiki visitée au format PDF et la grise au format ODT →
Ci-dessous, les différences entre deux révisions de la page.
Les deux révisions précédentes Révision précédente Prochaine révision | Révision précédente Prochaine révision Les deux révisions suivantes | ||
doc:systeme:commandes:les-commandes-join-paste-split-et-nl [08/06/2014 07:39] Hypathie [La commande split] |
doc:systeme:commandes:les-commandes-join-paste-split-et-nl [06/08/2014 17:51] Hypathie [sort] |
||
---|---|---|---|
Ligne 1: | Ligne 1: | ||
- | ====== Les commandes : d'autres commandes pour la gestion des fichiers-texte ====== | + | ====== D'autres commandes pour la gestion des fichiers-texte ====== |
* Objet : Voici d'autres commandes pour la gestion de fichiers texte | * Objet : Voici d'autres commandes pour la gestion de fichiers texte | ||
- | * Niveau requis : {{tag>débutant }} | + | * Niveau requis : {{tag>grand-débutant }} |
- | * Commentaires : //Contexte d'utilisation du sujet du tuto. // FIXME | + | |
* Débutant, à savoir : [[:doc:systeme:commandes:le_debianiste_qui_papillonne|Utiliser GNU/Linux en ligne de commande, tout commence là !.]] :-) | * Débutant, à savoir : [[:doc:systeme:commandes:le_debianiste_qui_papillonne|Utiliser GNU/Linux en ligne de commande, tout commence là !.]] :-) | ||
- | * Suivi : {{tag>en-chantier}} | + | * Suivi : {{tag>à-placer}} |
- | * Création par **Hypathie** 07/06/2014 | + | * Création par [[user>Hypathie]] 07/06/2014 |
* Testé par <...> le <...> FIXME | * Testé par <...> le <...> FIXME | ||
- | * Commentaires sur le forum : [[url | Lien vers le forum concernant ce tuto]] ((N'hésitez pas à y faire part de vos remarques, succès, améliorations ou échecs !)) FIXME | + | * Commentaires sur le forum : [[http://debian-facile.org/viewtopic.php?pid=92369#p92369 | Lien vers le forum concernant ce tuto]] ((N'hésitez pas à y faire part de vos remarques, succès, améliorations ou échecs !)) |
- | **Nota :** | + | **Nota : Voici des commandes très simples d'utilisation. ** |
Contributeurs, les FIXME sont là pour vous aider, supprimez-les une fois le problème corrigé ou le champ rempli ! | Contributeurs, les FIXME sont là pour vous aider, supprimez-les une fois le problème corrigé ou le champ rempli ! | ||
===== Introduction ===== | ===== Introduction ===== | ||
- | *[[doc:systeme:commandes:le_debianiste_qui_papillonne#les-fichiers|Les autres commandes sur les fichiers]]\\ | ||
- | *[[doc:systeme:commandes:creer#trouver-un-fichier|Trouver un fichier]] | ||
- | *[[doc:systeme:expand|commande expand]] | ||
- | *[[doc:systeme:split|commande split]] | ||
+ | Pour les commandes principales de gestion des fichiers : | ||
+ | * [[doc:systeme:commandes:creer|Les commandes Linux de gestion des fichiers et répertoires]] | ||
+ | |||
+ | Nous allons aborder quelques commandes complémentaires permettant de : | ||
+ | |||
+ | * améliorer l'affichage : fmt ; nl | ||
+ | * combiner le contenu de fichiers : join ; paste | ||
+ | * transformer le contenu de fichiers : sort ; split ; tr ; uniq ; expand et unexpand | ||
+ | |||
+ | |||
+ | |||
+ | ===== la commande fmt===== | ||
+ | ===Syntaxe === | ||
+ | |||
+ | fmt [options] [fichier...] | ||
+ | | ||
+ | === Préparation=== | ||
+ | Création du fichier "~/Essai-text-processing/essai-fmt" | ||
+ | |||
+ | <code user> | ||
+ | cat > ~/Essai-text-processing/essai-fmt <<EOF | ||
+ | > chez debian-facile c'est facile ... très facile ... très très facile ... très très très très très très facile ... | ||
+ | facile et encore facile ! | ||
+ | > EOF | ||
+ | </code> | ||
+ | |||
+ | ===Affichage du contenu d'un fichier en respectant les mots === | ||
+ | |||
+ | * Affichage avec la commande ''cat'' | ||
+ | <code user> | ||
+ | cat ~/Essai-text-processing/essai-fmt | ||
+ | </code> | ||
+ | <code> | ||
+ | chez debian-facile c'est facile ... très facile ... très très facile ... très tr | ||
+ | ès très très très très facile ... facile et encore facile ! | ||
+ | </code> | ||
+ | |||
+ | >L'affichage avec la commande ''cat'' peut être difficile à lire. | ||
+ | |||
+ | * Affichage avec la commande ''fmt'' : | ||
+ | <code user> | ||
+ | fmt ~/Essai-text-processing/essai-fmt | ||
+ | </code> | ||
+ | <code> | ||
+ | chez debian-facile c'est facile ... très facile ... très très facile | ||
+ | ... très très très très très très facile ... facile et encore | ||
+ | facile ! | ||
+ | </code> | ||
+ | <note> | ||
+ | * Par défaut, la commande ''fmt'' affiche le contenu d'un fichier par ligne de 75 caractères maximum. | ||
+ | * L'option ''-w'' : pour indiquer le nombre de caractère par ligne | ||
+ | <code user> | ||
+ | fmt -w 20 ~/Essai-text-processing/essai-fmt | ||
+ | </code> | ||
+ | <code> | ||
+ | chez debian-facile | ||
+ | c'est facile | ||
+ | ... très facile | ||
+ | ... très très | ||
+ | facile ... très | ||
+ | très très très | ||
+ | très très facile | ||
+ | ... facile et | ||
+ | encore facile ! | ||
+ | </code> | ||
+ | </note> | ||
+ | |||
+ | ===Combiner fmt et less pour encore plus de lisibilité === | ||
+ | <code user> | ||
+ | fmt -w 20 ~/Essai-text-processing/essai-fmt | less | ||
+ | </code> | ||
+ | <code> | ||
+ | chez debian-facile | ||
+ | c'est facile | ||
+ | ... très facile | ||
+ | ... très très | ||
+ | facile ... très | ||
+ | très très très | ||
+ | très très facile | ||
+ | ... facile et | ||
+ | encore facile ! | ||
+ | (END) | ||
+ | </code> | ||
+ | * Voir [[doc:editeurs:less| la commande less]] | ||
+ | |||
+ | =====La commande nl ===== | ||
+ | Permet de numéroter l'affichage d'un fichier. | ||
+ | |||
+ | ===Syntaxe === | ||
+ | |||
+ | nl [options] [fichier...] | ||
+ | |||
+ | ===Préparation === | ||
+ | * copie du fichier ~/.bashrc et visualisation : | ||
+ | |||
+ | <code user> | ||
+ | cat ~/.bashrc >> ~/Essai-text-processing/bashrc-bis | ||
+ | </code> | ||
+ | * comparons avec l'affichage de less | ||
+ | <code user> | ||
+ | less ~/Essai-text-processing/bashrc-bis | ||
+ | </code> | ||
+ | |||
+ | <code> | ||
+ | # ~/.bashrc: executed by bash(1) for non-login shells. | ||
+ | # see /usr/share/doc/bash/examples/startup-files (in the package bash-doc) | ||
+ | # for examples | ||
+ | |||
+ | # If not running interactively, don't do anything | ||
+ | case $- in | ||
+ | *i*) ;; | ||
+ | *) return;; | ||
+ | esac | ||
+ | </code> | ||
+ | >Premières lignes du retour. | ||
+ | |||
+ | ===Affichage numéroté === | ||
+ | <code> | ||
+ | nl ~/Essai-text-processing/bashrc-bis | ||
+ | </code user> | ||
+ | |||
+ | <code> | ||
+ | 1 # ~/.bashrc: executed by bash(1) for non-login shells. | ||
+ | 2 # see /usr/share/doc/bash/examples/startup-files (in the package bash-doc) | ||
+ | 3 # for examples | ||
+ | |||
+ | 4 # If not running interactively, don't do anything | ||
+ | 5 case $- in | ||
+ | 6 *i*) ;; | ||
+ | 7 *) return;; | ||
+ | 8 esac | ||
+ | |||
+ | </code> | ||
+ | |||
+ | >Premières lignes du retour | ||
+ | |||
+ | ===Pour encore plus de lisibilité === | ||
+ | |||
+ | <code user> | ||
+ | fmt -w 65 ~/Essai-text-processing/bashrc-bis | nl ~/Essai-text-processing/bashrc-bis | less | ||
+ | </code> | ||
+ | <code> | ||
+ | 1 # ~/.bashrc: executed by bash(1) for non-login shells. | ||
+ | 2 # see /usr/share/doc/bash/examples/startup-files (in the package bash-doc) | ||
+ | 3 # for examples | ||
+ | |||
+ | 4 # If not running interactively, don't do anything | ||
+ | 5 case $- in | ||
+ | 6 *i*) ;; | ||
+ | 7 *) return;; | ||
+ | 8 esac | ||
+ | |||
+ | </code> | ||
+ | |||
+ | >Premières lignes du retour | ||
+ | |||
+ | <note> | ||
+ | Par défaut la commande nl numérote les lignes non-vides. | ||
+ | * Quelques options :\\ | ||
+ | - -b : numérotation des lignes vides | ||
+ | - -b -t[expression régulière] : affiche tout mais numérote les lignes qui correspondent à l'expression régulière | ||
+ | - -n ln : affichage avec numérotation tout à droit. | ||
+ | - -n rn : affichage par défaut, c'est-à-dire avec une tabulation à droite avec le chiffre de la numérotation. | ||
+ | - -n rz : affichage de zéro entre le bord droit et le chiffre de numérotation | ||
+ | * voir man nl pour plus de meilleures explications. | ||
+ | </note> | ||
=====La commande join ===== | =====La commande join ===== | ||
===Syntaxe de la commande join === | ===Syntaxe de la commande join === | ||
Ligne 31: | Ligne 192: | ||
cat ~/Essai-text-processing/users | cat ~/Essai-text-processing/users | ||
</code> | </code> | ||
- | retour : | ||
<code> | <code> | ||
01 Toto | 01 Toto | ||
Ligne 42: | Ligne 202: | ||
</code> | </code> | ||
- | Retour : | ||
<code> | <code> | ||
toto@gmail.com 01 | toto@gmail.com 01 | ||
Ligne 54: | Ligne 213: | ||
join -1 1 -2 2 ~/Essai-text-processing/users ~/Essai-text-processing/infos-users | join -1 1 -2 2 ~/Essai-text-processing/users ~/Essai-text-processing/infos-users | ||
</code> | </code> | ||
- | * option -1 : donne le n° de colonne du champ commun, pour le premier document | ||
- | * 1 : premier fichier | ||
- | * option -2 : n° de colonne du champ commun, pour le deuxième document | ||
- | * 2 : deuxième fichier | ||
- | * -j option CHAMP : équivalent à « -1 CHAMP -2 CHAMP » | ||
- | * -i : ignorer les différences de casse | ||
- | * voir man join pour plus d'option | ||
- | |||
- | Retour : | ||
<code> | <code> | ||
01 Toto toto@gmail.com | 01 Toto toto@gmail.com | ||
Ligne 68: | Ligne 218: | ||
03 Lili lili@hotmail.com | 03 Lili lili@hotmail.com | ||
</code> | </code> | ||
+ | * Explications : | ||
+ | * l'option ''-1'' : donne le n° de colonne du champ commun, pour le premier document | ||
+ | * 1 : premier fichier | ||
+ | * l'option ''-2'' : n° de colonne du champ commun, pour le deuxième document | ||
+ | * 2 : deuxième fichier | ||
+ | * D'autres options utiles : | ||
+ | * ''-j'' (option CHAMP) : équivalent à « -1 CHAMP -2 CHAMP » | ||
+ | * ''-i'' : ignorer les différences de casse | ||
+ | * voir ''man join'' pour plus d'options | ||
+ | |||
<note> | <note> | ||
- | Pour fusionner des fichiers qui ont en commun ":"\ | + | Pour fusionner des fichiers qui ont en commun '':''\\ |
- | join -t':' -2 1 -2 2 fichier1 fichier2 | + | ''join -t':' -2 1 -2 2 fichier1 fichier2'' |
</note> | </note> | ||
- | === concaténation de la fusion dans un fichier=== | + | === Concaténation de la fusion dans un fichier=== |
<code user> | <code user> | ||
join -1 1 -2 2 ~/Essai-text-processing/users ~/Essai-text-processing/infos-users > ~/Essai-text-processing/adr-users | join -1 1 -2 2 ~/Essai-text-processing/users ~/Essai-text-processing/infos-users > ~/Essai-text-processing/adr-users | ||
</code> | </code> | ||
- | ===vérification === | + | ===Vérification === |
<code user> | <code user> | ||
cat ~/Essai-text-processing/adr-users | cat ~/Essai-text-processing/adr-users | ||
Ligne 97: | Ligne 257: | ||
<code user> | <code user> | ||
cat ~/Essai-text-processing/users | cat ~/Essai-text-processing/users | ||
- | # retour : | + | </code> |
+ | <code> | ||
01 Toto | 01 Toto | ||
02 Titi | 02 Titi | ||
03 Lili | 03 Lili | ||
+ | </code> | ||
+ | <code user> | ||
cat ~/Essai-text-processing/infos-users | cat ~/Essai-text-processing/infos-users | ||
- | #retour : | + | </code> |
+ | <code> | ||
toto@gmail.com 01 | toto@gmail.com 01 | ||
titi@gmx.fr 02 | titi@gmx.fr 02 | ||
Ligne 110: | Ligne 273: | ||
===Regroupement des lignes des deux fichiers === | ===Regroupement des lignes des deux fichiers === | ||
- | Retour: | ||
<code user> | <code user> | ||
paste ~/Essai-text-processing/users ~/Essai-text-processing/infos-users | paste ~/Essai-text-processing/users ~/Essai-text-processing/infos-users | ||
</code> | </code> | ||
- | |||
- | Retour : | ||
<code> | <code> | ||
Ligne 141: | Ligne 301: | ||
sort [options [+POS1] [-POS2]] [fichier...] | sort [options [+POS1] [-POS2]] [fichier...] | ||
- | ===Préparation=== | + | <note tip> |
+ | __La commande sort permet__ : | ||
- | Soit le fichier "~/Essai-text-processing/users.sort" | + | * d'afficher le contenu de fichiers ; |
+ | * de trier les lignes d'un fichier texte, en fonction des colonnes. | ||
+ | __ | ||
+ | Les options utiles__: | ||
+ | |||
+ | * **''-o''** : inscrire la sortie dans un fichier | ||
+ | * **''-t''** : pour spécifier le séparateur (par défaut ce sont les espaces ou les tabulations qui délimitent les colonnes) | ||
+ | * **''-k''** : pour spécifier la colonne (à la place de +POS1 -POS2) | ||
+ | * **''-n''** : pour spécifier qu'il s'agit d'un tri numérique | ||
+ | * **''-d''** : pour tri dictionnaire | ||
+ | * **''-r''** : pour un tri inverse (-rn [inverse de numérique] ou -rd [inverse d'alphabétique]) | ||
+ | * **''-M''** : ordre chronologique | ||
+ | * **''-h''** : comparer des nombres dans un format lisible par un humain (par exemple, 2K 1G) | ||
+ | * **''-f''** : (ignore-case) convertir les minuscules en majuscule | ||
+ | |||
+ | Voir man sort pour les autres options. | ||
+ | </note> | ||
+ | |||
+ | ====Affichage de plusieurs fichiers avec sort ==== | ||
+ | |||
+ | * Comparaison avec la commande cat : | ||
<code user> | <code user> | ||
- | cat ~/Essai-text-processing/users.sort | + | cat sort1.txt |
- | # Retour | + | </code> |
- | 5 Papi | + | <code> |
- | 1 Toto | + | 5 1 Amandine |
- | 3 Lili | + | 1 7 Bruno |
- | 2 Titi | + | 3 2 Caroline |
- | 4 Mami | + | |
- | 003 Zaza | + | |
- | 01 Nani | + | |
</code> | </code> | ||
- | === tri par défaut=== | ||
<code user> | <code user> | ||
- | sort ~/Essai-text-processing/users.sort | + | cat sort2.txt |
- | # Retour : | + | <code>=== |
- | 003 Zaza | + | 2 5 Daniel |
- | 01 Nani | + | 2 6 Émilien |
- | 1 Toto | + | 0 3 Fabrice |
- | 2 Titi | + | 0 4 Guillaume |
- | 3 Lili | + | |
- | 4 Mami | + | |
- | 5 Papi | + | |
</code> | </code> | ||
- | ===Tri alphabétique d'une simple colonne=== | + | >Dans chacun de ses deux fichiers, les lignes ne sont pas rangées en fonction des colonnes |
<code user> | <code user> | ||
- | cat ~/Essai-text-processing/sort.abc | + | sort sort1.txt sort2.txt |
- | # Retour: | + | |
- | tomate | + | |
- | fraise | + | |
- | abricot | + | |
- | ananas | + | |
- | kiwi | + | |
- | pomme | + | |
</code> | </code> | ||
+ | <code> | ||
+ | 0 3 Fabrice | ||
+ | 0 4 Guillaume | ||
+ | 1 7 Bruno | ||
+ | 2 5 Daniel | ||
+ | 2 6 Émilien | ||
+ | 3 2 Caroline | ||
+ | 5 1 Amandine | ||
+ | </code> | ||
+ | |||
+ | >Même sans option, les deux fichiers ont été concaténés et leurs lignes rangées par ordre numérique croissant en fonction de la première colonne. | ||
+ | >Si des doublons apparaissent dans la première colonne pour deux lignes consécutives, ces deux lignes seront rangées en fonction de leur deuxième colonne. | ||
+ | |||
+ | ====Enregistrer le résultat : option -o ==== | ||
+ | |||
+ | * Concaténer "sort1.txt" et "sort2.txt" et inscrire le résultat dans un fichier : | ||
<code user> | <code user> | ||
- | sort ~/Essai-text-processing/sort.abc | + | sort -o sort3.txt sort1.txt sort2.txt |
- | # Retour: | + | |
- | abricot | + | |
- | ananas | + | |
- | fraise | + | |
- | kiwi | + | |
- | pomme | + | |
- | tomate | + | |
</code> | </code> | ||
- | ===Tri avec choix de colonne === | ||
<code user> | <code user> | ||
- | cat ~/Essai-text-processing/sort.abc | + | cat sort3.txt |
- | # Retour : | + | |
- | tomate:4 | + | |
- | fraise:1 | + | |
- | abricot:2 | + | |
- | ananas:6 | + | |
- | kiwi:5 | + | |
- | pomme:3 | + | |
</code> | </code> | ||
+ | <code> | ||
+ | 0 3 Fabrice | ||
+ | 0 4 Guillaume | ||
+ | 1 7 Bruno | ||
+ | 2 5 Daniel | ||
+ | 2 6 Émilien | ||
+ | 3 2 Caroline | ||
+ | 5 1 Amandine | ||
+ | </code> | ||
+ | |||
+ | ====Trier selon un ordre alphabétique d'une colonne : option -d==== | ||
+ | |||
+ | |||
+ | * soit le fichier "alpha-sort.txt" déjà trié par ordre numérique selon les colonnes 1 et 2 pour les doublons : | ||
<code user> | <code user> | ||
- | sort -t':' -k 2n ~/Essai-text-processing/sort.abc | + | cat alpha-sort.txt |
- | fraise:1 | + | </code> |
- | abricot:2 | + | <code> |
- | pomme:3 | + | 1 2 Francine |
- | tomate:4 | + | 2 3 Édith |
- | kiwi:5 | + | 3 4 Géraldine |
- | ananas:6 | + | 4 5 Béatrice |
+ | 5 6 Christelle | ||
+ | 5 7 Dorothée | ||
+ | 6 8 Amanda | ||
+ | </code> | ||
+ | |||
+ | * Pour le trier selon l'ordre alphabétique d'une colonne : | ||
+ | Si on indique le type (numérique ou alphabétique), c'est que le type de la première colonne ne nous intéresse pas.\\ | ||
+ | Par exemple ici, le fichier est rangé selon l'ordre numérique selon ses colonnes 1 et 2. | ||
+ | <code user> | ||
+ | sort -k3d alpha-sort.txt | ||
+ | </code> | ||
+ | <code> | ||
+ | 6 8 Amanda | ||
+ | 4 5 Béatrice | ||
+ | 5 6 Christelle | ||
+ | 2 3 Édith | ||
+ | 5 7 Dorothée | ||
+ | 1 2 Francine | ||
+ | 3 4 Géraldine | ||
+ | </code> | ||
+ | |||
+ | > l'option -k pour indiquer qu'on va utiliser une colonne spécifique pour le tri; | ||
+ | >3 pour spécifier le n° de colonne | ||
+ | >d pour spécifier le type de tri "dictionnaire" ou ordre alphabétique | ||
+ | |||
+ | ====Trier selon l'ordre numérique d'une colonne==== | ||
+ | * soit le fichier "sort.txt" : | ||
+ | |||
+ | <code user> | ||
+ | cat sort.txt | ||
+ | </code> | ||
+ | <code> | ||
+ | pomme 2 | ||
+ | fraise 6 | ||
+ | abricot 9 | ||
+ | kiwi 3 | ||
+ | </code> | ||
+ | |||
+ | * Pour ordonner ce fichier selon l'ordre numérique de la deuxième colonne : | ||
+ | |||
+ | <code user> | ||
+ | sort -k2n sort.txt | ||
+ | </code> | ||
+ | |||
+ | <code> | ||
+ | pomme 2 | ||
+ | kiwi 3 | ||
+ | fraise 6 | ||
+ | abricot 9 | ||
</code> | </code> | ||
<note tip> | <note tip> | ||
- | Les options très utiles: | + | Si on avait voulu ranger ce fichier selon l'ordre alphabétique, il aurait suffi de faire : |
- | * -t : pour spécifier le séparateur (par défaut ce sont les espaces ou les tabulations qui délimitent les colonnes) | + | |
- | * -k : pour spécifier la colonne | + | sort sort.txt |
- | * -2 : n° de colonne | + | |
- | * -n : pour spécifier qu'il s'agit d'un tri numérique | + | Il aurait été inutile d'indiquer la colonne car la première colonne comporte des chaînes de caractères.\\ |
- | * -d : pour tri dictionnaire | + | |
- | * -r : pour un tri inverse (-rn ou -rd) | + | Comme vous l'aurez compris, par défaut, sort trie en fonction de la colonne n°1 selon le type qui est le sien, puis s'il faut, en fonction de la colonne n° 2, et du type qui est celui de cette deuxième colonne.\\ |
- | * -M : ordre chronologique | + | |
+ | En fait, sed s'adapte automatiquement au type du contenu de la première colonne, voire au type du contenu de la seconde colonne pour départager éventuellement les doublons de cette première colonne, même si les types diffèrent d'une colonne à l'autre.\\ | ||
</note> | </note> | ||
- | ===Tri selon plusieurs colonnes === | + | |
+ | ====Tri par défaut d'un fichier dont les colonnes présentent plusieurs types==== | ||
+ | |||
+ | * Soit fichier "xxx-sort.txt" désordonné selon ses types : | ||
<code user> | <code user> | ||
- | cat ~/Essai-text-processing/sort.123abc | + | cat xxx-sort.txt |
- | # Retour: | + | |
- | tomate:x:c | + | |
- | fraise:1 | + | |
- | abricot:2 | + | |
- | ananas:x:b | + | |
- | kiwi:x:a | + | |
- | pomme:3 | + | |
</code> | </code> | ||
+ | <code> | ||
+ | 10 fraise | ||
+ | pomme 6 | ||
+ | Titi grosminet | ||
+ | 25 8 | ||
+ | </code> | ||
+ | * Par défaut, sort trie selon l'ordre numérique d'abord puis par ordre alphabétique : | ||
<code user> | <code user> | ||
- | sort -t':' -k 2n -k 3d ~/Essai-text-processing/sort.123abc | + | sort xxx-sort.txt |
- | # Retour: | + | </code> |
- | kiwi:x:a | + | <code> |
- | ananas:x:b | + | 10 fraise |
- | tomate:x:c | + | 25 8 |
- | fraise:1 | + | pomme 6 |
- | abricot:2 | + | Titi grosminet |
- | pomme:3 | + | |
</code> | </code> | ||
- | === concaténer et créer un fichier avec la résultat=== | + | * de même pour l'autre colonne : |
+ | <code> | ||
+ | sort -k2 xxx-sort.txt | ||
+ | </code> | ||
+ | <code> | ||
+ | pomme 6 | ||
+ | 25 8 | ||
+ | 10 fraise | ||
+ | Titi grosminet | ||
+ | </code> | ||
+ | |||
+ | |||
+ | ====Trier selon plusieurs colonnes et différents types ==== | ||
+ | |||
+ | * Soit le fichier "sort4.txt" qui est un extrait du fichier **/etc/passwd** dont j'ai pris quelques lignes que ai interverties pour cet exemple : | ||
<code user> | <code user> | ||
- | sort -t':' -k 2n -k 3d ~/Essai-text-processing/sort.123abc > ~/Essai-text-processing/sort.123abc.ok | + | cat sort4.txt |
+ | </code> | ||
+ | <code> | ||
+ | daemon:x:1:1:daemon:/usr/sbin:/bin/sh | ||
+ | root:x:0:0:root:/root:/bin/bash | ||
+ | man:x:6:12:man:/var/cache/man:/bin/sh | ||
+ | bin:x:2:2:bin:/bin:/bin/sh | ||
+ | news:x:9:9:news:/var/spool/news:/bin/sh | ||
+ | sync:x:4:65534:sync:/bin:/bin/sync | ||
+ | games:x:5:60:games:/usr/games:/bin/sh | ||
+ | mail:x:8:8:mail:/var/mail:/bin/sh | ||
+ | lp:x:7:7:lp:/var/spool/lpd:/bin/sh | ||
+ | sys:x:3:3:sys:/dev:/bin/sh | ||
</code> | </code> | ||
- | ===Vérifier === | + | |
+ | * Pour faire un tri selon le shell des utilisateurs (7ième colonnes : type "dictionnaire") et en cas de doublon pour cette colonne, en fonction ensuite de l'UID (3ième colonne : type "numérique") | ||
<code user> | <code user> | ||
- | cat ~/Essai-text-processing/sort.123abc.okkiwi:x:a | + | sort -t':' -k 7d -k 3n sort4.txt |
- | # Retour : | + | |
- | ananas:x:b | + | |
- | tomate:x:c | + | |
- | fraise:1 | + | |
- | abricot:2 | + | |
- | pomme:3 | + | |
</code> | </code> | ||
+ | |||
+ | > **''-t':' ''** pour spécifier le séparateur **'':''** (par défaut c'est l'espace ou la tabulation, il faut donc indiquer le séparateur pour les fichiers de type.) | ||
+ | > **''-k''** pour indiquer les colonnes souhaitées | ||
+ | > **''7d''** pour **7**ième colonne type "**d**ictionnaire" | ||
+ | > **''3n''** pour **3**ième colonne type "**n**umérique" | ||
+ | |||
+ | <code> | ||
+ | root:x:0:0:root:/root:/bin/bash | ||
+ | daemon:x:1:1:daemon:/usr/sbin:/bin/sh | ||
+ | bin:x:2:2:bin:/bin:/bin/sh | ||
+ | sys:x:3:3:sys:/dev:/bin/sh | ||
+ | games:x:5:60:games:/usr/games:/bin/sh | ||
+ | man:x:6:12:man:/var/cache/man:/bin/sh | ||
+ | lp:x:7:7:lp:/var/spool/lpd:/bin/sh | ||
+ | mail:x:8:8:mail:/var/mail:/bin/sh | ||
+ | news:x:9:9:news:/var/spool/news:/bin/sh | ||
+ | sync:x:4:65534:sync:/bin:/bin/sync | ||
+ | </code> | ||
+ | |||
+ | |||
=====la commande tr ===== | =====la commande tr ===== | ||
Ligne 273: | Ligne 547: | ||
<code user> | <code user> | ||
cat ~/Essai-text-processing/tr-essai | cat ~/Essai-text-processing/tr-essai | ||
- | # retour: | + | </code> |
+ | <code> | ||
Pierre Paul Jacques | Pierre Paul Jacques | ||
</code> | </code> | ||
Ligne 279: | Ligne 554: | ||
<code user> | <code user> | ||
tr P p < ~/Essai-text-processing/tr-essai | tr P p < ~/Essai-text-processing/tr-essai | ||
+ | </code> | ||
+ | <code> | ||
pierre paul Jacques | pierre paul Jacques | ||
</code> | </code> | ||
Ligne 284: | Ligne 561: | ||
<code user> | <code user> | ||
cat ~/Essai-text-processing/tr-essai | cat ~/Essai-text-processing/tr-essai | ||
- | # retour: | + | </code> |
+ | <code> | ||
Pierre Paul Jacques | Pierre Paul Jacques | ||
</code> | </code> | ||
Ligne 290: | Ligne 568: | ||
<code user> | <code user> | ||
tr P X < ~/Essai-text-processing/tr-essai | tr P X < ~/Essai-text-processing/tr-essai | ||
+ | </code> | ||
+ | <code> | ||
Xierre Xaul Jacques | Xierre Xaul Jacques | ||
</code> | </code> | ||
Ligne 295: | Ligne 575: | ||
<code user> | <code user> | ||
cat ~/Essai-text-processing/tr-essai | cat ~/Essai-text-processing/tr-essai | ||
- | # retour : | + | </code> |
+ | <code> | ||
Pierre Paul Jacques | Pierre Paul Jacques | ||
</code> | </code> | ||
Ligne 301: | Ligne 582: | ||
<code user> | <code user> | ||
tr PJ pj < ~/Essai-text-processing/tr-essai | tr PJ pj < ~/Essai-text-processing/tr-essai | ||
+ | </code> | ||
+ | <code> | ||
pierre paul jacques | pierre paul jacques | ||
</code> | </code> | ||
Ligne 315: | Ligne 598: | ||
<code user> | <code user> | ||
cat ~/Essai-text-processing/users-uniq | cat ~/Essai-text-processing/users-uniq | ||
- | # Retour: | + | </code> |
+ | <code> | ||
Papi | Papi | ||
1 Toto | 1 Toto | ||
Ligne 324: | Ligne 608: | ||
01 Nani | 01 Nani | ||
</code> | </code> | ||
- | ===ajouter une ligne=== | + | ===Ajouter une ligne=== |
<code user> | <code user> | ||
echo 01 Nani >> ~/Essai-text-processing/users-uniq | echo 01 Nani >> ~/Essai-text-processing/users-uniq | ||
Ligne 332: | Ligne 616: | ||
<code user> | <code user> | ||
cat ~/Essai-text-processing/users-uniq | cat ~/Essai-text-processing/users-uniq | ||
- | # Retour: | + | </code> |
+ | <code> | ||
5 Papi | 5 Papi | ||
1 Toto | 1 Toto | ||
Ligne 351: | Ligne 636: | ||
<code user> | <code user> | ||
cat ~/Essai-text-processing/users-sort-uniq | cat ~/Essai-text-processing/users-sort-uniq | ||
- | # Retour : | + | </code> |
+ | <code> | ||
003 Zaza | 003 Zaza | ||
01 Nani | 01 Nani | ||
Ligne 367: | Ligne 653: | ||
===Préparation === | ===Préparation === | ||
- | Création du fichier "~/Essai-text-processing/liste-fruits" | + | * Création du fichier "~/Essai-text-processing/liste-fruits" : |
<code user> | <code user> | ||
Ligne 377: | Ligne 663: | ||
</code> | </code> | ||
- | Vérification : | + | * Vérification : |
<code user> | <code user> | ||
cat ~/Essai-text-processing/liste-fruits | cat ~/Essai-text-processing/liste-fruits | ||
- | # Retour: | + | </code> |
+ | <code> | ||
1 fraise | 1 fraise | ||
2 abricot | 2 abricot | ||
3 pomme | 3 pomme | ||
</code> | </code> | ||
- | ===Découpage en taille et répartition en autant de fichiers === | + | ====Découpage par taille et répartition en autant de fichiers ==== |
<note> | <note> | ||
* options de découpage par taille :\\ | * options de découpage par taille :\\ | ||
Ligne 400: | Ligne 687: | ||
* Remarque:\\ | * Remarque:\\ | ||
- | Il faut 8 bit pour faire 1 byte (1 octet) | + | Il faut 8 bits pour faire 1 byte (1 octet) |
- bit : c'est **Bi**naryDigi**T** : un bit est un chiffre binaire, la valeur d'un bit, c'est 0 ou 1. | - bit : c'est **Bi**naryDigi**T** : un bit est un chiffre binaire, la valeur d'un bit, c'est 0 ou 1. | ||
- byte : terme anglais pour octet. L'ordinaire calcule sur un ou plusieurs byte. | - byte : terme anglais pour octet. L'ordinaire calcule sur un ou plusieurs byte. | ||
</note> | </note> | ||
- | * exemple de découpage par taille d'un octet avec le préfixe "fruit1b" | + | * Exemple de découpage par taille d'un octet avec le préfixe ''fruit1b'' : |
<code user> | <code user> | ||
split -C 1b ~/Essai-text-processing/liste-fruits fruit1b | split -C 1b ~/Essai-text-processing/liste-fruits fruit1b | ||
</code> | </code> | ||
- | Le fichier n'est pas lourd et le découpage en taille de 1 byte (=octet) ne le découpe pas : | + | |
+ | >Le fichier n'est pas lourd et le découpage en taille de 1 byte (=octet) ne le découpe pas : | ||
<code user> | <code user> | ||
ls fruit1b* | ls fruit1b* | ||
- | # Retour | + | </code> |
+ | <code> | ||
fruit1baa | fruit1baa | ||
</code> | </code> | ||
- | Un seul fichier a été créé : | + | >Un seul fichier a été créé. |
+ | |||
<code user> | <code user> | ||
cat fruit1b* | cat fruit1b* | ||
- | # Retour : | + | </code> |
+ | <code> | ||
1 fraise | 1 fraise | ||
2 abricot | 2 abricot | ||
3 pomme | 3 pomme | ||
</code> | </code> | ||
- | Et le fichier et créé dans le répertoire dans lequel le terminal est ouvert.\ | + | |
- | Pour que le fichier créé lors du découpage soit dans le répertoire du fichier à découper : | + | >Le fichier est créé dans le répertoire dans lequel le terminal est ouvert.\\ |
+ | Pour que le fichier créé, lors du découpage, se retrouve dans le répertoire du fichier à découper : | ||
<code user> | <code user> | ||
split -C 1b ~/Essai-text-processing/liste-fruits fruit1b && mv fruit1b* ~/Essai-text-processing/ | split -C 1b ~/Essai-text-processing/liste-fruits fruit1b && mv fruit1b* ~/Essai-text-processing/ | ||
- | #puis | + | </code> |
+ | <code> | ||
ls ~/Essai-text-processing/fruit1b* | ls ~/Essai-text-processing/fruit1b* | ||
- | # Retour: | + | </code> |
+ | <code> | ||
/home/hypathie/Essai-text-processing/fruit1baa | /home/hypathie/Essai-text-processing/fruit1baa | ||
</code> | </code> | ||
- | Ou | + | * Ou encore : |
<code user> | <code user> | ||
cd Essai-text-processing/ | cd Essai-text-processing/ | ||
- | # puis: | + | </code> |
+ | <code user> | ||
split -C 1b ~/Essai-text-processing/liste-fruits fruit1b | split -C 1b ~/Essai-text-processing/liste-fruits fruit1b | ||
- | # puis : | + | </code> |
+ | <code user> | ||
ls fruit1b* | ls fruit1b* | ||
+ | </code> | ||
+ | <code> | ||
fruit1baa | fruit1baa | ||
</code> | </code> | ||
- | ===Découpage par ligne === | + | ====Découpage par ligne ==== |
<note> | <note> | ||
* option de découpage par ligne qui détermine le découpage :\\ | * option de découpage par ligne qui détermine le découpage :\\ | ||
Ligne 456: | Ligne 755: | ||
<code user> | <code user> | ||
cd Essai-text-processing/ | cd Essai-text-processing/ | ||
- | # puis: | + | </code> |
+ | <code user> | ||
split -l 1 ~/Essai-text-processing/liste-fruits | split -l 1 ~/Essai-text-processing/liste-fruits | ||
- | # puis: | + | </code> |
+ | <code user> | ||
ls x* | ls x* | ||
- | # Retour: | + | </code> |
+ | <code> | ||
xaa xab xac | xaa xab xac | ||
- | # puis: | + | </code> |
+ | <code user> | ||
cat x* | cat x* | ||
- | # Retour : | + | </code> |
+ | <code> | ||
1 fraise | 1 fraise | ||
2 abricot | 2 abricot | ||
Ligne 470: | Ligne 774: | ||
</code> | </code> | ||
- | =====La commande nl ===== | + | =====La commande unexpand ===== |
+ | La commande "unexpand" peut servir à convertir un groupe de sept espaces en une tabulation. | ||
+ | |||
+ | ===Syntaxe === | ||
+ | |||
+ | unexpand [-a] [fichier...] | ||
+ | |||
+ | === Préparation=== | ||
+ | * Création du fichier "~/Essai-text-processing/users-infos-espaces" | ||
+ | * Avec 7 ou plus espaces pour ligne 1 et 3 | ||
+ | * Avec moins de 7 espaces pour ligne 2 | ||
+ | <code user> | ||
+ | cat > ~/Essai-text-processing/users-infos-espaces<<EOF | ||
+ | > 01 Toto toto@gmx.fr modo | ||
+ | > 02 Titi titi@gmail.com membre | ||
+ | > 03 Lili lili@hotmail.com membre | ||
+ | > EOF | ||
+ | </code> | ||
+ | <note> | ||
+ | Ci-dessus ce sont plusieurs espaces qui sont insérés entre les chaînes de caractères. | ||
+ | Pour intégrer le contenu d'un fichier avec les redirections et EOF, la touche tabulation ne fonctionne pas. | ||
+ | </note> | ||
+ | ====Convertir des espaces en tabulation ==== | ||
+ | ===Affichage avec cat : ce sont des espaces === | ||
+ | <code user> | ||
+ | cat ~/Essai-text-processing/users-infos-espaces | ||
+ | # Retour : | ||
+ | 01 Toto toto@gmx.fr modo | ||
+ | 02 Titi titi@gmail.com membre | ||
+ | 03 Lili lili@hotmail.com membre | ||
+ | </code> | ||
+ | ===Conversion des espaces en tabulation === | ||
+ | <code user> | ||
+ | unexpand -a ~/Essai-text-processing/users-infos-espaces | ||
+ | </code> | ||
+ | <code> | ||
+ | 01 Toto toto@gmx.fr modo | ||
+ | 02 Titi titi@gmail.com membre | ||
+ | 03 Lili lili@hotmail.com membre | ||
+ | |||
+ | </code> | ||
+ | <note> | ||
+ | * Option ''-a'' pour que la conversion des espaces ait lieu partout et pas seulement pour les espaces constituants la première colonnes de droite. | ||
+ | * Les groupes de moins de sept espaces consécutifs n'ont pas été convertis en tabulation. | ||
+ | </note> | ||
+ | =====La commande "expand" ===== | ||
+ | La commande "expand" peut servir à convertir les tabulations en espaces. | ||
+ | |||
+ | ===Syntaxe === | ||
+ | |||
+ | expand [-t numero] [fichier...] | ||
+ | |||
+ | ===Préparation === | ||
+ | Soit le fichier "~/Essai-text-processing/users-infos-tabul" contenant des tabulations | ||
+ | <code user> | ||
+ | unexpand -a ~/Essai-text-processing/users-infos-espaces > ~/Essai-text-processing/users-infos-tabul | ||
+ | </code> | ||
+ | |||
+ | === Visualisation=== | ||
+ | |||
+ | <code user> | ||
+ | cat ~/Essai-text-processing/users-infos-tabul | ||
+ | # Retour : | ||
+ | 01 Toto toto@gmx.fr modo | ||
+ | 02 Titi titi@gmail.com membre | ||
+ | 03 Lili lili@hotmail.com membre | ||
+ | |||
+ | </code> | ||
+ | ====Convertion des tabulations en espaces==== | ||
+ | |||
+ | <code user> | ||
+ | expand ~/Essai-text-processing/users-infos-tabul | ||
+ | # Retour : | ||
+ | 01 Toto toto@gmx.fr modo | ||
+ | 02 Titi titi@gmail.com membre | ||
+ | 03 Lili lili@hotmail.com membre | ||
+ | |||
+ | </code> | ||
+ | ==== Déterminer le nombre d'espaces qui remplaceront chaque tabulation==== | ||
+ | * option ''-t'' nombre | ||
+ | <code user> | ||
+ | expand -t 1 ~/Essai-text-processing/users-infos-tabul | ||
+ | # Retour : | ||
+ | 01 Toto toto@gmx.fr modo | ||
+ | 02 Titi titi@gmail.com membre | ||
+ | 03 Lili lili@hotmail.com membre | ||
+ | </code> | ||
+ | ====Aller plus loin avec les commandes expand et unexpand ==== | ||
+ | Voir : [[doc:systeme:expand |expand]] | ||