Vous n'êtes pas identifié(e).
L'icône rouge permet de télécharger chaque page du wiki visitée au format PDF et la grise au format ODT →
L'acronyme2) grep vient de la contraction de Get Regular Expression Print, Print signifiant l'affichage.
Le programme grep explore un ou une série de fichiers d'un ou plusieurs répertoires à la recherche de textes filtrés par une expression régulière donnée (des lettres, des chiffres… ).
Créez un répertoire test1 avec un fichier nommé essai.txt comportant des noms et prénoms avec la commande cat :
mkdir test1
Créez le fichier3) essai.txt ainsi :
touch essai.txt
Et rédigez4) ce fichier test1/essai.txt ainsi :
cat > test1/essai.txt <<EOF tartempion eric greg lucien howard charles santiago germaine EOF
Utilisez la commande cat pour en vérifier le contenu :
cat test1/essai.txt
tartempion eric greg lucien howard charles santiago germaine
De la même façon que précédemment, créons un second répertoire nommé test2
dans lequel nous créons le fichier adresse.c contenant les chaînes de caractères suivantes :
cat > test2/adresse.c <<EOF 25, rue de la source 5bis, avenue linux 3358, street gandhi EOF
On vérifie les deux fichiers d'un coup ainsi :
cat ~/test1/essai.txt ~/test2/adresse.c
tartempion eric greg lucien howard charles santiago germaine 25, rue de la source 5bis, avenue linux 3358, street gandhi
grep
agit sur le fichier d'entrée (stdin). La commande suivante présente toutes les lignes du fichier essai.txt qui contiennent le caractère “c” :
grep c ~/test1/essai.txt
tartempion eric greg lucien howard charles
Et celle-là pour la lettre “u” :
grep u ~/test1/essai.txt
greg lucien
La commande grep
peut être étendue à tous les fichiers d'un répertoire, ou encore à tous les fichiers correspondant à un certain masque.
Dans l'exemple qui suit : grep a te*/*
, la commande grep
explorera dans le répertoire :
grep a ~/te*/*
test1/essai.txt:tartempion eric test1/essai.txt:howard charles test2/adresse.c:25, rue de la source test2/adresse.c:5bis, avenue linux test2/adresse.c:3358, street gandhi
L'option -n
ajoute le numéro de ligne, ainsi :
grep -n a ~/te*/*
test1/essai.txt:2:tartempion eric test1/essai.txt:4:howard charles test2/adresse.c:1:25, rue de la source test2/adresse.c:2:5bis, avenue linux test2/adresse.c:3:3358, street gandhi
L'option -i
permet d'ignorer la case (ne fait pas la distinction entre les lettres majuscules et minuscules).
L'option -v
fait la négation, c'est-à-dire qu'elle affiche toutes les lignes, SAUF celles qui contiennent la chaîne de caractères donnée.
L'option -c
ne donne que le nombre de lignes où la chaîne apparaît sans afficher ces lignes.
L'option -m N occurrence
: permet d'arrêter de lire un fichier après avoir trouvé N ligne(s) avec occurrence.
Les expressions rationnelles, ou regexp, peuvent remplacer la chaîne de caractères dans l'argument du programme grep.
Voici des exemples :
Expression | Valeur |
---|---|
abc | Cherche la chaîne abc n'importe où dans la ligne. |
^abc | Cherche la chaîne abc en début de ligne. |
abc$ | Cherche la chaîne abc en fin de ligne. |
^abc$ | Cherche les ligne ne contenant que abc (commençant et se terminant par abc). |
st[a-z][a-z]ic | Cherche n'importe quelle chaîne de caractères commençant par st, suivie de deux lettres minuscules et se terminant par ic (i.e static). |
^int * main | Cherche n'importe quelle chaîne de caractères en début de ligne commençant par int, suivie de n'importe quoi et se terminant par argc (i.e int main (int argc, char **argv)). |
X[0-2][0-9] | Cherche n'importe quelle chaîne de caractères commençant par X, suivie de 0, 1, ou 2 et se terminant par un chiffre (i.e X11). |
Nota :
Programme grep avec expressions rationnelles :
Il faut toutefois prendre un soin particulier lorsque l'on utilise les caractères spéciaux :
$, *, [, ], ^, |, (, )
dans l'expression régulière car ces caractères ont une signification particulière pour le shell.
Il vaut mieux mettre l'expression régulière entre apostrophes simples ou doubles '…' ou “…”
comme ceci par exemple :
grep -n "^t" te*/*
test1/essai.txt:2:tartempion eric
Notez que les champs des lignes produites par grep
(le nom du fichier, le numéro de ligne et la ligne elle-même) sont délimitées par des deux points “:”, ce qui leur permet d'être traités à postériori par le programme awk dans des TUBES.
Pour plus d'information sur la commande grep, lancez :
man grep
Je suis avec une ligne de texte indiquant les fichiers des films d'une cinémathèque se présentant avec des dossier-titres&fichiers-films alternés.
Je désire créer la liste de l'ensemble.
Je commence par utiliser la commande tree.
Je me retrouve donc avec une liste_films.txt où les titres des dossiers et ceux des films sont indiqués l'un dessous de l'autre, il me faut donc supprimer toutes les lignes des fichiers des films et ne conserver que celles des répertoires, sans extension mp4,
Facile, ils ont tous leur extension propre, mp4.mkv ou VOB.
Trêve de détail, voici la commande qui a conservé la ligne des titres des répertoires et supprimé toutes celles des films :
On se place où se situe le fichier des films titré avec tree, par exemple un fichier qu'on aura nommé liste.txt, et on envoi le bouzin :
grep -viE "\.(mkv|mp4|vob)" liste.txt
Et il ne nous reste plus qu'à créer le nouveau fichier.txt correctement trié à l'aide des commandes cat et chevron assemblées.
Merci au captnfab qui a tout soufflé le procédé !