logo Debian Debian Debian-France Debian-Facile Debian-fr.org Forum-Debian.fr Debian ? Communautés logo inclusivité

Debian-facile

Bienvenue sur Debian-Facile, site d'aide pour les nouveaux utilisateurs de Debian.

Vous n'êtes pas identifié(e).


L'icône rouge permet de télécharger chaque page du wiki visitée au format PDF et la grise au format ODT → ODT PDF Export

Ceci est une ancienne révision du document !


Bash : Introduction

Voici une étude du Bash qui prend comme entrée les différents caractères.
Plus précisément, j'ai suivi la page man bash et j'ai tenté d'en expliquer et d'en illustrer le détail par des exemples.
Cette étude est développée sur huit wiki (voir la liste ci-dessous), elle se veut à la fois progressive et synthétique.
Si vous êtes débutant, suivez la progression, si vous cherchez un simple rappel, consultez les tableaux récapitulatifs de chacune des parties suivantes :

1) Intro I : C'est ici !

2) chap II : Bash : Détail et caractères

3) chap III : Bash : les opérateurs lexicographiques

4) chap IV : Bash : les opérateurs de comparaison numérique

5) chap V : Bash : les symboles dans les calculs

6) chap VI : Bash : les tableaux

7) chap VII : Bash : les caractères de transformation de parametres

8) chap VIII : Bash : globs étendus et regex

Enfin, les liens en gras renvoient aux pages du wiki qui sont relatifs au shell, terminal, chemin relatif et absolu, scripts, alias, etc.
Dans cette introduction :

  • A) définitions de shell bash et liens internes spécifiques au sujets évoqués ;
  • B) explication sur l’ambiguïté du terme méta-caractère.
  • C) définitions de termes associés au shell et liens internes spécifiques au sujets évoqués

Yep ! C'est parti ! 8-)

Shell BASH

Le shell (« coquille » en anglais), il également appelé interpréteur de commandes.
C'est une couche logicielle qui fournit l'interface utilisateur d'un système d'exploitation. Il correspond à la couche la plus externe de ce dernier. Il se présente sous la forme d'une interface en ligne de commande accessible depuis la console ou un terminal. L'utilisateur lance des commandes sous forme d'une entrée texte exécutée ensuite par le shell.

Le shell bash est l'un des shell utilisé sous gnu/linux.
Pour un historique et la liste des shell les plus utilisés,

Quand on installe debian wheezy, le shell par défaut est le Shell Bash.

Pour savoir quel shell vous utilisez par défaut

env

(Permet de connaître connaître les variables d'environnement de son système) Le retour est copieux ! Mais au début on trouve :

SHELL=/bin/bash

Ce qui signifie que le nom de l'interpréteur de commande est bash.

Autre méthode plus directe :

user@debian-facile:~$ echo $SHELL
/bin/bash

Pour connaître la version de votre Shell Bash, tapez :

user@debian-facile:~$ bash --version
GNU bash, version 3.2.39(1)-release (i486-pc-linux-gnu)
Copyright (C) 2007 Free Software Foundation, Inc.

Distinguons maintenant les commandes internes et les commandes externes au shell bash, commandes simples et les commandes composées.

Les commandes internes :

Une commande interne est une commande dont le code est implanté au sein du shell. Les commandes sont intégrées, soit pour des raisons de performances (l'appel d'une telle commande ne crée pas de processus fils du shell courant); soit parce qu'une commande intégrée se sert des variables internes du shell.
Cela signifie que lorsqu'on change de shell courant (par exemple bash ou C-shell2), on ne dispose plus des mêmes commandes internes.
Néanmoins, les commandes courantes qui sont essentielles à l'utilisateur, se retrouvent sous les différents shell des distributions Linux.

  • Pour afficher la liste des commandes internes et leur syntaxe, la commande :
help
  • Pour afficher une aide sommaire sur une commande interne :
help nom_commande

Les commandes externes :

Une commande externe est une commande dont le code se trouve dans un fichier ordinaire.

  • Pour en connaître la liste il faut regarder dans l'un de ces fichiers :

- /bin
(ls bin affiche la liste des commandes externes usuelles communes à tous les utilisateurs.)
- /sbin
(ls /sbin, affiche la liste des commandes externes usuelles réservées à l'administrateur (root).
- /usr/sbin/
- /usr/bin
(les répertoires /usr/bin/ et /usr/sbin/ contiennent les commandes externes moins fréquemment utilisées.)

  • Pour affiche le “chemin, nom_commande” ainsi que celui de sa page man.
whereis nom_commande
  • Pour afficher le chemin de nom_commande.
which nom_commande
  • Pour obtenir une information sommaire sur une commande externe
--help nom_commande

Notion de processus

Le shell crée un processus pour exécuter une commande externe. Parmi les commandes externes que l'on trouve dans un système, il y a les commandes unix (ex. ls, mkdir, vi, sleep) et les fichiers shell (scripts shell). La localisation du code d'une commande externe doit être connu du shell pour qu'il puisse exécuter cette commande. A cette fin, bash utilise la valeur de sa variable prédéfinie PATH.

Pour connaître le statut d'une commande, avec bash, on peut utiliser la commande interne type:
type cd
cd est une primitive du shell
type cp
cp est /bin/cp
type sleep
sleep est /bin/sleep

⇒ /bin/commande signifie donc que c'est une commande externe.

type ls
ls est un alias vers « ls --color=auto »
 whereis ls
ls: /bin/ls /usr/share/man/man1/ls.1.gz
which ls
/bin/ls
# => ls est donc l'alias de la commande externe /bin/ls

Les commandes simples :

Les commandes simples peuvent être des commandes internes ou des commandes externes.

  • commandes internes par exemple : type, cd , echo , pwd, export …
  • commandes externes par exemple : ls, mkdir, rm, rmdir, vi, cal …
  • Voici une liste non exhaustive des commandes simples, on y retrouve des commandes internes et externes :
cat, chgrp, chmod, chown, cp, date, dd, df, dmesg, echo, ed, export, 
false, kill, ln, login, ls, mkdir, mknod, more, mount, mv, ps, pwd, 
rm, rmdir, sed, setserial, sh, stty, su, sync, true, umount, uname.

(Consultez la documentation pour plus d'information sur chacune d'entre elles.)

Les commandes composées par des mots clés :

Les commandes composées peuvent toutes être considérées comme des commandes internes, en tant qu'elles sont des structures de contrôle.

  • Voici les commandes composées :
case ... esac ; if ... fi ; for ... done ; select ... done ; until ... done ; while ... done ; 
{...} ; ( ... ) ; ((...)) ; [ ... ] ; [[ ]]
remarque : Un mot clé est un mot, une expression ou un opérateur réservé. Il a une signification particulière pour le shell. Un ensemble de mots clés constitue un bloc permettant la syntaxe du shell. Un mot clé n'est pas strictement une commande, mais fait partie d'un ensemble plus large de commandes.

B) Quotes, apostrophe, guillemets et apostrophe inversée

Simple quote ou apostrophe

Les simples quotes : ' délimitent une chaîne de caractères.
Même si cette chaîne contient des commandes ou des variables shell, celles-ci ne seront pas interprétées. Par exemple :

$ variable='secret'
$ echo 'Mon mot de passe est $variable.'
Mon mot de passe est $variable.

Doubles quotes ou guillements

Les doubles quotes : “ délimitent une chaîne de caractères, mais les noms de variable sont interprétés par le shell. Par exemple :

$ variable="secret"
$ echo "Mon mot de passe est $variable."
Mon mot de passe est secret.

Ceci est utile pour générer des messages dynamiques au sein d'un script.

Remarquez bien la différence :
Comme ceci, le shell va se trouver à interpréter chaque argument séparément.
echo coucou tout le monde

Comme cela le shell interprète toute la chaîne comme un seul argument.

echo "coucou tout le monde"

Anti-quote ou apostrophe inversée

Bash considère que les anti-quotes (`) délimitent une commande à exécuter.
Les noms de variable et les commandes sont donc interprétés. Autrement dit, les anti-quotes3) remplacent de manière itérative un argument par une commande, comme le fait la commande xargs.

Préparation :

  • soit un fichier “Dossier.txt” contenant “dossier1”; “dossier2” ; “dossier3”
mkdir Dossier.txt
cd ~/Dossier.txt/
touch dossier1
touch dossier2
touch dossier3
  • toujours au niveau de Dossier.txt :
ls
dossier1  dossier2  dossier3
  • puis :
rm `ls`
 
#puis ls pour vérifier qu'il n'y a plus de fichier (retour du prompt)
  • comparez maintenant avec :
touch dossier1
touch dossier2
touch dossier3
ls
dossier1  dossier2  dossier3
  • puis:
ls | xargs rm
#puis ls pour vérifier qu'il n'y a plus de fichier (retour du prompt)
  • Autre exemple :
echo `ls` 

Cette commande affiche le contenu du répertoire courant à l'écran.
Elle est strictement équivalente à ls.

C ) Métacaractères et méta-caractères !

1)Définition courante de métacaractère et détail

  • Un métacaractère (en anglais, wild card ou joker) est un caractère qui représente un ou plusieurs autres caractères qui eux sont interprétés littéralement.

Certains caractères spéciaux sont appelés “méta-caractères” ; soit parce qu'ils servent à effectuer des recherches sur les mots ; soient parce qu'ils servent dans les expressions rationnelles; soit encore parce qu'ils représentent symboliquement quelque chose, un fichier, la valeur d'une variable ; finalement parce que ces caractères représentes symboliquement quelque chose;

Voici un tableau qui regroupe les méta-caractères :

Communs à différents shell
stricts ? ( pour un caractère )
* ( plusieurs caractères )
brackets [ ] ( plage de caractère [12] ou union [1-3] )
  • D'autre part, man glob et man bash les appellent au contraire caractères génériques.

En effet, une chaîne de caractères ordinaires est un motif.
Et un motif contenant un ou plusieurs “caractères géniriques” est appelé un “motif générique”.
Les caractères génériques servent à évoquer un ou plusieurs caractères ; mais aussi l'emplacement d'un et/ou plusieurs caractères.
Quant au globbing, cela concerne l'opération qui permet d'invoquer par un motif générique, une liste de noms de fichiers pouvant correspondre à ce motifs.
Un enchaînement de motifs génériques est nommée par extension, “une expression générique”.
Dans la terminologie de man bash, il s'agit bien des mêmes caractères recouvrant la même fonction. Bref, Un caractère générique est une sous-classe de ce qui y est appelé caractère spécial et renvoie à la fonction de globbing.

Pour simplifier, on peut appeler les caractères génériques et expressions génériques, des globs en référence à la commande glob ou à l'option extglob de la commande shopt.
Voir : man bash ligne 1914,sq. et man glob

En définitive, dans la suite j'emploierai le terme “métacaractère” comme synonyme de globs simples et bracket.

  • Enfin, ces expressions génériques sont issues d'un mécanisme plus large et plus complexe appelé, “expressions rationnelles” (ou “expressions régulières”, et en anglais “regular expressions”)

Les termes regex ou regexp en sont les abréviations à partir du terme anglais “regular expressions”.

Pour un rappel des principaux caractères des expressions rationnelles voir : INDEX

  • Dans un contexte proche, c'est-à-dire qui concerne la gestion des chaînes de caractères, le shell possède des mots réservés et des syntaxes qui permettent de modifier la valeur des variables ou paramètres créés(ées) par l'utilisateur.
# Dans les accolades précédées de $ : ${  } on peut trouver les caractères :
:-    :=    :    ::    :+   :?    @    *    ##    %%    %
# Ne pas confondre avec joker ou bracket vus ci-dessus

C'est le sujet chap. 7 : Bash : les caractères de transformation de parametres

2) "Globs simples" ou "métacaractères"

Détails et exercices, l'essentiel est là : métacaractères, ou globs, ou encore patterns

Comment associer le point et l'étoile ?

On sait que ls -a permet de lister tous les fichiers, le retour est alors un peu trop copieux

De même ls -a* est très prolixe.

On peut alors faire :

ls -d .*

⇒ On obtiendra alors tous les fichiers cachés.

Pour affiner la recherche on faire pour n'avoir que ceux dont le nom commence par un c :

ls -d .c*

Retour :

.cache  .config

Il y a un piège !

  • RAPPEL :
    1. L'étoile correspond à n'importe quelle chaîne.
    2. Si l'on fait *.txt on représente tous les fichiers se terminant par ”.txt“.
    3. Mais attention : . représente un point (.) mais aussi deux points (..) m(
ls .*    # et son équivalent : ls .?*

⇒ va afficher du répertoire courant (.) : tous les fichiers cachés (normaux) et tous les fichiers cachés de type-répertoire avec les noms des fichiers cachés contenus dans ces répertoires ;
mais aussi du répertoire parent (..) : tous les fichiers cachés normaux et les fichiers cachés de type-répertoire, avec les noms des fichiers cachés contenus dans ces répertoires !

  • Solutions :
ls .[!.]*

⇒ liste du répertoire courant : tous les fichiers cachés normaux et les fichiers cachés de type-répertoire, avec les fichiers cachés de ces répertoires.

ls -d .[!.]*   # et son équivalent : ls -d .??*

⇒ liste du répertoire courant : tous les noms de fichiers normaux cachés et le nom de tous les fichiers cachés de type-répertoire (sans leurs contenus cette fois !)

Vivre dangereusement supprimer tous les fichiers cachés d'un répertoire !

  • Soit un répertoire “FICHIER-cach.essai” contenant :
  • surtout : se déplacer :
cd /chemin/vers/FICHIER-cach.essai
  • Visualiser ce qu'on fait :
ls -la
total 8
drwxr-xr-x  2 hypathie hypathie 4096 mai   26 09:29 .
drwxr-xr-x 34 hypathie hypathie 4096 mai   26 09:28 ..
-rw-r--r--  1 hypathie hypathie    0 mai   26 09:29 fichier1
-rw-r--r--  1 hypathie hypathie    0 mai   26 09:29 .fichier1
-rw-r--r--  1 hypathie hypathie    0 mai   26 09:29 fichier2
-rw-r--r--  1 hypathie hypathie    0 mai   26 09:29 .fichier2
-rw-r--r--  1 hypathie hypathie    0 mai   26 09:29 fichier3
-rw-r--r--  1 hypathie hypathie    0 mai   26 09:29 .fichier3
  • Pour en supprimer uniquement les fichiers cachés :
user@nom-machine:~/FICHIER-cach.essai$ rm -i \.f*
rm : supprimer fichier vide « .fichier1 » ?
#répondre yes
rm : supprimer fichier vide « .fichier2 » ?
#répondre yes
rm : supprimer fichier vide « .fichier3 » ?
#répondre yes
  • Vérification :
ls -la
total 8
drwxr-xr-x  2 hypathie hypathie 4096 mai   26 10:03 .
drwxr-xr-x 34 hypathie hypathie 4096 mai   26 09:28 ..
-rw-r--r--  1 hypathie hypathie    0 mai   26 09:29 fichier1
-rw-r--r--  1 hypathie hypathie    0 mai   26 09:29 fichier2
-rw-r--r--  1 hypathie hypathie    0 mai   26 09:29 fichier3
NE PAS FAIRE CELA SANS COMPRENDRE CE QUI SE PASSE
  • toujours s'assurer que vous êtes dans le répertoire parent des fichiers cachés à supprimer ;

(Observez le prompt : “user@nom-machine:~/REPERTOIRE-PARENT$”)

  • l'option -i pour plus de maîtrise ;
  • restez en user et pas de rm / en root !
  • mieux vaut encore ne pas chercher à supprimer d'un coup tous les fichiers cachés d'un répertoire, et mettre l'étoile après la première lettre
    rm \.f*
  • plutôt que de la placer sur le slash /* pour aller plus vite.

(Il suffit de mettre par accident un espace après le slash : rm / home/user-à-supprimer et c'est la catastrophe !)

SI VOUS VOUS TROMPEZ VOUS POUVEZ DÉTRUIRE ENTIÈREMENT VOTRE SYSTÈME !
Évitez :

rm -rf /
  1. l'option -r (ou -R): permet de supprimer un dossier ;
  2. l'option -f : permet de forcer la suppression (lorsqu'un dossier n'est pas vide par exemple)

Petits curieux, petites curieuses, sachez qu'en user comme en root, la plupart des systèmes possèdent une sécurité (pas forcément sur tous), et le retour de la commande ci-dessus est :

rm: il est dangereux d'opérer récursivement sur "/"
rm: utiliser --no-preserve-root pour inhiber cette mesure de sûreté

DE MÊME LA COMMANDE :

rm /*

RETOUR :

rm: impossible de supprimer "/bin": est un dossier

LA COMMANDE FATALE À TOUS LES COUPS EST :

rm -rf /*

Après sont exécutions le système est détruit :-/

3) "Méta-caractères" désignation particulière du man bash pour "opérateurs de contrôle et de redirection"

Définition particulière :

méta-caractère
    Un caractère qui, non protégé, sépare les mots. Un de ceux-ci :

        | & ; ( ) < > espace tabulation 

Un “mot” est quant à lui “une séquence de caractères considérée comme une unité élémentaire par le shell. On parle également de token (jeton)”.

Mais pourquoi évoquer les mêmes caractères sous des appellations différentes ?
Pourquoi trouve-t-on certains caractères dans la définition des méta-caratères ci-dessus, mais aussi dans la liste des opérateurs de contrôle ?
S'agit-il de la même chose?

Cette appellation méta-caractère que l'on trouve dans le man bash, renvoie à l'analyse et au traitement par le shell de la ligne de commande. L'ordre d'analyse est le suivant :

  1. découpage lexical en mots ;
  2. découpage en commandes (lignes de tubes, instructions de contrôle (if, while…) ) ;
  3. analyse des redirections ;
  4. expansion des paramètres ;
  5. substitution de commande;
  6. redécoupage en mots des chaînes substituées;
  7. expansion des noms de fichier;
  8. lancement des commandes;*
  9. récupération de la sortie

Chacun des caractères ci-dessus permet de découper la ligne de commande en mots à l'aide des blancs, non seulement avec “espace” et tabulation”, mais aussi avec ces autres séparateurs de mots : | (il ne s'agit pas “encore” du pipe) & ; , < , >
Ce qu'il faut comprendre, c'est que “espace et “tabulation” permettent de déterminer la commande (premier mot), des (ou de l'option) options (reconnue(s) par - placé avant elle(s), et les arguments. Les autres signes ci-dessus, désignés de méta-caractères, sont des séparateurs de mots différents de “espace” et “tabulation” parce que, en plus de séparer les mots, ils indiquent le contexte d'exécution des commandes.

Ce qu'il faut comprendre c'est que les méta-caractères, outre “espace” et “tabulation”, font partie des caractères spéciaux de bash. Il s'agit avec cette définition d'une première évocation simplifiée indiquant que parmi tous les caractères spéciaux, ces “méta-caractères” se trouvent là présentés seuls | & ; ( ) < > pour indiquer que leurs significations dépendra de l'étape 2 ci-dessus, du contexte des commandes. Ce contexte dépend des commandes puis selon la composition de ces méta-caractères entre eux, et/ou la présence de commandes, de la mise en oeuvre des commandes internes, des opérateurs d'enchaînement de commandes, des opérateurs de redirection.

À l'usage, on regroupe ces “méta-caractères”, sous l'appellation de “mots réservés”. Il y a deux sortes de mots réservés : les opérateurs de contrôle et les opérateurs de redirection.

4) Les opérateurs de contrôle :

    ||    &&    ;    &    ;;    ( )    |    <retour-chariot> 
  • Premièrement, à strictement parler, servent seulement à enchaîner les commandes:
 ||    &&    ;    <retour-chariot> 


  • Le signe | ne fait pas référence ici au pipe qui sert dans les tubes.

C'est un ” OU “ logique qui apparaît dans deux cas :
1) avec ;; dans le contexte de la commande “case” ;

case $variable-name in
   pattern1|pattern2|pattern3
#          ^        ^
#          ou       ou
     command1
     ...
     commandN
   *)
esac
 

2) dans le contexte d'utilisation des globs étendus et des expressions rationnelles
voir : bash-vii-globs-etendus-regex

  • Il signifie la aussi ” OU “

Par exemple :

ls ~/Test/!(*jpg|*bmp)
  • Deuxièmement, on retrouve la paire de parenthèses dans le contexte de la commande “function”.
name (){
commands
return $TRUE
}
name

Ou encore dans les substitutions de commande $( ).
Enfin il apparaît une paire de parenthèses dans le cas des globs étendus (voir lien ci-dessus) ;
et dans les expressions rationnelle (voir : bash-vii-globs-etendus-regex

La double paire de parenthèse sert à faire des calculs (voir : page-man-bash-iv-symboles-dans-les-calculs-mathematiques.

À voir : enchainer-plusieurs-commandes

5) Les opérateurs de redirection :

<    >    >   |   <<   >>   <&   >&   
Là encore cette liste réclame une explication.
Les opérateurs de direction sont à strictement parler ceux-ci :
    >    >>    <    <<    >&    |

Il s'agit bien du pipe cette fois, et étant une redirection un peu différente, on le trouve souvent explicité à part.

<&-   <&-  

Permettent la fermeture de l'entrée standard et de la sortie standard.

Enfin, ne sont pas désignés de méta-caractères :
Tous les caractères spéciaux, c'est-à-dire les symboles auxquels le shell est sensible.
Comme nous le verrons dans cette série de wiki, il s'agit :
  • de tous les caractères qui ne servent pas à séparer les mots ou les commandes;
  • des caractères qui inhibent la reconnaissance des caractères spéciaux et des métacaractères (“glob” ou “patterns” et “bracket expression”);
  • des mots réservés des commandes composées;
  • des caractères qui transforment un caractère simple en caractère spécial (par exemple, le tiret devant une lettre, fait reconnaître cette lettre comme une option );
  • enfin, des caractères symboliques qui représentent :
    • différentes sortes de fichiers;
    • les variables d'environnement prédéfinies;
    • ou encore les paramètres prédéfinis.

C) Scripts et Alias

1) les scripts

Un script est la rédaction dans un fichier texte d'un ensemble de commandes et d'expressions régulières (caractères utilisés symboliquement) orientant les instructions données aux commandes.

2) les alias

la suite c'est ICI :

1)
N'hésitez pas à y faire part de vos remarques, succès, améliorations ou échecs !
3)
L'anti-quote s'obtient avec les 2 touches simultanées du clavier : AltGr 7
doc/programmation/shells/bash-les-differents-caracteres-speciaux.1401901399.txt.gz · Dernière modification: 04/06/2014 19:03 par Hypathie

Pied de page des forums

Propulsé par FluxBB