Vous n'êtes pas identifié(e).
L'icône rouge permet de télécharger chaque page du wiki visitée au format PDF et la grise au format ODT →
Ci-dessous, les différences entre deux révisions de la page.
Les deux révisions précédentes Révision précédente Prochaine révision | Révision précédente Prochaine révision Les deux révisions suivantes | ||
doc:reseau:wget [16/08/2010 09:53] smolski |
doc:reseau:wget [30/12/2012 16:11] captnfab correction exemples d'utilisation |
||
---|---|---|---|
Ligne 1: | Ligne 1: | ||
+ | ====== WGET ====== | ||
+ | |||
+ | ''wget'' est un programme en ligne de commande non interactif de téléchargement de fichiers depuis le Web. | ||
+ | |||
+ | Il supporte les protocoles HTTP, HTTPS et FTP ainsi que le téléchargement au travers des proxies HTTP. | ||
+ | |||
+ | ===== Installation ===== | ||
+ | |||
+ | wget est installé par défaut. | ||
+ | |||
+ | Sinon : | ||
+ | <code bash> | ||
+ | aptitude install wget</code> | ||
+ | |||
+ | ===== Synopsis : ===== | ||
+ | |||
+ | <code bash> | ||
+ | wget [options] [url]</code> | ||
+ | |||
+ | ===== Options principales ===== | ||
+ | |||
+ | ^ Options ^ Options longues (s'écrivent avec 2 tirets) ^ Commentaires ^ | ||
+ | |''-V'' | ''<nowiki>--</nowiki>version'' | Renseigne sur la version de Wget. | | ||
+ | |''-h'' | ''<nowiki>--</nowiki>help'' | Affiche toutes les options disponibles. | | ||
+ | |''-i'' //fichier// | ''<nowiki>--</nowiki>input-file=''//fichier// | Lit les adresses depuis le fichier texte //fichier//. | | ||
+ | |''-N'' | ''<nowiki>--</nowiki>timestamping'' | Active le time-stamping. Permet d'écraser les fichiers sur la destination s'ils existent | | ||
+ | |''-t'' //n// | ''<nowiki>--</nowiki>tries=''//n// | Définit le nombre de tentatives à //n//, 0 ou inf pour un nombre illimité de tentatives. (Par défaut //n//=20 sauf erreur fatale.) | | ||
+ | |''-c'' | ''<nowiki>--</nowiki>continue'' | Reprend un téléchargement interrompu. | | ||
+ | |''-S'' | ''<nowiki>--</nowiki>server-response'' | Affiche les messages envoyés par les serveurs FTP ou HTTP. | | ||
+ | |''-Y'' | | on/off active ou désactive le support proxy. | | ||
+ | |''-nd'' | ''<nowiki>--</nowiki>no-directories'' | Si cette option est utilisée les fichiers sauvegardés le seront dans un seul et même répertoire. | | ||
+ | |''-r'' | ''<nowiki>--</nowiki>recursive'' | Active le téléchargement récursif. | | ||
+ | |''-l'' //n// | ''<nowiki>--</nowiki>level=''//n// | Indique la profondeur //n// à utiliser lors d'un téléchargement récursif. | | ||
+ | |''-k'' | ''<nowiki>--</nowiki>convert-links'' | Convertit les liens pour être disponible en consultation locale. | | ||
+ | |''-p'' | ''<nowiki>--</nowiki>page-requisites'' | Oblige Wget à télécharger tous les fichiers requis pour une consultation convenable d'une page HTML. | | ||
+ | |''-P'' //dossier// | ''<nowiki>--</nowiki>directory-prefix=''//dossier// | Indique le répertoire de destination //dossier// du téléchargement. | | ||
+ | |''-m'' | ''<nowiki>--</nowiki>mirror'' | Active toutes les options convenables pour faire un miroir. | | ||
+ | | | ''<nowiki>--</nowiki>follow-ftp'' | Sans cette option tous les liens FTP donnés depuis un document HTML seront ignorés. | | ||
+ | |''-H'' | ''<nowiki>--</nowiki>span-hosts'' | Autorise lors d'un téléchargement récursif le changement d'hôtes. | | ||
+ | |''-np'' | ''<nowiki>--</nowiki>no-parent'' | Ne remonte pas les répertoires parents. | | ||
+ | |''-A'' //suffixes//| ''<nowiki>--</nowiki>accept=''//suffixes// | Permet de ne télécharger que le type de fichier choisi. | | ||
+ | |''-R'' //suffixes//| ''<nowiki>--</nowiki>reject=''//suffixes// | Permet de ne pas télécharger le type de fichier choisi. | | ||
+ | |''-o'' //fichier// | ''<nowiki>--</nowiki>output-file=''//fichier// | Permet d'enregistrer tous les messages de log de Wget dans un fichier //fichier// (en effaçant le contenu précédent). | | ||
+ | |''-O'' //fichier// | ''<nowiki>--</nowiki>output-document=''//fichier// | (//La lettre O majuscule//) Indique le fichier cible((de destination)) où s'écrira le contenu du téléchargement du fichier distant. | | ||
+ | |''-a'' //fichier// | ''<nowiki>--</nowiki>append-output=''//fichier// | Idem que ''-o'' sauf que les messages sont ajoutés à la suite du fichier empêchant ainsi d' écraser l' ancien fichier. | | ||
+ | |''-U'' //agent// | ''<nowiki>--</nowiki>user-agent=''//agent// | Indique au serveur HTTP que le client est **agent** et non **wget**. | | ||
+ | | | ''<nowiki>--</nowiki>limit-rate=''//30K// | Permet de limiter le débit, ici à 30 ko/s. | | ||
+ | |||
+ | ===== Les utilisations ===== | ||
+ | |||
+ | ==== Exemples d'utilisation courante ==== | ||
+ | |||
+ | * Télécharger simplement un fichier : | ||
+ | <code bash>wget http://www.site.org/rep/01/fichier.txt</code> | ||
+ | |||
+ | Le fichier sera alors enregistré dans le répertoire courant (voir les commandes [[:commande:pwd|pwd]] et [[:commande:cd|cd]].) | ||
+ | |||
+ | * Reprendre un téléchargement si celui-ci est incomplet. | ||
+ | <code bash>wget -c ftp://serveur.org/rep/01/fichier.txt</code> | ||
+ | Par défaut, **wget** créerait un nouveau fichier //fichier.txt.1// au lieu de reprendre l'existant. | ||
+ | |||
+ | * Dans ce cas le téléchargement sera dirigé vers le répertoire_cible : | ||
+ | <code bash>wget -P /chemin/du/répertoire_cible http://www.site.org/fichier_distant</code> | ||
+ | |||
+ | * Dans ce cas, avec la lettre O majuscule, le téléchargement du contenu du fichier_distant sera écrit dans le fichier_cible : | ||
+ | <code bash>wget -O /chemin/du/fichier_cible http://www.site.org/fichier_distant</code> | ||
+ | |||
+ | * Dans ce cas seul le répertoire ''01'' et ses enfants seront copiés, les répertoires parent étant ignorés (''-np'') : | ||
+ | <code bash>wget -r -np http://www.site.org/rep/01/</code> | ||
+ | |||
+ | * Ici tous les fichiers téléchargés seront enregistrés dans le même dossier (sans recréation de l'arborescence présente sur le site web (''-nd'')) : | ||
+ | <code bash>wget -r -nd http://www.site.org/rep/01/</code> | ||
+ | |||
+ | * Télécharger sur un FTP avec authentification (ici le nom d'utilisateur est paul et son mot de passe 123) : | ||
+ | <code bash>wget ftp://paul:123@serveur.org/fichier</code> | ||
+ | |||
+ | ==== Exemples d'utilisation avancée ==== | ||
+ | |||
+ | Télécharger les URL contenues dans un fichier : | ||
+ | <code bash> | ||
+ | wget -i fichier</code> | ||
+ | |||
+ | ---- | ||
+ | \\ | ||
+ | |||
+ | Télécharge récursivement le site ( -r ) et enregistre les messages dans le fichier wgetlog ( -o ) en limitant le débit du téléchargement à 30 Ko/s ( –limite-rate=30k ) : | ||
+ | <code bash> | ||
+ | wget -r --limit-rate=30k http//www.site.org/ -owgetlog</code> | ||
+ | |||
+ | ---- | ||
+ | \\ | ||
+ | |||
+ | Téléchargement avec une profondeur de 4 ( -l4 ) et en enregistrant les messages à la suite du fichier wgetlog déjà créé ( -awgetlog ) : | ||
+ | <code bash> | ||
+ | wget -r -l4 http://www.site.org/ -awgetlog</code> | ||
+ | |||
+ | ---- | ||
+ | \\ | ||
+ | |||
+ | Dans ce cas seul les fichiers de type .txt seront téléchargés ( -A.txt ) : | ||
+ | <code bash> | ||
+ | wget -r -l3 -A.txt ftp://serveur.org/</code> | ||
+ | |||
+ | ---- | ||
+ | \\ | ||
+ | |||
+ | Ici seul les fichiers .jpg seront téléchargés ( -A.jpeg ), les messages seront inscrit à la suite du fichier wgetlog ( -awgetlog ) et Wget téléchargera à partir des adresses indiqués dans le fichier .txt ( -imaliste) : | ||
+ | <code bash> | ||
+ | wget -r -A.jpg -awgetlog -imaliste.txt</code> | ||
+ | |||
+ | ---- | ||
+ | \\ | ||
+ | |||
+ | Télécharger le site récursivement avec une profondeur infinie ( -linf ), convertit les liens pour une consultation en local ( -k ), rapatrie tous les fichiers nécessaires à l'affichage convenable d'une page HTML ( -p ) et renomme toutes les pages HTML avec l'extension .html ( -E ) : | ||
+ | <code bash> | ||
+ | wget -r -linf -k -p -E http://www.site.org/</code> | ||
+ | |||
+ | ===== Liens et sources : ===== | ||
+ | |||
+ | //La documentation //**ubuntu**// en français qui reste reine en la matière, merci de leur contribution pour le libre :// | ||
+ | * http://doc.ubuntu-fr.org/wget | ||
+ | |||
+ | |||
+ | ---- | ||
+ | \\ | ||
+ | |||
+ | //Un man en français, indispensable !// | ||
+ | * http://www.delafond.org/traducmanfr/man/man1/wget.1.html | ||