Vous n'êtes pas identifié(e).
L'icône rouge permet de télécharger chaque page du wiki visitée au format PDF et la grise au format ODT →
Ci-dessous, les différences entre deux révisions de la page.
Les deux révisions précédentes Révision précédente Prochaine révision | Révision précédente Prochaine révision Les deux révisions suivantes | ||
doc:reseau:wget [12/09/2010 16:49] 127.0.0.1 édition externe |
doc:reseau:wget [07/08/2015 09:31] smolski |
||
---|---|---|---|
Ligne 1: | Ligne 1: | ||
- | ====== WGET ====== | + | ====== wget : téléchargeur en ligne de commande ====== |
+ | |||
+ | * Objet : Utilisation de wget, un logiciel de téléchargement en ligne de commande | ||
+ | * Niveau requis : {{tag>débutant avisé}} | ||
+ | * Commentaires : //Les téléchargeurs des divers navigateurs ont tous leurs inconvénients. Wget est parfait, lui :)// | ||
+ | * Débutant, à savoir : [[:doc:systeme:commandes:le_debianiste_qui_papillonne|Utiliser GNU/Linux en ligne de commande, tout commence là !.]] :-) | ||
+ | * Suivi : {{tag>à-tester}} | ||
+ | * Création par [[user>smolski]] le 18/08/2010 | ||
+ | * Testé par <...> le <...> | ||
+ | * Commentaires sur le forum : [[http://debian-facile.org/viewtopic.php?id=2882|ici]]((N'hésitez pas à y faire part de vos remarques, succès, améliorations ou échecs !)) | ||
''wget'' est un programme en ligne de commande non interactif de téléchargement de fichiers depuis le Web. | ''wget'' est un programme en ligne de commande non interactif de téléchargement de fichiers depuis le Web. | ||
Ligne 10: | Ligne 19: | ||
Sinon : | Sinon : | ||
- | <code bash> | + | <code root>apt-get update && apt-get install wget</code> |
- | apt-get install wget</code> | + | |
===== Synopsis : ===== | ===== Synopsis : ===== | ||
- | <code bash> | + | <code user> |
wget [options] [url]</code> | wget [options] [url]</code> | ||
===== Options principales ===== | ===== Options principales ===== | ||
- | ^Options ^ Options longues (s'écrivent avec 2 tirets) ^ Commentaires ^ | + | ^ Options ^ Options longues (s'écrivent avec 2 tirets) ^ Commentaires ^ |
- | |''-V'' | |Renseigne sur la version de Wget. | | + | |''-V'' | ''<nowiki>--</nowiki>version'' | Renseigne sur la version de Wget. | |
- | |''-h'' | |Affiche toutes les options disponibles. | | + | |''-h'' | ''<nowiki>--</nowiki>help'' | Affiche toutes les options disponibles. | |
- | |''-i'' | |Lit les adresses depuis un fichier .txt. | | + | |''-i'' //fichier// | ''<nowiki>--</nowiki>input-file=''//fichier// | Lit les adresses depuis le fichier texte //fichier//. | |
- | |''-N'' |''<nowiki>--timestamping</nowiki>'' |Active le time-stamping. Permet d'écraser les fichiers sur la destination s'ils existent | | + | |''-N'' | ''<nowiki>--</nowiki>timestamping'' | Active le time-stamping. Permet d'écraser les fichiers sur la destination s'ils existent | |
- | |''-t'' | |Définit le nombre de tentatives, 0 ou inf pour un nombre illimité de tentatives. Par défaut 20 tentatives sont effectuées, à moins qu'une erreur fatale apparaisse. | | + | |''-t'' //n// | ''<nowiki>--</nowiki>tries=''//n// | Définit le nombre de tentatives à //n//, 0 ou inf pour un nombre illimité de tentatives. (Par défaut //n//=20 sauf erreur fatale.) | |
- | |''-c'' | |Reprend un téléchargement interrompu. | | + | |''-c'' | ''<nowiki>--</nowiki>continue'' | Reprend un téléchargement interrompu. | |
- | |''-S'' | |Affiche les messages envoyés par les serveurs FTP ou HTTP. | | + | |''-S'' | ''<nowiki>--</nowiki>server-response'' | Affiche les messages envoyés par les serveurs FTP ou HTTP. | |
- | |''-Y'' | |on/off active ou désactive le support proxy. | | + | |''-Y'' | | on/off active ou désactive le support proxy. | |
- | |''-nd'' | |Si cette option est utilisée les fichiers sauvegardés le seront dans un seul et même répertoire. | | + | |''-nd'' | ''<nowiki>--</nowiki>no-directories'' | Si cette option est utilisée les fichiers sauvegardés le seront dans un seul et même répertoire. | |
- | |''-r'' | |Active le téléchargement récursif. | | + | |''-r'' | ''<nowiki>--</nowiki>recursive'' | Active le téléchargement récursif. | |
- | |''-l'' | |Indique la profondeur à utiliser lors d'un téléchargement récursif. | | + | |''-l'' //n// | ''<nowiki>--</nowiki>level=''//n// | Indique la profondeur //n// à utiliser lors d'un téléchargement récursif. | |
- | |''-k'' | |Convertit les liens pour être disponible en consultation locale. | | + | |''-k'' | ''<nowiki>--</nowiki>convert-links'' | Convertit les liens pour être disponible en consultation locale. | |
- | |''-p'' | |Oblige Wget à télécharger tous les fichiers requis pour une consultation convenable d'une page HTML. | | + | |''-p'' | ''<nowiki>--</nowiki>page-requisites'' | Oblige Wget à télécharger tous les fichiers requis pour une consultation convenable d'une page HTML. | |
- | |''-m'' | |Active toutes les options convenables pour faire un miroir. | | + | |''-P'' //dossier// | ''<nowiki>--</nowiki>directory-prefix=''//dossier// | Indique le répertoire de destination //dossier// du téléchargement. | |
- | | |''<nowiki>--follow-ftp</nowiki>'' |Sans cette option tous les liens FTP donnés depuis un document HTML seront ignorés. | | + | |''-m'' | ''<nowiki>--</nowiki>mirror'' | Active toutes les options convenables pour faire un miroir. | |
- | |''-H'' | |Autorise lors d'un téléchargement récursif le changement d'hôtes. | | + | | | ''<nowiki>--</nowiki>follow-ftp'' | Sans cette option tous les liens FTP donnés depuis un document HTML seront ignorés. | |
- | |''-np'' | |Ne remonte pas les répertoires parents. | | + | |''-H'' | ''<nowiki>--</nowiki>span-hosts'' | Autorise lors d'un téléchargement récursif le changement d'hôtes. | |
- | |''-A'' | |Permet de ne télécharger que le type de fichier choisi. | | + | |''-np'' | ''<nowiki>--</nowiki>no-parent'' | Ne remonte pas les répertoires parents. | |
- | |''-o'' | |Permet d' enregistrer tous les messages de Wget dans un fichier. | | + | |''-A'' //suffixes//| ''<nowiki>--</nowiki>accept=''//suffixes// | Permet de ne télécharger que le type de fichier choisi. | |
- | |''-a'' | |Idem que -o sauf que les messages sont ajouté à la suite du fichier empêchant ainsi d' écraser l' ancien fichier. | | + | |''-R'' //suffixes//| ''<nowiki>--</nowiki>reject=''//suffixes// | Permet de ne pas télécharger le type de fichier choisi. | |
- | | |''<nowiki>--user-agent=user</nowiki>'' |S'identifier sous le nom **user** pour le serveur HTTP. Permet de falsifier la valeur de user-agent envoyé par **wget**, ceci n'est pas recommandé à moins de vraiment savoir ce que vous faites | | + | |''-o'' //fichier// | ''<nowiki>--</nowiki>output-file=''//fichier// | Permet d'enregistrer tous les messages de log de Wget dans un fichier //fichier// (en effaçant le contenu précédent). | |
- | | |''<nowiki>--limit-rate=30K</nowiki>'' |Permet de limiter le débit, ici à 30 ko/s. | | + | |''-O'' //fichier// | ''<nowiki>--</nowiki>output-document=''//fichier// | (//La lettre O majuscule//) Indique le fichier cible((de destination)) où s'écrira le contenu du téléchargement du fichier distant. | |
+ | |''-a'' //fichier// | ''<nowiki>--</nowiki>append-output=''//fichier// | Idem que ''-o'' sauf que les messages sont ajoutés à la suite du fichier empêchant ainsi d' écraser l' ancien fichier. | | ||
+ | |''-U'' //agent// | ''<nowiki>--</nowiki>user-agent=''//agent// | Indique au serveur HTTP que le client est **agent** et non **wget**. | | ||
+ | | | ''<nowiki>--</nowiki>limit-rate=''//30K// | Permet de limiter le débit, ici à 30 ko/s. | | ||
- | ===== Exemples d'utilisation courante ===== | + | ===== Les utilisations ===== |
- | Télécharger simplement un fichier : | + | ==== Exemples d'utilisation courante ==== |
- | <code bash> | + | |
- | wget http://www.site.org/rep/01/fichier.txt</code> | + | |
- | ---- | + | * Télécharger simplement un fichier : |
- | \\ | + | <code user>wget http://www.site.org/rep/01/fichier.txt</code> |
- | Reprendre un téléchargement si celui-ci est incomplet (À-priori, selon la manpage, c'est le comportement par défaut) | + | Le fichier sera alors enregistré dans le répertoire courant (voir les commandes [[:doc:programmation:shell:cd|cd]].) |
- | <code bash> | + | |
- | wget -c ftp://serveur.org/rep/01/fichier.txt</code> | + | |
- | ---- | + | * Reprendre un téléchargement si celui-ci est incomplet. |
- | \\ | + | <code user>wget -c ftp://serveur.org/rep/01/fichier.txt</code> |
+ | Par défaut, sans l'option ''-c'', **wget** créerait un nouveau fichier //fichier.txt.1// au lieu de reprendre l'existant. | ||
- | Dans ce cas seul le répertoire /01/ sera copié ( -np ), les répertoires parent étant ignorés : | + | * Dans ce cas le téléchargement sera dirigé vers le répertoire_cible : |
- | <code bash> | + | <code user>wget -P /chemin/du/répertoire_cible http://www.site.org/fichier_distant</code> |
- | wget -r -np http://www.site.org/rep/01/</code> | + | |
- | ---- | + | * Dans ce cas, avec la lettre O majuscule, le téléchargement du contenu du fichier_distant sera écrit dans le fichier_cible : |
- | \\ | + | <code user>wget -O /chemin/du/fichier_cible http://www.site.org/fichier_distant</code> |
- | Ici aucun répertoire ne sera créé ( -nd ) : | + | * Dans ce cas seul le répertoire ''01'' et ses enfants seront copiés, les répertoires parent étant ignorés (''-np'') : |
- | <code bash> | + | <code user>wget -r -np http://www.site.org/rep/01/</code> |
- | wget -r -nd http://www.site.org/rep/01/</code> | + | |
- | ---- | + | * Ici tous les fichiers téléchargés seront enregistrés dans le même dossier (sans recréation de l'arborescence présente sur le site web (''-nd'')) : |
- | \\ | + | <code user>wget -r -nd http://www.site.org/rep/01/</code> |
- | Télécharger sur un FTP avec authentification (ici le nom d'utilisateur est paul et son mot de passe 123) : | + | * Télécharger sur un FTP avec authentification (ici le nom d'utilisateur est paul et son mot de passe 123) : |
- | <code bash> | + | <code user>wget ftp://paul:123@serveur.org/fichier</code> |
- | wget -r l4 ftp://paul:123@serveur.org/</code> | + | |
- | ===== Exemples d'utilisation avancée ===== | + | ==== Exemples d'utilisation avancée ==== |
- | Télécharger les URL contenues dans un fichier : | + | * Télécharger les URL contenues dans un fichier : |
- | <code bash> | + | <code user>wget -i fichier</code> |
- | wget -i fichier</code> | + | |
- | ---- | + | * Télécharge récursivement le site (''-r'') et enregistre les logs dans le fichier ''wgetlog'' (''-o'') en limitant le débit du téléchargement à 30 Ko/s (''<nowiki>--</nowiki>limite-rate=30k'') : |
- | \\ | + | <code user>wget -r --limit-rate=30k http//www.site.org/ -owgetlog</code> |
- | Télécharge récursivement le site ( -r ) et enregistre les messages dans le fichier wgetlog ( -o ) en limitant le débit du téléchargement à 30 Ko/s ( –limite-rate=30k ) : | + | * Téléchargement avec une profondeur de 4 (''-l4'') et en enregistrant les messages à la suite du fichier wgetlog déjà créé (''-awgetlog'') : |
- | <code bash> | + | <code user>wget -r -l4 http://www.site.org/ -awgetlog</code> |
- | wget -r --limit-rate=30k http//www.site.org/ -owgetlog</code> | + | |
- | ---- | + | * Dans ce cas seul les fichiers portant l'extension .txt seront téléchargés (''-A.txt'') : |
- | \\ | + | <code user>wget -r -l3 -A.txt ftp://serveur.org/</code> |
- | Téléchargement avec une profondeur de 4 ( -l4 ) et en enregistrant les messages à la suite du fichier wgetlog déjà créé ( -awgetlog ) : | + | * Ici seul les fichiers portant l'extension ''.jpg'' seront téléchargés (''-A.jpg''), les logs seront inscrits à la suite du fichier wgetlog (''-awgetlog'') et wget téléchargera à partir des adresses indiquées dans le fichier texte ''maliste'' (''-imaliste'') : |
- | <code bash> | + | <code user>wget -r -A.jpg -awgetlog -imaliste.txt</code> |
- | wget -r -l4 http://www.site.org/ -awgetlog</code> | + | |
- | ---- | + | * Télécharger le site récursivement avec une profondeur infinie (''-linf''), convertit les liens pour une consultation en local (''-k''), rapatrie tous les fichiers nécessaires à l'affichage convenable d'une page HTML (''-p'') et renomme toutes les pages HTML avec l'extension .html (''-E'') : |
- | \\ | + | <code user>wget -r -linf -k -p -E http://www.site.org/</code> |
- | Dans ce cas seul les fichiers de type .txt seront téléchargés ( -A.txt ) : | + | ===== Références ===== |
- | <code bash> | + | |
- | wget -r -l3 -A.txt ftp://serveur.org/</code> | + | |
- | + | ||
- | ---- | + | |
- | \\ | + | |
- | + | ||
- | Ici seul les fichiers .jpg seront téléchargés ( -A.jpeg ), les messages seront inscrit à la suite du fichier wgetlog ( -awgetlog ) et Wget téléchargera à partir des adresses indiqués dans le fichier .txt ( -imaliste) : | + | |
- | <code bash> | + | |
- | wget -r -A.jpg -awgetlog -imaliste.txt</code> | + | |
- | + | ||
- | ---- | + | |
- | \\ | + | |
- | + | ||
- | Télécharger le site récursivement avec une profondeur infinie ( -linf ), convertit les liens pour une consultation en local ( -k ), rapatrie tout les fichiers nécessaires à l'affichage convenable d'une page HTML ( -p ) et renomme toutes les pages HTML avec l'extension .html ( -E ) : | + | |
- | <code bash> | + | |
- | wget -r -linf -k -p -E http://www.site.org/</code> | + | |
- | + | ||
- | ===== Liens et sources : ===== | + | |
//La documentation //**ubuntu**// en français qui reste reine en la matière, merci de leur contribution pour le libre :// | //La documentation //**ubuntu**// en français qui reste reine en la matière, merci de leur contribution pour le libre :// | ||
* http://doc.ubuntu-fr.org/wget | * http://doc.ubuntu-fr.org/wget | ||
- | |||
- | |||
- | ---- | ||
- | \\ | ||
//Un man en français, indispensable !// | //Un man en français, indispensable !// | ||
* http://www.delafond.org/traducmanfr/man/man1/wget.1.html | * http://www.delafond.org/traducmanfr/man/man1/wget.1.html | ||