Vous n'êtes pas identifié(e).
L'icône rouge permet de télécharger chaque page du wiki visitée au format PDF et la grise au format ODT →
Ci-dessous, les différences entre deux révisions de la page.
Les deux révisions précédentes Révision précédente Prochaine révision | Révision précédente Prochaine révision Les deux révisions suivantes | ||
doc:reseau:wget [16/08/2010 09:35] smolski |
doc:reseau:wget [09/07/2015 17:58] milou [Installation] |
||
---|---|---|---|
Ligne 1: | Ligne 1: | ||
+ | ====== wget : téléchargeur en ligne de commande ====== | ||
+ | |||
+ | * Objet : Utilisation de wget, un logiciel de téléchargement en ligne de commande | ||
+ | * Niveau requis : {{tag>débutant avisé}} | ||
+ | * Commentaires : //Les téléchargeurs des divers navigateurs ont tous leurs inconvénients. Wget est parfait, lui :)// | ||
+ | * Débutant, à savoir : [[:doc:systeme:commandes:le_debianiste_qui_papillonne|Utiliser GNU/Linux en ligne de commande, tout commence là !.]] :-) | ||
+ | * Suivi : {{tag>à-tester}} | ||
+ | * Création par [[user>smolski]] le 18/08/2010 | ||
+ | * Testé par <...> le <...> | ||
+ | * Commentaires sur le forum : [[http://debian-facile.org/viewtopic.php?id=2882|ici]]((N'hésitez pas à y faire part de vos remarques, succès, améliorations ou échecs !)) | ||
+ | |||
+ | ''wget'' est un programme en ligne de commande non interactif de téléchargement de fichiers depuis le Web. | ||
+ | |||
+ | Il supporte les protocoles HTTP, HTTPS et FTP ainsi que le téléchargement au travers des proxies HTTP. | ||
+ | |||
+ | ===== Installation ===== | ||
+ | |||
+ | wget est installé par défaut. | ||
+ | |||
+ | Sinon : | ||
+ | <code root>apt-get update && apt-get install wget</code> | ||
+ | |||
+ | ===== Synopsis : ===== | ||
+ | |||
+ | <code user> | ||
+ | wget [options] [url]</code> | ||
+ | |||
+ | ===== Options principales ===== | ||
+ | |||
+ | ^ Options ^ Options longues (s'écrivent avec 2 tirets) ^ Commentaires ^ | ||
+ | |''-V'' | ''<nowiki>--</nowiki>version'' | Renseigne sur la version de Wget. | | ||
+ | |''-h'' | ''<nowiki>--</nowiki>help'' | Affiche toutes les options disponibles. | | ||
+ | |''-i'' //fichier// | ''<nowiki>--</nowiki>input-file=''//fichier// | Lit les adresses depuis le fichier texte //fichier//. | | ||
+ | |''-N'' | ''<nowiki>--</nowiki>timestamping'' | Active le time-stamping. Permet d'écraser les fichiers sur la destination s'ils existent | | ||
+ | |''-t'' //n// | ''<nowiki>--</nowiki>tries=''//n// | Définit le nombre de tentatives à //n//, 0 ou inf pour un nombre illimité de tentatives. (Par défaut //n//=20 sauf erreur fatale.) | | ||
+ | |''-c'' | ''<nowiki>--</nowiki>continue'' | Reprend un téléchargement interrompu. | | ||
+ | |''-S'' | ''<nowiki>--</nowiki>server-response'' | Affiche les messages envoyés par les serveurs FTP ou HTTP. | | ||
+ | |''-Y'' | | on/off active ou désactive le support proxy. | | ||
+ | |''-nd'' | ''<nowiki>--</nowiki>no-directories'' | Si cette option est utilisée les fichiers sauvegardés le seront dans un seul et même répertoire. | | ||
+ | |''-r'' | ''<nowiki>--</nowiki>recursive'' | Active le téléchargement récursif. | | ||
+ | |''-l'' //n// | ''<nowiki>--</nowiki>level=''//n// | Indique la profondeur //n// à utiliser lors d'un téléchargement récursif. | | ||
+ | |''-k'' | ''<nowiki>--</nowiki>convert-links'' | Convertit les liens pour être disponible en consultation locale. | | ||
+ | |''-p'' | ''<nowiki>--</nowiki>page-requisites'' | Oblige Wget à télécharger tous les fichiers requis pour une consultation convenable d'une page HTML. | | ||
+ | |''-P'' //dossier// | ''<nowiki>--</nowiki>directory-prefix=''//dossier// | Indique le répertoire de destination //dossier// du téléchargement. | | ||
+ | |''-m'' | ''<nowiki>--</nowiki>mirror'' | Active toutes les options convenables pour faire un miroir. | | ||
+ | | | ''<nowiki>--</nowiki>follow-ftp'' | Sans cette option tous les liens FTP donnés depuis un document HTML seront ignorés. | | ||
+ | |''-H'' | ''<nowiki>--</nowiki>span-hosts'' | Autorise lors d'un téléchargement récursif le changement d'hôtes. | | ||
+ | |''-np'' | ''<nowiki>--</nowiki>no-parent'' | Ne remonte pas les répertoires parents. | | ||
+ | |''-A'' //suffixes//| ''<nowiki>--</nowiki>accept=''//suffixes// | Permet de ne télécharger que le type de fichier choisi. | | ||
+ | |''-R'' //suffixes//| ''<nowiki>--</nowiki>reject=''//suffixes// | Permet de ne pas télécharger le type de fichier choisi. | | ||
+ | |''-o'' //fichier// | ''<nowiki>--</nowiki>output-file=''//fichier// | Permet d'enregistrer tous les messages de log de Wget dans un fichier //fichier// (en effaçant le contenu précédent). | | ||
+ | |''-O'' //fichier// | ''<nowiki>--</nowiki>output-document=''//fichier// | (//La lettre O majuscule//) Indique le fichier cible((de destination)) où s'écrira le contenu du téléchargement du fichier distant. | | ||
+ | |''-a'' //fichier// | ''<nowiki>--</nowiki>append-output=''//fichier// | Idem que ''-o'' sauf que les messages sont ajoutés à la suite du fichier empêchant ainsi d' écraser l' ancien fichier. | | ||
+ | |''-U'' //agent// | ''<nowiki>--</nowiki>user-agent=''//agent// | Indique au serveur HTTP que le client est **agent** et non **wget**. | | ||
+ | | | ''<nowiki>--</nowiki>limit-rate=''//30K// | Permet de limiter le débit, ici à 30 ko/s. | | ||
+ | |||
+ | ===== Les utilisations ===== | ||
+ | |||
+ | ==== Exemples d'utilisation courante ==== | ||
+ | |||
+ | * Télécharger simplement un fichier : | ||
+ | <code user>wget http://www.site.org/rep/01/fichier.txt</code> | ||
+ | |||
+ | Le fichier sera alors enregistré dans le répertoire courant (voir les commandes [[:doc:programmation:shell:cd|cd]].) | ||
+ | |||
+ | * Reprendre un téléchargement si celui-ci est incomplet. | ||
+ | <code user>wget -c ftp://serveur.org/rep/01/fichier.txt</code> | ||
+ | Par défaut, **wget** créerait un nouveau fichier //fichier.txt.1// au lieu de reprendre l'existant. | ||
+ | |||
+ | * Dans ce cas le téléchargement sera dirigé vers le répertoire_cible : | ||
+ | <code user>wget -P /chemin/du/répertoire_cible http://www.site.org/fichier_distant</code> | ||
+ | |||
+ | * Dans ce cas, avec la lettre O majuscule, le téléchargement du contenu du fichier_distant sera écrit dans le fichier_cible : | ||
+ | <code user>wget -O /chemin/du/fichier_cible http://www.site.org/fichier_distant</code> | ||
+ | |||
+ | * Dans ce cas seul le répertoire ''01'' et ses enfants seront copiés, les répertoires parent étant ignorés (''-np'') : | ||
+ | <code user>wget -r -np http://www.site.org/rep/01/</code> | ||
+ | |||
+ | * Ici tous les fichiers téléchargés seront enregistrés dans le même dossier (sans recréation de l'arborescence présente sur le site web (''-nd'')) : | ||
+ | <code user>wget -r -nd http://www.site.org/rep/01/</code> | ||
+ | |||
+ | * Télécharger sur un FTP avec authentification (ici le nom d'utilisateur est paul et son mot de passe 123) : | ||
+ | <code user>wget ftp://paul:123@serveur.org/fichier</code> | ||
+ | |||
+ | ==== Exemples d'utilisation avancée ==== | ||
+ | |||
+ | * Télécharger les URL contenues dans un fichier : | ||
+ | <code user>wget -i fichier</code> | ||
+ | |||
+ | * Télécharge récursivement le site (''-r'') et enregistre les logs dans le fichier ''wgetlog'' (''-o'') en limitant le débit du téléchargement à 30 Ko/s (''<nowiki>--</nowiki>limite-rate=30k'') : | ||
+ | <code user>wget -r --limit-rate=30k http//www.site.org/ -owgetlog</code> | ||
+ | |||
+ | * Téléchargement avec une profondeur de 4 (''-l4'') et en enregistrant les messages à la suite du fichier wgetlog déjà créé (''-awgetlog'') : | ||
+ | <code user>wget -r -l4 http://www.site.org/ -awgetlog</code> | ||
+ | |||
+ | * Dans ce cas seul les fichiers portant l'extension .txt seront téléchargés (''-A.txt'') : | ||
+ | <code user>wget -r -l3 -A.txt ftp://serveur.org/</code> | ||
+ | |||
+ | * Ici seul les fichiers portant l'extension ''.jpg'' seront téléchargés (''-A.jpg''), les logs seront inscrits à la suite du fichier wgetlog (''-awgetlog'') et wget téléchargera à partir des adresses indiquées dans le fichier texte ''maliste'' (''-imaliste'') : | ||
+ | <code user>wget -r -A.jpg -awgetlog -imaliste.txt</code> | ||
+ | |||
+ | * Télécharger le site récursivement avec une profondeur infinie (''-linf''), convertit les liens pour une consultation en local (''-k''), rapatrie tous les fichiers nécessaires à l'affichage convenable d'une page HTML (''-p'') et renomme toutes les pages HTML avec l'extension .html (''-E'') : | ||
+ | <code user>wget -r -linf -k -p -E http://www.site.org/</code> | ||
+ | |||
+ | ===== Références ===== | ||
+ | |||
+ | //La documentation //**ubuntu**// en français qui reste reine en la matière, merci de leur contribution pour le libre :// | ||
+ | * http://doc.ubuntu-fr.org/wget | ||
+ | |||
+ | //Un man en français, indispensable !// | ||
+ | * http://www.delafond.org/traducmanfr/man/man1/wget.1.html | ||