Debian-facile

Bienvenue sur Debian-Facile, site d'aide pour les nouveaux utilisateurs de Debian.

Vous n'êtes pas identifié(e).

#1 16-12-2015 21:52:45

Végétosaure
Membre
Distrib. : Debian 8
(G)UI : Gnome
Inscription : 10-12-2015

[Résolu] Wget sur des images

Bonsoir à toutes et à tous !

J'ai une petite question relative à la commande wget smile

Alors voilà : je veux récupérer uniquement les fichiers se terminant par png ou jpg d'un site web.
Je tape donc la commande

wget -A jpg,png http://nomdedomaine.fr/PageSurLaquelleSeTrouventLesImages


Mais seul un fichier index.html est téléchargé neutral
J'ai parcouru de nombreuses documentations, et je ne vois pas où est mon erreur. J'ai même essayé en récursif, et sur d'autres pages... Rien !

Savez-vous pourquoi ?

Merci d'avance de vos réponses,

Adrien

Dernière modification par Végétosaure (16-12-2015 23:06:05)

Hors ligne

#2 16-12-2015 22:39:11

captnfab
Admin-Girafe
Lieu : /dev/random
Distrib. : Debian Stretch/Sid/Rc-Buggy
Noyau : Linux (≥ 4.3)
(G)UI : i3-wm (≥ 4.11)
Inscription : 07-07-2008
Site Web

Re : [Résolu] Wget sur des images

Euh, je dirais que comme « PageSurLaquelleSeTrouveLesImages » n'est pas d'extensiot jpg ni png, elle est ignorée, donc la récupération s'arrête là…
Si tu rajoutes php/html/cequivabien à ta commande, ça doit le faire.

captnfab,
Association Debian-Facile, bépo.
TheDoctor: Your wish is my command… But be careful what you wish for.

Hors ligne

#3 16-12-2015 22:45:05

Végétosaure
Membre
Distrib. : Debian 8
(G)UI : Gnome
Inscription : 10-12-2015

Re : [Résolu] Wget sur des images

Mais cette commande n'est pas censée récupérer tous les fichiers png et jpg se trouvant sur la page ? Typiquement, sur celle sur laquelle on est en train d'échanger, ne devrait-elle pas télécharger ton avatar et les émoticônes ?
Si le lien doit nécessairement finir par png, quel est l'intérêt de l'option A ?

Dernière modification par Végétosaure (16-12-2015 22:45:50)

Hors ligne

#4 16-12-2015 22:56:14

captnfab
Admin-Girafe
Lieu : /dev/random
Distrib. : Debian Stretch/Sid/Rc-Buggy
Noyau : Linux (≥ 4.3)
(G)UI : i3-wm (≥ 4.11)
Inscription : 07-07-2008
Site Web

Re : [Résolu] Wget sur des images

Mhh, tu as raison.
En faisant un peu de recherches, j'obtiens une ligne

wget -nd -H -p -A jpg,jpeg,png,gif 'https://debian-facile.org/viewtopic.php?pid=153539'


Avec

  • -nd : tout télécharger dans le même dossier

  • -H télécharger les images même si elles sont sur un autre domaine/sous-domaine

  • -p télécharger les fichiers inclus dans une page (donc les images)


À adapter, mais ça me semble le faire smile


captnfab,
Association Debian-Facile, bépo.
TheDoctor: Your wish is my command… But be careful what you wish for.

Hors ligne

#5 16-12-2015 23:05:48

Végétosaure
Membre
Distrib. : Debian 8
(G)UI : Gnome
Inscription : 10-12-2015

Re : [Résolu] Wget sur des images

Ah, ça fonctionne parfaitement bien avec un autre site ! Pour celui-ci non, peut-être que ce n'est pas autorisé... Je me demande si ce n'est pas le protocole https qui pose problème... ?
Quoi qu'il en soit, la commande marche, merci beaucoup ! J'étais passé à côté de l'option p...


A bientôt !

Dernière modification par Végétosaure (16-12-2015 23:09:12)

Hors ligne

#6 16-12-2015 23:40:51

captnfab
Admin-Girafe
Lieu : /dev/random
Distrib. : Debian Stretch/Sid/Rc-Buggy
Noyau : Linux (≥ 4.3)
(G)UI : i3-wm (≥ 4.11)
Inscription : 07-07-2008
Site Web

Re : [Résolu] Wget sur des images

Je pense qu'un changement de protocole est géré comme un changement d'hôte, donc le « -H » est l'option qui joue.

captnfab,
Association Debian-Facile, bépo.
TheDoctor: Your wish is my command… But be careful what you wish for.

Hors ligne

#7 16-12-2015 23:43:53

Végétosaure
Membre
Distrib. : Debian 8
(G)UI : Gnome
Inscription : 10-12-2015

Re : [Résolu] Wget sur des images

J'ai essayé avec H sur plusieurs adresses https, mais ça ne fonctionne pas hmm
Je pense qu'il y a des blocages niveau serveur, j'ai entendu dire que certains sites empêchent ce genre de manœuvre pour ne pas faire tomber les serveurs, notamment dans le cas de l'utilisation de l'option miroir

Dernière modification par Végétosaure (16-12-2015 23:44:56)

Hors ligne

#8 16-12-2015 23:45:26

captnfab
Admin-Girafe
Lieu : /dev/random
Distrib. : Debian Stretch/Sid/Rc-Buggy
Noyau : Linux (≥ 4.3)
(G)UI : i3-wm (≥ 4.11)
Inscription : 07-07-2008
Site Web

Re : [Résolu] Wget sur des images

Hum, je ne pense pas avoir configuré quoi que ce soit de ce genre pour DF big_smile

captnfab,
Association Debian-Facile, bépo.
TheDoctor: Your wish is my command… But be careful what you wish for.

Hors ligne

#9 16-12-2015 23:47:14

Végétosaure
Membre
Distrib. : Debian 8
(G)UI : Gnome
Inscription : 10-12-2015

Re : [Résolu] Wget sur des images

Ah, et bien ça doit être autre chose alors... Je vais essayer de demander à un de mes profs d'infos s'ils savent de quoi il en retourne, et je vous tiens au courant !
S'il y a d'autres idées, n'hésitez pas smile

Hors ligne

#10 17-12-2015 00:53:50

captnfab
Admin-Girafe
Lieu : /dev/random
Distrib. : Debian Stretch/Sid/Rc-Buggy
Noyau : Linux (≥ 4.3)
(G)UI : i3-wm (≥ 4.11)
Inscription : 07-07-2008
Site Web

Re : [Résolu] Wget sur des images

En fait, le -A semble ne se préoccuper que de la fin de l'url et non pas du type mime ni même de l'extension de l'action.
J'ai essayé en remplaçant png par *png* :

wget -nd -H -p -A '*jpg*,*jpeg*,*png*,*gif*' 'https://debian-facile.org/viewtopic.php?pid=153539'


Avec cela, mon avatar était téléchargé.

Pour ce qui est des autres images du forum, elles sont liées par le .css, qui n'est probablement pas lu par wget.


captnfab,
Association Debian-Facile, bépo.
TheDoctor: Your wish is my command… But be careful what you wish for.

Hors ligne

#11 17-12-2015 11:21:04

Végétosaure
Membre
Distrib. : Debian 8
(G)UI : Gnome
Inscription : 10-12-2015

Re : [Résolu] Wget sur des images

voilà ce que la commande me retourne :

--2015-12-17 10:19:24--  https://debian-facile.org/viewtopic.php?pid=153539
Résolution de debian-facile.org (debian-facile.org)... 151.80.145.212, 2001:41d0:52:f00::354
Connexion vers debian-facile.org (debian-facile.org)|151.80.145.212|:443...connecté.
ERREUR : le certificat de «debian-facile.org» n'est pas digne de confiance.



Je ne suis pas avec mon ordinateur personnel, je vais réessayer ce soir, peut-être qu'il y a des restrictions sur celui-ci.

Hors ligne

#12 17-12-2015 12:32:43

captnfab
Admin-Girafe
Lieu : /dev/random
Distrib. : Debian Stretch/Sid/Rc-Buggy
Noyau : Linux (≥ 4.3)
(G)UI : i3-wm (≥ 4.11)
Inscription : 07-07-2008
Site Web

Re : [Résolu] Wget sur des images

Étonnant, il te manque peut-être le paquet « ca-certificates » sur cette machine, ou sa version est peut-être trop ancienne…
Ou alors quelqu'un fait une attaque Man in the Middle entre DF et toi big_smile

L'option --no-check-certificate te permet de sauter la vérification du certificat, ce qui peut aider au test…

captnfab,
Association Debian-Facile, bépo.
TheDoctor: Your wish is my command… But be careful what you wish for.

Hors ligne

#13 17-12-2015 13:47:40

stephgarg
Membre
Lieu : Périgueux
Distrib. : Debian GNU/Linux Stable (Jessie)
Noyau : Linux 3.16.0-4-amd64
(G)UI : KDE 4.14.2
Inscription : 01-01-2015

Re : [Résolu] Wget sur des images

Bonjour à tous.

captnfab a écrit :

Ou alors quelqu'un fait une attaque Man in the Middle entre DF et toi big_smile



Non, a-t-on tant de choses à cacher pour qu'"on" s'intéresse à Debian-Facile ?

Les points chocolat, peut-être : smolski, fais attention !!! big_smile

A bientôt.


Trois PC dont un fixe Sirius, un transportable Canopus et un miniportable Arcturus. smile
Sirius : AMD Athlon 64 X2 à 3 GHz, SDRAM DDR2 800 MHz de 8 Gio, 2 WD VelociRaptor SATA2 de 1000 Go.
Canopus : Intel Core 2 Duo à 2 GHz, SDRAM DDR2 667 MHz de 4 Gio, WD Black Mobile SATA2 de 750 Go.
Arcturus : Intel Atom N270 à 1,6 Ghz, SDRAM DDR2 533 MHz de 2 Gio, Hitachi SATA2 de 160 Go.

Hors ligne

#14 17-12-2015 14:00:24

smolski
administrateur quasi...modo
Lieu : AIN
Distrib. : 8 (jessie) 64 bits + backports
Noyau : 4.6.0-0.bpo.1-amd64
(G)UI : gnome 3.14.1
Inscription : 21-10-2008

Re : [Résolu] Wget sur des images

/me rassemble ses ouailles tout autours de lui...

"Définition d'eric besson : S'il fallait en chier des tonnes pour devenir ministre, il aurait 2 trous du cul." - JP Douillon
"L'utopie ne signifie pas l'irréalisable, mais l'irréalisée." - T Monod (source :  La zone de Siné)
"Je peux rire de tout mais pas avec n'importe qui." - P Desproges
"saque eud dun" (patois chtimi : fonce dedans)

Hors ligne

#15 17-12-2015 14:30:28

Végétosaure
Membre
Distrib. : Debian 8
(G)UI : Gnome
Inscription : 10-12-2015

Re : [Résolu] Wget sur des images

Je confirme, la commande fonctionne !
Voici ce que j'obtiens quand je demande des infos sur ton avatar Girafe : https://debian-facile.org/img/avatars/3 … 1394368131
Effectivement, j'ai l'impression que wget -A *png* parcourt le fichier html, et demande au serveur tout ce qui contient "png".
Le wget -A png ne doit certainement fonctionner que pour des photos au format png qui sont directement proposées en téléchargement sur une page web, comme le serait un .iso sur la page de téléchargement du site officiel d'un OS.

Hors ligne

Pied de page des forums