logo Debian Debian Debian-France Debian-Facile Debian-fr.org Forum-Debian.fr Debian ? Communautés logo inclusivité

Debian-facile

Bienvenue sur Debian-Facile, site d'aide pour les nouveaux utilisateurs de Debian.

Vous n'êtes pas identifié(e).

#1 15-06-2021 23:55:39

David5647
Membre
Distrib. : Debian Sid
Noyau : 5.15.0-2-amd64
(G)UI : i3wm + des bouts de kde
Inscription : 27-08-2017

wget et domaines tiers

La question

Je me suis toujours demandé ce qu'il ce passait lorsque l'on effectue un :

wget https://example.com/page.html


(ou d'autres utilitaires : curl, request (module python))

Est ce que le processus est identique au fonctionnement d'un navigateur? 
Est-ce que je me connecte quand même aux domaines tiers?
Que ce passe t-il pour les cookies?
Plus généralement, mes interrogations tournent autour de ce qui est communiqué au site en question?


Contexte
Le contexte n'est pas utile à la question, j'en précise juste la perspective, si cela en interroge certain.e.s

Je sais que je me lance dans des considérations bien vaines de gain de vie privée et (plus exactement?) purement militantes.
Si il y a bien quelque chose qui m'agace en ce moment ce sont bien les cookie wall (payer ou payer) surtout sur des sites dont le contenu monétisé est issu d'une communauté.
Pour en citer un directement, citons le malhonnête marmitton.
Donc, quelques lignes de python :

#!/usr/bin/env python3
r = request.wget(url)
soup = BeautifulSoup(r.text())
recette = ma_popotte(soup)

=> Hop, la recette bein propre! Pas de vidéos qui se lancent! Pas de tonne de contenu à charger!  Pas 200 cliques à effectuer pour accéder à la page! Mais cookie-wall vraiment esquivé?

Hors ligne

Pied de page des forums