Debian Debian-France Debian-Facile Debian-fr.org Debian-fr.xyz Debian ? Communautés

Debian-facile

Bienvenue sur Debian-Facile, site d'aide pour les nouveaux utilisateurs de Debian.

Vous n'êtes pas identifié(e).

#1 16-06-2021 00:55:39

David5647
Membre
Distrib. : Debian Bullseye/Sid
Noyau : 5.7.0-2-amd64
(G)UI : KDE/i3wm
Inscription : 27-08-2017

wget et domaines tiers

La question

Je me suis toujours demandé ce qu'il ce passait lorsque l'on effectue un :

wget https://example.com/page.html


(ou d'autres utilitaires : curl, request (module python))

Est ce que le processus est identique au fonctionnement d'un navigateur? 
Est-ce que je me connecte quand même aux domaines tiers?
Que ce passe t-il pour les cookies?
Plus généralement, mes interrogations tournent autour de ce qui est communiqué au site en question?


Contexte
Le contexte n'est pas utile à la question, j'en précise juste la perspective, si cela en interroge certain.e.s

Je sais que je me lance dans des considérations bien vaines de gain de vie privée et (plus exactement?) purement militantes.
Si il y a bien quelque chose qui m'agace en ce moment ce sont bien les cookie wall (payer ou payer) surtout sur des sites dont le contenu monétisé est issu d'une communauté.
Pour en citer un directement, citons le malhonnête marmitton.
Donc, quelques lignes de python :

#!/usr/bin/env python3
r = request.wget(url)
soup = BeautifulSoup(r.text())
recette = ma_popotte(soup)

=> Hop, la recette bein propre! Pas de vidéos qui se lancent! Pas de tonne de contenu à charger!  Pas 200 cliques à effectuer pour accéder à la page! Mais cookie-wall vraiment esquivé?

En ligne

Pied de page des forums