Debian-facile / wiki - Sed Un éditeur puissant en ligne de commande

Réponse à : wiki - Sed Un éditeur puissant en ligne de commande

2024-01-31T17:19:56Z

@Croutons
hum, ça ne concerne pas le tuto de sed, ni même la commande sed.
Il vaudrait mieux ouvrir un fil pour cela ou peut-être tu t'es trompé de fil…

Ce qui fonctionne pour sed, pour la syntaxe des regexp dans les substitutions avec l'opérateur s,
ne peut être transposé en awk pour la commande sub.

Réponse à : wiki - Sed Un éditeur puissant en ligne de commande

2024-01-31T11:11:52Z

hello

Astuce

En cas de confusion avec un chemin, genre /machin/truc/chouette après l'option les séparateurs / peuvent être remplacés par des caractères neutres, comme la virgule ou le dièse.
Par exemple avec le chemin précédent :

partant de cette petite astuce , je m'étais dit que j'aurais pu appliquer le principe a ma commande awk pour éviter d'échapper certain caractère

awk '/vent/ {sub(/km\/h.*/, ""); print substr($0,2)}' wttr.in

 awk '/vent/ {sub(#km/h.*#, ""); print substr($0,2)}' wttr.in

awk: ligne de commande:2: /vent/ {sub(#km/h.*#, ""); print substr($0,2)}

awk: ligne de commande:2:             ^ syntax error

ba sa fonctionne pas
donc je sais pas si remplacés par des caractères neutres est le bon terme?

Réponse à : wiki - Sed Un éditeur puissant en ligne de commande

2021-01-25T20:05:24Z

Bonsoir, en lisant ce how to bien fait et synthétique, je me propose de le compléter par un cas concret auquel j'ai répondu sur le forum. Par contre, je n'ai pas osé écrire directement dans la page du wiki ne sachant si c'était une pratique courante ou non. DOnc ça concerne la dernière partie relative au sous chaine. Je propose un cas concret avec de multiples sous chaines. Si ça te dit, tu peux compléter ta page avec si non tant pis

==============================================Exemple de parsing d'un fichier avec SED (avec des sous chaines multiples)

Imaginons un fichier html avec des entrées
- référence 1 : 6 lettres en capitales
- étagère : "ETAGERE" + 2 chiffres
- référence 2 : suite de 6 chiffres
- référence de la boite : BOX + 2 chiffres
- référence de l'unité de stockage : UNITE + 1 lettre en capitale

Exemple avec SED
VOici un exemple

Stockage BATIMENT 1
ABCDEF12345678
BOX06
UNITEA



ZERDEF88888888
BOX12
UNITER

Description d'autre chose
Une description et du blablabla

Juste pour remplir


.....

UYRDEF87654321
BOX65
UNITEZ

Imaginez des centaines de pages de ce type et votre mission, récupérer les valeurs des 5 champs pour les mettre dans un tableur. Un travail titanesque à la main...

Pour cela utiliser, sed et les sous-chaines.

- ^

: Ne travailler qu'avec les lignes commençant par la balises

- [A-Z]{6} : pour le 1er motif de recherche 6 lettres en capitales
- .* : n'importe quoi jusqu'au prochain motif
- ETAGERE[0-9]{2} : le terme ETAGERE suivi de 2 chiffres
- .* : n'importe quoi jusqu'au prochain motif
- [0-9]{8} : une suite de 8 chiffres
- .* : n'importe quoi jusqu'au prochain motif
- BOX[0-9]{2} : le terme BOX suivi de 2 chiffres
- .* : n'importe quoi jusqu'au prochain motif
- [A-Z]{6} : une suite de 6 lettres en capitales
- .* : n'importe quoi jusqu'à la fin de la ligne

Voilà pour les expressions régulières (regex). Pour les rendre compréhensibles par sed, il faudra "échapper" (\) les caractères {, }, ( et ) afin qu'ils ne soient pas considérés comme un élément d'une chaine de caractère mais comme un élément d'une expression régulière.

Ce qui donnera comme regex

^
$[A-Z]\{6\}$.$ETAGERE[0-9]\{2\}$.$[0-9]\{8\}$.$BOX[0-9]\{2\}$.$[A-Z]\{6\}$.*

Tout est bien beau, mais comment virer le code HTML et le blablabla ? En entourant chaque motif de recherche par des parenthèses tout simplement et en rappelant ces extractions par \1 pour la première, \2 pour la seconde et ainsi de suite

- le premier motif \1
- le second : \2
- le 3e : \3
- Et ainsi de suite

Comme c'est pour un tableur, nous passerons par un fichier CSV. Il suffit donc de récupérer les motifs et de les séparer par un point virgule

\1;\2;\3;\4;\5;

Et comme il s'agit d'une substitution, on utilisera l'option -s de sed

Donc au final :
sed -n 's/
$[A-Z]\{6\}$.$ETAGERE[0-9]\{2\}$.$[0-9]\{8\}$.$BOX[0-9]\{2\}$.$[A-Z]\{6\}$./\1;\2;\3;\4;\5;/p' mon-fichier-entree.html

QUi retournera
$ sed -n 's/
$[A-Z]\{6\}$.$ETAGERE[0-9]\{2\}$.$[0-9]\{8\}$.$BOX[0-9]\{2\}$.$[A-Z]\{6\}$./\1;\2;\3;\4;\5;/p' test.html
ABCDEF;ETAGERE34;12345678;BOX06;UNITEA;
ZERDEF;ETAGERE04;88888888;BOX12;UNITER;
UYRDEF;ETAGERE12;87654321;BOX65;UNITEZ;

Si vous voulez créer un fichier csv, simplement rediriger la sortie du terminal > sortie.csv
Si le fichier doit être incrémenté par la lecture de plusieurs sources, utiliser >> à la place de > afin de ne pas écraser le fichier existant mais le compléter.

Enjoy

Réponse à : wiki - Sed Un éditeur puissant en ligne de commande

2021-01-25T13:29:35Z

Salut
j'ai mis une petite note pour préciser que l'option -e ne modifie pas le fichier mais affiche seulement sur l'entrée standard

Réponse à : wiki - Sed Un éditeur puissant en ligne de commande

2016-03-12T20:02:07Z

Ouais, bon on sait qu'il existe au cas où

Réponse à : wiki - Sed Un éditeur puissant en ligne de commande

2016-03-12T16:11:02Z

je serai pour un tuto spécifique à ssed plutôt qu'un emplâtre dans sed...

Réponse à : wiki - Sed Un éditeur puissant en ligne de commande

2016-03-12T14:08:19Z

Voilà, mis un lien en bas de page. Peut être faudrat-il écrire une petite ligne dans le corps de la page.
Reste aussi à ce que les barbus de service vérifient que sed ne fait pas par lui même ce que phlinux demande à ssed.
Je reste à disposition pour expliciter le besoin que j'en eus.

Réponse à : wiki - Sed Un éditeur puissant en ligne de commande

2016-03-12T13:35:37Z

Ah oui !

Réponse à : wiki - Sed Un éditeur puissant en ligne de commande

2016-03-12T12:29:35Z

Bjr,
Il existe un éditeur du même acabit qui se nomme ssed et qui fournit des options plus étendues. Puis-je mettre un lien vers un exemple de ce sed amélioré ?

Réponse à : wiki - Sed Un éditeur puissant en ligne de commande

2015-04-20T16:24:09Z

Mise en conformité de l'en-tête.
Suppression de la ligne nota Fixme

Réponse à : wiki - Sed Un éditeur puissant en ligne de commande

2014-07-21T08:11:31Z

Ajout dans la commande de substitution s l'exemple pour changer une seule occurence située dans le texte en la situant.

Réponse à : wiki - Sed Un éditeur puissant en ligne de commande

2014-07-21T07:06:51Z

Plop,

Tu peux aussi changer la ligne pour remplacer la 2e occurrence non pas de toto mais to

C'est important de voir que c'est la 2e de la ligne et non pas la 2e du texte.

Au passage, je pense qu'il vaut mieux éviter au maximum les liens vers les tutos persos, en tout cas pour les choses fondamentales.
Les tutos perso ne sont maintenus/relus que par leur propriétaire. Donc ils conviennent mieux pour des choses éphémères ou des cas d'utilisations très particuliers (et donc les liens vers eux sont à préférer dans ce contexte d'utilisation).

Réponse à : wiki - Sed Un éditeur puissant en ligne de commande

2014-07-20T23:22:42Z

yep

dans mes brouillons sur les E.R., j'ai Adressage avec n° d'occurrence.

j'peux mettre un lien si vous voulez ?

Réponse à : wiki - Sed Un éditeur puissant en ligne de commande

2014-07-20T23:10:13Z

coucou captnfab

bah en dessous de l'exemple il est écrit

va changer la seconde occurence de la chaîne toto par TOTO (uniquement la seconde chaîne toto rencontrée dans le texte)

Réponse à : wiki - Sed Un éditeur puissant en ligne de commande

2014-07-20T18:38:42Z

Debian-facile / wiki - Sed Un éditeur puissant en ligne de commande

Réponse à : wiki - Sed Un éditeur puissant en ligne de commande

Réponse à : wiki - Sed Un éditeur puissant en ligne de commande

Réponse à : wiki - Sed Un éditeur puissant en ligne de commande

Stockage BATIMENT 1

ABCDEF

ZERDEF

Description d'autre chose

UYRDEF

: Ne travailler qu'avec les lignes commençant par la balises

\([A-Z]\{6\}\).\(ETAGERE[0-9]\{2\}\).\([0-9]\{8\}\).\(BOX[0-9]\{2\}\).\([A-Z]\{6\}\).*/\1;\2;\3;\4;\5;/p' mon-fichier-entree.html

\([A-Z]\{6\}\).\(ETAGERE[0-9]\{2\}\).\([0-9]\{8\}\).\(BOX[0-9]\{2\}\).\([A-Z]\{6\}\).*/\1;\2;\3;\4;\5;/p' test.html
ABCDEF;ETAGERE34;12345678;BOX06;UNITEA;
ZERDEF;ETAGERE04;88888888;BOX12;UNITER;
UYRDEF;ETAGERE12;87654321;BOX65;UNITEZ;

Réponse à : wiki - Sed Un éditeur puissant en ligne de commande

Réponse à : wiki - Sed Un éditeur puissant en ligne de commande

Réponse à : wiki - Sed Un éditeur puissant en ligne de commande

Réponse à : wiki - Sed Un éditeur puissant en ligne de commande

Réponse à : wiki - Sed Un éditeur puissant en ligne de commande

Réponse à : wiki - Sed Un éditeur puissant en ligne de commande

Réponse à : wiki - Sed Un éditeur puissant en ligne de commande

Réponse à : wiki - Sed Un éditeur puissant en ligne de commande

Réponse à : wiki - Sed Un éditeur puissant en ligne de commande

Réponse à : wiki - Sed Un éditeur puissant en ligne de commande

Réponse à : wiki - Sed Un éditeur puissant en ligne de commande

Réponse à : wiki - Sed Un éditeur puissant en ligne de commande

Debian-facile / wiki - Sed Un éditeur puissant en ligne de commande

Réponse à : wiki - Sed Un éditeur puissant en ligne de commande

Réponse à : wiki - Sed Un éditeur puissant en ligne de commande

Réponse à : wiki - Sed Un éditeur puissant en ligne de commande

Stockage BATIMENT 1

ABCDEF

ZERDEF

Description d'autre chose

UYRDEF

: Ne travailler qu'avec les lignes commençant par la balises

\([A-Z]\{6\}\).*\(ETAGERE[0-9]\{2\}\).*\([0-9]\{8\}\).*\(BOX[0-9]\{2\}\).*\([A-Z]\{6\}\).*/\1;\2;\3;\4;\5;/p' mon-fichier-entree.html

\([A-Z]\{6\}\).*\(ETAGERE[0-9]\{2\}\).*\([0-9]\{8\}\).*\(BOX[0-9]\{2\}\).*\([A-Z]\{6\}\).*/\1;\2;\3;\4;\5;/p' test.html ABCDEF;ETAGERE34;12345678;BOX06;UNITEA; ZERDEF;ETAGERE04;88888888;BOX12;UNITER; UYRDEF;ETAGERE12;87654321;BOX65;UNITEZ;

Réponse à : wiki - Sed Un éditeur puissant en ligne de commande

Réponse à : wiki - Sed Un éditeur puissant en ligne de commande

Réponse à : wiki - Sed Un éditeur puissant en ligne de commande

Réponse à : wiki - Sed Un éditeur puissant en ligne de commande

Réponse à : wiki - Sed Un éditeur puissant en ligne de commande

Réponse à : wiki - Sed Un éditeur puissant en ligne de commande

Réponse à : wiki - Sed Un éditeur puissant en ligne de commande

Réponse à : wiki - Sed Un éditeur puissant en ligne de commande

Réponse à : wiki - Sed Un éditeur puissant en ligne de commande

Réponse à : wiki - Sed Un éditeur puissant en ligne de commande

Réponse à : wiki - Sed Un éditeur puissant en ligne de commande

Réponse à : wiki - Sed Un éditeur puissant en ligne de commande

\([A-Z]\{6\}\).\(ETAGERE[0-9]\{2\}\).\([0-9]\{8\}\).\(BOX[0-9]\{2\}\).\([A-Z]\{6\}\).*/\1;\2;\3;\4;\5;/p' mon-fichier-entree.html

\([A-Z]\{6\}\).\(ETAGERE[0-9]\{2\}\).\([0-9]\{8\}\).\(BOX[0-9]\{2\}\).\([A-Z]\{6\}\).*/\1;\2;\3;\4;\5;/p' test.html
ABCDEF;ETAGERE34;12345678;BOX06;UNITEA;
ZERDEF;ETAGERE04;88888888;BOX12;UNITER;
UYRDEF;ETAGERE12;87654321;BOX65;UNITEZ;