Script SED ou AWK qui remplace la valeur d'un attribut par la valeur d'un autre attribut

**Axtiz** · 09/05/2019, 14h46

Bonjour,

J'ai beaucoup cherché, sans trouver de solution; avant de demander de l'aide en ligne.
Voila mon problème :
Je cherche à remplacer la valeur d'un attribut dans un fichier par la valeur d'un autre attribut.
Précision : le fichier en question, pour ceux qui connaissent, est un fichier de type "ldif" (extension .ldif), fichier qui contient par exemple, la liste des utilisateurs ldap avant l'intégration à ldap.

Le fichier est constitué comme ce-ci :

.....

DN: uid:jean.valjean,ou=Users,dc=local,dc=com
uid: jean.valjean
mail: jean.vlajean@local.com
gecos: gnagnagna

DN: uid:jean.paul,ou=Users,dc=local,dc=com
uid: jean.paul
mail: jean.paul@local.com
gecos: gnignigni

.....

Et il est constitué de X paragraphes avec à peut près la même structure.. je dis a peut près car des fois l'attribut gecos est avant l'attribut mail..

Ce que je veux faire en faite c'est de remplacer la valeur de l'attribut mail par la valeur de l'attribut gecos.
En gros sur l'exemple précédent j'aimerai obtenir :

.....

DN: uid:jean.valjean,ou=Users,dc=local,dc=com
uid: jean.valjean
mail: gnagnagna
gecos: gnagnagna

DN: uid:jean.paul,ou=Users,dc=local,dc=com
uid: jean.paul
mail: gnignigni
gecos: gnignigni

.....

j'ai trouvé le moyen d'extraire chacune des valeur.. mais pour le remplacement je n'y arrive pas..
Quelqu'un aurait une idée ? je pense que avec SED ou AWK ça doit être possible mais j'avoue que je sèche...

EDIT :

J'ai trouvé un moyen pas très propre mais qui se tiens pour le moment :

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

sed -e '/./{H;$!d;}' -e 'x;/gecos/!d;' /etc/ldap/test/fichier.ldif | sed /mail/d | sed s/gecos/mail/g

Ce qui donne :
.....

DN: uid:jean.valjean,ou=Users,dc=local,dc=com
uid: jean.valjean
mail: gnagnagna

DN: uid:jean.paul,ou=Users,dc=local,dc=com
uid: jean.paul
mail: gnignigni

.....

Si quelqu'un à une meilleure idée..

**becket** · 09/05/2019, 19h11

Salut

C'est l'histoire d'une ligne

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
 
awk ' BEGIN { RS="DN:" } {  print gensub("(.*)(mail:)(.*)\n(gecos:)(.*)\n","RS:\\1\\2\\5\\4\\5","g")   } ' fichier.ldif

**Axtiz** · 10/05/2019, 08h31

Envoyé par becket

Salut

C'est l'histoire d'une ligne

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
 
awk ' BEGIN { RS="DN:" } {  print gensub("(.*)(mail:)(.*)\n(gecos:)(.*)\n","RS:\\1\\2\\5\\4\\5","g")   } ' fichier.ldif

Alors j'ai testé ton code, effectivement c'est pas mal, mais ça ne marchera pas en production.
C'est de ma faute je n'ai pas été assez précis :
entre mail et gecos il y a plein d'attributs à la con, du style :
objectClass: person
objectClass: organizationalPerson
objectClass: inetOrgPerson
objectClass: posixAccount
objectClass: top
objectClass: shadowAccount
shadowLastChange: 15686
loginShell: /bin/false
uidNumber: 2222

Ta commande est bien mais elle écrase tous les attributs qu'il y a entre mail et gecos.
Mais c'est moi qui n'ai pas été assez précis.

**becket** · 10/05/2019, 08h38

Effectivement ....

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
 
  print gensub("(.*)(mail:)(.*)\n(.*)\n(gecos:)(.*)\n","RS:\\1\\2\\6\\3\\5\\6","g")

Pour y arriver, suffit de rajouter la recopie de cette partie la ( j'ai pas testé le code )

**Axtiz** · 10/05/2019, 08h45

Je vais tester, ça m'a l'air vraiment pas mal.

"RS:\\1\\2\\6\\3\\5\\6","g")

Cette partie veux dire quoi ?

je suis nul en AWK

**becket** · 10/05/2019, 09h18

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
 
awk ' BEGIN { RS="DN:" } {  print gensub("(.*)(mail:)(.*)\n(gecos:)(.*)\n","RS:\\1\\2\\5\\4\\5","g")   } ' fichier.ldif

Le plus simple est d'expliquer toute la commande

RS="DN:"

Le début d'un enregistrement commence par DN:. Cela permet de travailler sur des enregistrements et pas sur des "lignes".

- gensub permet de faire du chercher/remplacer sur une chaine de caractère ( ici sur $0 qui correspond à l'enregistrement au complet )
- () permet de mettre dans un tampon 1 - 2 -3 une partie de la chaine ( les \\1 \\2 )
- . n'importe quel caractère
- * répétition 0 ou +
=> .* n'importe quel caractère répété 0 ou plus

Ce qui donne pour le début :

(.*)(mail

(.*)\n

Après le séparateur : tu prends tous les caractères jusqu'a 'mail:' et tu mets le tout dans un tampon 1 :
Tu mets mail: dans le tampon 2 ( ce n'est pas obligatoire )
Tu mets tous entre mail: et le retour à la ligne (\n) dans le tampon 3

... etc etc

Une fois la chaine découpé tu remplaces cette chaines par RS: et la série de tampon que l'on a pris juste avant

RS:\\1\\2\\5\\4\\5

**Axtiz** · 10/05/2019, 09h22

Très intéressant, il faut vraiment que je prenne des cours perso sur AWK qui m'a l'air vraiment puissant et qui peut répondre à pas mal de problématiques. Merci en tout cas pour ces explications.

**disedorgue** · 09/05/2019, 19h12

Bonjour,

Dans ton résultats, on voit que tu n'as plus l'attribut gecos, donc c'est hyper simple:
tu vires les lignes d'attribut mail et tu change le mot "gecos" par mail et si tu veux aussi garder gecos, bah tu dupliques la ligne gecos.

**Axtiz** · 10/05/2019, 08h34

Envoyé par disedorgue

Bonjour,

Dans ton résultats, on voit que tu n'as plus l'attribut gecos, donc c'est hyper simple:
tu vires les lignes d'attribut mail et tu change le mot "gecos" par mail et si tu veux aussi garder gecos, bah tu dupliques la ligne gecos.

Oui, si tu regarde mon post, j'avais fait un EDIT parce que effectivement j'avais trouvé cette solution :

EDIT :

J'ai trouvé un moyen pas très propre mais qui se tiens pour le moment :

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

sed -e '/./{H;$!d;}' -e 'x;/gecos/!d;' /etc/ldap/test/fichier.ldif | sed /mail/d | sed s/gecos/mail/g

Ce qui donne :
.....

DN: uid:jean.valjean,ou=Users,dc=local,dc=com
uid: jean.valjean
mail: gnagnagna

DN: uid:jean.paul,ou=Users,dc=local,dc=com
uid: jean.paul
mail: gnignigni

.....

Si quelqu'un à une meilleure idée..

En réalité je pense que je vais retenir cette solution qui, au final, est beaucoup plus simple.
En tout cas merci à vous deux, si vous avez d'autres idées je suis toujours preneur !

**disedorgue** · 10/05/2019, 08h45

Ok, mais ta ligne me parait bien compliqué, quelque chose comme ceci est suffisant:

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

sed -e '/^mail:/d' -e '/gecos/s/gecos/mail/' fichier.ldiff

Et si tu veux garder la ligne gecos:

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

sed -e '/^mail:/d' -e '/gecos/s/gecos\(.*\)/mail\1\n&/' fichier.ldiff

**Axtiz** · 10/05/2019, 09h03

Oui ça marche aussi mais en faite pour être plus précis, le début de la commande :

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

sed -e '/./{H;$!d;}' -e 'x;/gecos/!d;' /etc/ldap/test/fichier.ldif

ça va me permettre de filtrer par groupe.
Au final ce sera un truc du style :

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

sed -e '/./{H;$!d;}' -e 'x;/groupe 1/!d;' /etc/ldap/test/fichier.ldif | sed /mail/d | sed s/gecos/mail/g

si je fais le code que tu m'as proposé il va le faire pour tous le monde et ce n'est pas forcément ce que je veux.

Ce début de commande :

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

sed -e '/./{H;$!d;}' -e 'x;/groupe 1/!d;' /etc/ldap/test/fichier.ldif

permet en faite d'isoler les paragraphes qui contiennent le groupe 1.
D'ailleur si tu es bon en SED j'aurai bien voulu trouver une explication de cette commande notamment -e '/./{H;$!d;}' Que je n'arrive pas à décrypter. Je l'ai trouvé sur le net mais ça fonctionne super bien.

**disedorgue** · 10/05/2019, 09h47

Envoyé par Axtiz

si je fais le code que tu m'as proposé il va le faire pour tous le monde et ce n'est pas forcément ce que je veux.

Ce début de commande :

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

sed -e '/./{H;$!d;}' -e 'x;/groupe 1/!d;' /etc/ldap/test/fichier.ldif

permet en faite d'isoler les paragraphes qui contiennent le groupe 1.
D'ailleur si tu es bon en SED j'aurai bien voulu trouver une explication de cette commande notamment -e '/./{H;$!d;}' Que je n'arrive pas à décrypter. Je l'ai trouvé sur le net mais ça fonctionne super bien.

Dans ce cas, je comprend mieux...

Sinon, /./{H,$!d;} prend toutes les ligne non vides et les place dans le 'hold space' tout en l'effaçant si ce n'est pas la dernière ligne et on passe à la ligne suivante:
/./ ==> ligne non vide
H ==> placer la ligne dans le 'hold space'
$ ==> dernière ligne ?
! ==> negation
d ==> efface la ligne et on recommence le cycle avec la ligne suivante

Script SED ou AWK qui remplace la valeur d'un attribut par la valeur d'un autre attribut

Shell et commandes GNU

Vue hybride

Discussions similaires

Partager

Partager