Shell Parser fichier

**twixi** · 18/01/2011, 00h33

Bonsoir à tous,

Voilà depuis quelques heures que je cherche désespérément à savoir comment parser un fichier via en script ksh.

Mon fichier d'entrée est le suivant :

++
CATEGORIE 1

==
Sous catégorie 1

aaa
bbb
cc

==
Sous catégorie 2

dd
ffff
yyy

++
CATEGORIE 2
...

J'aimerai donc bien pouvoir récupérer les différentes parties de mon fichiers.

Exemple Catégorie1= CATEGORIE1
ss_catgorie1=aaa
bbb
ccc

etc...
Je viens donc quémander votre aide cher développeur.

En vous remerciant,

**N_BaH** · 18/01/2011, 02h12

comment parser un fichier via en script ksh

de la même manière qu'en bash probablement; regarde ici...

Après, ton plus gros problème est de décider quelle action effectuer selon que la ligne lue vaut tant ou tant.

tu as peut-être déjà pensé à quelque chose
...
?

**twixi** · 18/01/2011, 08h41

Bonjour N_BaH,

J'avais bien vu ton post, mais mon problème vient du fait qu'il n'est pas obligatoire que j'aie de sous catégories dans mon fichier :/
Peut-être faut-il penser à un autre manière de délimiter mes fichiers?

Effectivement, j'ai pensé à l'utilisation du awk.
Je décompose mes CATEGORIE en plusieurs fichiers via la commande :

file='categorie.log'
awk '/^"++"/{close f; f=""} f{print > f} /^"++"/{f="doc."++d}' ${file}

Sauf que cette commande ne fonctionne pas avec des caractères spéciaux que j'ai choisi pour délimiter mes catégories (++) . En effet, avec un BEGIN - END à la fin de chaque CATEGORIE cela pourrait fonctionner.

Ma question : Cela pourrait-il fonctionner avec caractères spéciaux?

Merci

**N_BaH** · 18/01/2011, 09h18

Bonjour,

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
5
6
#!/usr/bin/ksh
 
while read line
do [ "$line" = "++" ] && output="doc.$((++n))"
   echo "$line" >> "$output"
done < ton_fichier.log

cela pourrait-il être tout ce que tu demandes ?

**twixi** · 19/01/2011, 01h22

Bonsoir N_BaH,

Effectivement, cela pourrait coller, comme quoi il ne fallait pas chercher trop loin.
Afin de faciliter le parsing du fichier j'ai décidé de modifier le contenu du fichier

++ categorie 1
aa bb cc
aa bb cc

++categorie 2
= sous categorie 21
aa aa
bb bb

= sous categorie 22
cc dd

Je te fais part de l'algorithme général que je compte apporter grâce à ton aide:

~~1 - Découpe du fichier log en plusieurs doc.* correspondant aux catégories~~
2 - parcourir chaque doc.* pour en extraire les variables.
a. pour tous les fichiers doc.* lecture ligne à ligne
b. si deux premiers caractères = "++" alors v_CATEGORIE=ligne
c. si deux premiers caractères = "=" alors v_SS_CATEGORIE=ligne
d. sinon cela correspond au données

ce qui donne pour l'instant :

while read line
do [ "${line:0:2}" = "++" ] && output="doc.$((++n))"
echo "$line" >> "$output"
done < monfichier.log

j=0
k=0
while read line
do
if [ "${line:0:2}" = "++" ] ; then
data=""
varsc=""
k=0
let j=$j+1
typeset categorie$j="$line"

elif [ "${line:0:1}" = "=" ] ; then
data=""
let k=$k+1
varsc=$j"_"$k
typeset sscategorie${varsc}="$line"

elif [ "${line:0:3}" != "" ] ; then
typeset data="$data""$line
"
if [ "$varsc" = "" ];then
typeset "data$j"="$data"
else
typeset "data$varsc"="$data"
fi

fi

done < monfichier.log

Peut-être que cette méthode est trop brouillon ?

Dans l'attente de ton avis sur le sujet,

Merci d'avance !

**N_BaH** · 19/01/2011, 03h43

c'est typeset pour déclarer des variables, et pas set

J'aimerais bien savoir ce qui se passe en amont : le script qui produit ce log
et pourquoi tu dois retraiter le log, plutôt que d'avoir un log dans le format que tu veux...

d'ailleurs, quel est exactement le format voulu ?

Shell Parser fichier

Shell et commandes GNU

Vue hybride

Discussions similaires

Partager

Partager