Modifier plusieurs champs dans un fichier Csv

**francois_a** · 28/08/2009, 23h22

Bonjour à tous,

Je fais un script pour automatiser des taches administratives sous linux.
Actuellement, je bloque sur un problème de modification de champs. Je ne vois pas d'où cela vient.

Je souhaite remplacer certain champs vide par XX. Pour l'exemple, je n'utilise que de champs mais mes lignes contiennent 40 champs. Je dois en modifier une petite dizaine.

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
 
#!/bin/bash
 
...
# création du fichier et initialisation de la variable tmp
echo > $nouveau fichier
tmp=''
 
# Lecture du fichier ligne par ligne
for ligne in $(cat test.csv)
do
# Modification des champs 3 et 4
for c in 3 4 ;
do
 
# Selectionne une cellule
cel=$(echo $ligne | awk -F";" '{print $'$c'}')
 
# Test de la cellule
if [[ "$cel" == "" ]]
   then # Elle vide, j'atribue XX
          tmp=$(echo $ligne | awk -F";" 'BEGIN { OFS=";" }{$'sc'="XX"; print $0}')
          echo $tmp >> $nouveaufichier
          cat $nouveaufichier > test.csv
          tmp=''
fi
done
done

le fichier test.csv avant
aa;bb;;;
aa;bb;;dd,
aa;bb;cc;;

le resultat :

aa;bb;xx;;
aa;bb;;xx;
aa;bb;xx;dd,
aa;bb;cc;xx;

2 problèmes apparaissent :
Une première ligne vide (je ne vois pas d'où elle sort.
le resultat pour la ligne aa;bb;;; qui devrait etre aa;bb;xx;xx;

Quelqu'un voit-il le problème dans mon code ?

merci d'avance

Invité · 28/08/2009, 23h35

Heu...

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
5
6
7
8
9
cat francois_a.dat
aa;bb;;;
aa;bb;;dd,
aa;bb;cc;;
 
sed ':boucle1; s/;;/;xx;/; t boucle1' francois_a.dat
aa;bb;xx;xx;
aa;bb;xx;dd,
aa;bb;cc;xx;

non ?

**francois_a** · 28/08/2009, 23h44

Oui j'étais parti sur cette solution au départ. Une bonne ligne en sed et c'était réglé.
Mais car il y a un mais, certain champs doivent rester vide.

Par contre je ne vois pas à quoi correspond ce qui encadre s/;;/;xx;/;

:boucle1; et t boucle1

Invité · 28/08/2009, 23h48

si une substitution est opérée, t redirige vers le label boucle1 répéré par les :

**jabbounet** · 28/08/2009, 23h48

Une première ligne vide (je ne vois pas d'où elle sort.

ici peu etre...

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
5
6
7
8
9
10
#!/bin/bash

...
# création du fichier et initialisation de la variable tmp

echo > $nouveau fichier

tmp=''
....

pour avoir un fichier vraiment vide tu peux utiliser juste (sans l'echo)

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
 
> nouveauFichier.txt

**jabbounet** · 28/08/2009, 23h57

Autrement

As-tu penser a utiliser IFS pour parser tes lignes?

petit exemple:

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
5
6
 
#!/bin/bash
IFS=$','
vals='/mnt,/var/lib/vmware/VirtualMachines,/dev,/proc,/sys,/tmp,/usr/portage,/var/tmp'
for i in $vals; do echo $i; done
unset IFS

et set -x pour tracer l'execution

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
 
set -x
.... le code que je veux tracer
set +x

**francois_a** · 29/08/2009, 00h31

Merci pour le echo !!! Je suis tête en l'air par moment !!!

Sinon concernant IFS, je ne vois pas trop l'intérêt.

J'ai une idée mais je ne sais pas comment la mettre en oeuvre.

Il me semble que lorsque l'on utilise un pipe les variables reste les même.
Mon idée serai de faire un script qui renverrai çà :

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
 
#!/bin/bash
 
...
# création du fichier et initialisation de la variable tmp
> $nouveau fichier
tmp=''
 
# Lecture du fichier ligne par ligne
for ligne in $(cat test.csv)
do
# Modification des champs 3 et 4
tmp=$(echo $ligne |for c in 3 4 ;
         do
 
        # Selectionne une cellule
        cel=$(echo $ligne | awk -F";" '{print $'$c'}')
 
        # Test de la cellule
        if [[ "$cel" == "" ]]
           then # Elle vide, j'atribue XX
                   awk -F";" 'BEGIN { OFS=";" }{$'sc'="XX"; print $0}')
                  echo $tmp >> $nouveaufichier
                  cat $nouveaufichier > test.csv
                  tmp=''
        fi
        done)
done

bien sur j'ai testé et çà ne passe pas

**jabbounet** · 29/08/2009, 01h28

Un truc comme ça (je n'ai pas de shell sous la main, mais l'esprit y est)

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
 
#!/bin/bash
 
...
# création du fichier et initialisation de la variable tmp
> $nouveau fichier
tmp=''
 
# Lecture du fichier ligne par ligne
for ligne in $(cat test.csv)
do
# Modification des champs 3 et 4
IFS=;
echo "$line" | read array[1] array[2] array[3] array[4] array[5] 
IFS=" "
 
  for index in 3 4 
  do
     if [[ "X${array[index]" == "X" ]]
     then
        array[index]="XX"
     fi
  done 
echo "${array[1]};${array[2]};....." > fichiercible.csv
done

mes deux sources d'inspiration pour cette idée
http://www.linuxtopia.org/online_boo...de/arrays.html
http://www.unix.com/shell-programmin...tion-bash.html

Invité · 29/08/2009, 04h33

Ah, ouais... !

Je me permet de 'transcrire' ce que, s'il avait eu un shell, Jabbounet aurait écrit :

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
#!/bin/bash

No_champs=( 2 3 ) # soit les n° des champs souhaités moins un : les arrays commencent à 0

while read ligne
 do
   IFS=";" read -a Champs <<< "$ligne"

   for indice in ${No_champs[@]}  
    do
      test -z ${Champs[indice]} && Champs[indice]="xx"
   done

   var=$(printf '%s;' ${Champs[@]})
   echo "$var" >> fichiercible.csv

done < fichier.csv

**ripat** · 29/08/2009, 10h40

Un one-liner awk:

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

awk 'BEGIN{FS=OFS=";"}{$3=$3?$3:"xx";$4=$4?$4:"xx"}1' fichier

**jabbounet** · 29/08/2009, 12h28

Envoyé par N_BaH

Ah, ouais... !

Je me permet de 'transcrire' ce que, s'il avait eu un shell, Jabbounet aurait écrit :

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
#!/bin/bash

No_champs=( 2 3 ) # soit les n° des champs souhaités moins un : les arrays commencent à 0

while read ligne
 do
   IFS=";" read -a Champs <<< "$ligne"

   for indice in ${No_champs[@]}  
    do
      test -z ${Champs[indice]} && Champs[indice]="xx"
   done

   var=$(printf '%s;' ${Champs[@]})
   echo "$var" >> fichiercible.csv

done < fichier.csv

merci , c'est même plus joli que ce que j'aurais fait

Modifier plusieurs champs dans un fichier Csv

Shell et commandes GNU

Vue hybride

Discussions similaires

Partager

Partager