trier et enlever les doublons en Shell

**sebcah** · 07/05/2008, 16h58

Bonjour,

je souhaitais savoir comment faire pour transformer le fichier liste.txt suivant :

antony;034;
antony sud;034;
paris;075;
antony;034;
massy;091;
savigny;034;

en

antony / antony sud / savigny;034
paris;075;
massy;091;

Ainsi il faut :
-supprimer les doublons
-mettre à la suite les villes ayant même numéro en rajoutant le numéro à la fin

Merci du coup de main

Seb

**BlaireauOne** · 07/05/2008, 20h40

Tri avec élimination des doublons :

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
 
sort -u -t";" -k2,2 -k1,1 liste.txt

Pour la suite, les commandes cut ou awk peuvent t'être utiles.
Propose une ébauche de script et on verra¨

**ripat** · 07/05/2008, 20h57

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
#!/bin/bash
# tri
sort -u -t ";" -k 2 -k 1 ton-fichier | \
 
# traitement awk
awk '
BEGIN {FS = OFS = ";"}
{
        sep = code[$2] ? "/" : ""
        code[$2] = code[$2] sep $1
}
 
END {
        for (i in code) {
                print code[i], i
        }
}
'

**BlaireauOne** · 08/05/2008, 12h46

ripat, ma solution awk n'aurait pas été aussi concise

**ripat** · 09/05/2008, 11h23

Merci. Les tableaux awk permettent beaucoup de choses. Mais, en testant le code ci-dessus je suis tombé sur une particularité des tableaux awk qui m'a perturbé un peu. Les indices des tableaux awk sont associatifs. Les indices numériques sont ainsi d'abord transformés en chaînes de caractères. Donc, si on entre un élément: tableau[75]="Paris", le 75 sera transformé en chaîne selon le format %.6g. Mais si on entre les éléments: tableau[075]="Paris"; tableau[61]="Là-bas"

Si on fait un print tableau[075] on aura "Là-bas" comme résultat. Etonnant non? Awk transforme les nombres en chaînes *sauf* si ce nombre est un octal valide! Et, l'octal 075 donne 61 en base décimale!

Octal and hexadecimal constants (see Nondecimal-numbers) are converted internally into numbers, and their original form is forgotten.

Le genre de piège à perdre du temps!

**sebcah** · 12/05/2008, 11h19

Salut !

Merci beaucoup pour ce code qui marche super

Par contre je débute en shell et je ne comprends pas ce que font les lignes :

sep = code[$2] ? "/" : ""

et

print code[i], i

quelqu'un pourrait-il m'expliquer

??

Merci

trier et enlever les doublons en Shell

Shell et commandes GNU

Vue hybride

Discussions similaires

Partager

Partager