Bonjour à tous, je suis nouveau sur ce forum
J'utilise des fonctions basique de linux/unix sous mac, mais ne pense pas avoir assez de connaissance pour resoudre une requete
J'ai fait divers requetes de croisement et filtrage de donnees pour arriver à l'enoncée suivante simplifiée
Ce qui m'interesse ce sont les champs n°2 et n°4 comme element de requete
On remarque des doublons sur le champs n°4 (52KTM...) et c'est ce qui m'interesse! Je veux travailler sur les doublons
Je veux supprimer de cette liste les lignes contenant les ref de champ n°5 qui sont uniques et garder les lignes de doublons, ou plutôt
en finalité, je voudrais garder les lignes avec une seule des reference n°5 de doublon où la ligne gardée serait celle qui a le champs n°2 avec le chiffre le plus élevé
donc supprimer les lignes où il y a qu'une occurence en champs n°5
et garder par exemple id 263787 nom 52KTM75B MOTOR et pas id 262111 nom 52KTM75B MOTOR qui est plus ancien (263787>262111, et commun: 52KTM75B), et ainsi de suite
awk? sort? condition?
j'ai commencé avec des essai awk, mais ne suis pas sur d'avoir tous compris, j'ai testé 'uniq' j'ai reussi à enlever uniquement la premiere ligne avec champs n°5 unique et pas la 8, ce ne doit pas etre la bonne expression
Si quelqu'un peut m'aider à resoudre ce pb, et m'orienter, pour les fois suivantes car j'aurais d'autres requetes un peu de ce type a realiser
je vous remercie d'avance
ian
Ma liste:
Code:
1
2
3
4
5
6
7
8
9
10
11
12
13
14 id 263786 nom 52KTM75A MOTOR id 262111 nom 52KTM75B MOTOR id 263787 nom 52KTM75B MOTOR id 262112 nom 52KTM78F MOTOR id 263788 nom 52KTM78F MOTOR id 262113 nom 52KTM78B MOTOR id 263789 nom 52KTM78B MOTOR id 263790 nom 52KTM96C MOTOR id 262114 nom 52KTM96G MOTOR id 263791 nom 52KTM96G MOTOR id 262115 nom 52KTM99B MOTOR id 263792 nom 52KTM99B MOTOR id 262116 nom 52KTM99F MOTOR id 263793 nom 52KTM99F MOTOR