
Envoyé par
unparia
Si l'on voulait se débarrasser maintenant totalement du tremplin des deux colonnes, il faudrait concevoir un tri sur matrice à deux dimensions aussi performant que le tri de Excel. Ce qui n'est pas acquis. Qui se lance avec moi dans cette tentative ?
Comme j'ai déjà vu des codes matrice + tri en mémoire plus lents que le standard Excel, pas trop emballé …
Comme j'ai déjà sous le coude tout le nécessaire, j'ai effectué une procédure hybride avec un tri QuickSort
sur une matrice à deux dimensions contenant juste la concaténation et le numéro de ligne
puis en créant une nouvelle matrice d'une colonne repérant les lignes à supprimer
pour au final appliquer la même méthode de suppression des doublons comme la procédure SuppressionDoublons (1,293s)
via le tri classique d'Excel et elle s'est avéré un peu plus longue pour 65 536 lignes : 1,527s …
Faudrait peut-être voir avec une procédure non hybride et toute en mémoire …
Point important : le tri QuickSort ne conservant pas forcément l'ordre d'origine, à ne pas négliger dans certains contextes.
Partager