IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

SL & STL C++ Discussion :

std::sort lent pour les short int


Sujet :

SL & STL C++

  1. #1
    Nouveau Candidat au Club
    Profil pro
    Inscrit en
    Novembre 2006
    Messages
    2
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Novembre 2006
    Messages : 2
    Points : 1
    Points
    1
    Par défaut std::sort lent pour les short int
    Bonjour,
    Je viens de faire un test comparatif des temps d'exécution de std::sort sur différents types de base. Le résultat est déroutant : trier des short int est presque 3 fois plus long que de trier des int !

    Est-ce qqn a l'explication ????

    Voici les conditions :
    - tableaux (C) de 10^8 valeurs à trier.
    - les tableaux sont initialisés dans les désordre
    - résultats obtenus avec du code compilé sous visual 2010
    - même résultats sous windows 2008 server 64 bits
    windows 7 64bits et 32bits.

    (code source du main.cpp en fichier attaché)

    résultats console :
    2715 ms pour trier 10^8 uchar
    4462 ms pour trier 10^8 ushort
    1840 ms pour trier 10^8 uint
    3339 ms pour trier 10^8 float
    Fichiers attachés Fichiers attachés

  2. #2
    En attente de confirmation mail

    Homme Profil pro
    Ingénieur développement logiciels
    Inscrit en
    Août 2004
    Messages
    1 391
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 33
    Localisation : France, Doubs (Franche Comté)

    Informations professionnelles :
    Activité : Ingénieur développement logiciels

    Informations forums :
    Inscription : Août 2004
    Messages : 1 391
    Points : 3 311
    Points
    3 311
    Par défaut
    C'est pas nécessairement incohérant, le type int est normalement le plus adapté à l'architecture de ta machine. Les autres types peuvent être moins adapté et donc pas nécessairement plus rapide même si plus petit.

    Je ne connais pas assez les détails techniques pour approfondir plus

  3. #3
    Rédacteur/Modérateur
    Avatar de JolyLoic
    Homme Profil pro
    Développeur informatique
    Inscrit en
    Août 2004
    Messages
    5 463
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 49
    Localisation : France, Yvelines (Île de France)

    Informations professionnelles :
    Activité : Développeur informatique
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Août 2004
    Messages : 5 463
    Points : 16 213
    Points
    16 213
    Par défaut
    Tes tableaux ne sont pas initialisés dans le désordre, mais dans un ordre bien précis. Qui plus est, avec les int, on n'a pas de doublons dans le tableau.

    Je serais curieux de voir ce que ça donne :
    - Avec un random shuffle avant le tri
    - Idem, mais en s'assurant au début que tous les tableaux contiennent les mêmes valeurs uniquement (entre 0 et 255 donc).
    Ma session aux Microsoft TechDays 2013 : Développer en natif avec C++11.
    Celle des Microsoft TechDays 2014 : Bonnes pratiques pour apprivoiser le C++11 avec Visual C++
    Et celle des Microsoft TechDays 2015 : Visual C++ 2015 : voyage à la découverte d'un nouveau monde
    Je donne des formations au C++ en entreprise, n'hésitez pas à me contacter.

  4. #4
    Membre émérite

    Inscrit en
    Mai 2008
    Messages
    1 014
    Détails du profil
    Informations forums :
    Inscription : Mai 2008
    Messages : 1 014
    Points : 2 252
    Points
    2 252
    Par défaut
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
     
       tic();
       std::sort(ustable, ustable + NBIG);
       toc();
       printf(" pour trier 10^8 ushort\n");
     
       tic();
       std::sort(ustable, ustable + NBIG);
       toc();
       printf(" pour trier 10^8 uint\n");
    Ce code fait deux fois la même chose. Les printf mentent.

    Edit : + 1 avec loic, ce n'est pas une très bonne idée de comparer des ensembles de donnée différents. Et surtout le tableau d'uint est déjà trié de 65535 à 0 en ordre décroissant ce qui est clairement un cas particulier qui fausse la mesure du sort.

    Chez moi (vs2010), si tous les tableaux contiennent des valeurs aléatoires comprises entre zéro et 255 alors le timing de chaque sort deviennent quasi similaire.

  5. #5
    Nouveau Candidat au Club
    Profil pro
    Inscrit en
    Novembre 2006
    Messages
    2
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Novembre 2006
    Messages : 2
    Points : 1
    Points
    1
    Par défaut
    J'avais pas vu la coquille ! merci Arzar. C'est encore pire que ça la mesure la plus rapide était en fait un tri du tableau déjà trié

    J'ai tenu compte de vos remarques : maintenant les tableaux sont initialisés par la fonction rand, qui sort un entier pseudo aléatoire entre 0 et RAND_MAX = 32767. tous les tableaux ont les mêmes valeurs après init (j'oublie les uchar), effectivement le tri de short et de int est presque aussi rapide, ce qui semble plus naturel

    @JolyLoic : voici les résultats avec des nombre aléatoires entre 0 et 255
    (sortie de rand casté en uchar). Les mêmes valeurs sont données aux 4 tableaux à l'init.

    résultats console :
    4649 ms pour trier 10^8 uchar
    4852 ms pour trier 10^8 ushort
    4742 ms pour trier 10^8 uint
    6521 ms pour trier 10^8 float

    il n'y a que pour les float que c'est plus long sinon les différences ne sont pas significatives.

    Pour les types entiers, effectivement la durée d'exécution du tri de valeurs aléatoires dépend de la dynamique.

    merci à tous
    Fichiers attachés Fichiers attachés

  6. #6
    Invité
    Invité(e)
    Par défaut
    Une petite remarque, qui n'invalide pas les résultats du test.

    std::sort, généralement fondé sur l'implémentation usuelle de quicksort, n'est pas très efficace en présence de clefs dupliquées (parce qu'il s'acharne à "trier" les valeurs égales). Sur des tableaux de 100 millions d'entrées remplis au hasard, on pourra, en modifiant l'algorithme (je crois qu'on peut le faire sans sortir de la stl, en jouant astucieusement sur "partition") accélérer nettement les tris sur des tableaux fortement dupliqués (ici les char).

    Egalement, sur des tableaux ayant un tout petit nombre de valeurs (256 ici), un comptage suffirait (donc une mémoire additionnelle de 256 double mots, et deux passes sur le tableau de départ, N lectures, N écritures, N incrémentations d'un entier, aucune comparaison, par rapport à un quicksort, et sur 100 millions de données on doit gagner pas mal).

    Du coup, ce test de vitesse de sort() ne correspond pas vraiment à des conditions normales d'utilisation.

    Francois
    Dernière modification par Invité ; 27/01/2012 à 19h24.

Discussions similaires

  1. temps d'exécution très lent pour les boucles for
    Par NELLLY dans le forum MATLAB
    Réponses: 2
    Dernier message: 02/01/2013, 11h00
  2. Réponses: 6
    Dernier message: 08/03/2007, 17h23
  3. Réponses: 4
    Dernier message: 16/01/2007, 15h27
  4. L'int 33h pour les coordonnées souris ?
    Par Psychoroid dans le forum Assembleur
    Réponses: 2
    Dernier message: 09/10/2006, 23h44
  5. [débutant] equivalent à sprintf pour les std::string
    Par Biosox dans le forum SL & STL
    Réponses: 22
    Dernier message: 26/08/2005, 12h46

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo