IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

C++ Discussion :

Lenteur du vector<string>


Sujet :

C++

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Futur Membre du Club
    Profil pro
    Inscrit en
    Décembre 2010
    Messages
    3
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Décembre 2010
    Messages : 3
    Par défaut Lenteur du vector<string>
    Bonjour,

    Je souhaite créer et remplir un vecteur de strings à partir d'un fichier texte. J'ai suivi le conseil de la faq :
    http://cpp.developpez.com/faq/cpp/?p...ream_iterators

    Mon fichier contient 300000 lignes de 2 colonnes. Soit 600000 strings à stocker. Pour faire simple, disons que la taille ne varie pas (en pratique elle varie). Voici le code que j'ai écrit :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    // ouvre le fichier
    ifstream file("fichier.txt",ios::in) ;
     
    // crée le vecteur de strings
    vector<string> list ;
     
    // réserve la mémoire
    int size = 600000 ;
    list.reserve(size) ;
     
    // remplit le vecteur
    copy(istream_iterator<string>(file),istream_iterator<string>(),back_inserter(list)) ;
     
    // ferme le fichier
    file.close() ;
    J'obtiens bien un vecteur de 600000 strings, pas de problème. Mon souci est dans le temps d'exécution : 1.4 secondes. Je trouve que c'est anormalement lent. Alors j'ai testé avec un tableau de strings :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    // ouvre le fichier
    ifstream file("fichier.txt",ios::in) ;
     
    // crée le tableau de strings
    int size = 600000 ;
    string * list = new string[size] ;
     
    // remplit le tableau
    for ( int i = 0 ; i < size ; i++ )
    	file >> list[i] ;
     
    // ferme le fichier
    file.close() ;
    Cette solution avec le tableau de strings s'exécute en 0.9 secondes. Je pensais que le vecteur était mieux adapté, et qu'il serait plus rapide. J'aimerais savoir si c'est "normal" ou si j'ai mal compris quelque chose. Je ne suis pas sûr de bien faire la réserve de mémoire avec le vecteur.

  2. #2
    Membre Expert
    Avatar de Klaim
    Homme Profil pro
    Développeur de jeux vidéo
    Inscrit en
    Août 2004
    Messages
    1 717
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Développeur de jeux vidéo
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Août 2004
    Messages : 1 717
    Par défaut
    D'abord, comment as-tu effectué tes mesures?

  3. #3
    Futur Membre du Club
    Profil pro
    Inscrit en
    Décembre 2010
    Messages
    3
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Décembre 2010
    Messages : 3
    Par défaut
    Pour mesurer le temps d'exécution, j'ai utilisé la fonction clock(). Par exemple, pour mesurer la première solution :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    // Début de la mesure
    clock_t t1 = clock() ;
     
    // Ce que je veux mesurer
    ifstream file("fichier.txt",ios::in) ;
    vector<string> list ;
    int size = 600000 ;
    list.reserve(size) ;
    copy(istream_iterator<string>(file),istream_iterator<string>(),back_inserter(list)) ;
    file.close() ;
     
    // Fin de la mesure
    clock_t t2 = clock() ;
    cout << (float)(t2-t1)/CLOCKS_PER_SEC << endl ;
    Je n'ai pas fait de boucle pour moyenner le temps sur plusieurs itérations. Mais j'ai exécuté plusieurs fois ce bout de code, et j'obtiens sensiblement (à 0.1 sec près) les mêmes valeurs.

  4. #4
    Membre Expert Avatar de Astraya
    Homme Profil pro
    Consommateur de café
    Inscrit en
    Mai 2007
    Messages
    1 048
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 39
    Localisation : France

    Informations professionnelles :
    Activité : Consommateur de café
    Secteur : High Tech - Multimédia et Internet

    Informations forums :
    Inscription : Mai 2007
    Messages : 1 048
    Par défaut
    SI tu compares la fonction cpy à ta fonction for, tu verras que copy effectue des choses en plus.
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    template<class InputIterator, class OutputIterator>
      OutputIterator copy ( InputIterator first, InputIterator last, OutputIterator result )
    {
      while (first!=last) *result++ = *first++;
      return result;
    }
    De plus le back_inserter rajoute un appel de fonction pour chaque ligne. Sur 100 ligne aucune différence, sur 30000 ça joue. Après ça vas dépendre de l'optimisation faite par le compilateur, a vérifié dans le code machine, ce n'est qu'une hypothèse.

    le copy + iterator + back_inserter n'est pas une combinaison de performances, mais de facilité d'utilisation et de relecture.

  5. #5
    r0d
    r0d est déconnecté
    Membre expérimenté

    Homme Profil pro
    Développeur informatique
    Inscrit en
    Août 2004
    Messages
    4 290
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Ain (Rhône Alpes)

    Informations professionnelles :
    Activité : Développeur informatique

    Informations forums :
    Inscription : Août 2004
    Messages : 4 290
    Billets dans le blog
    2
    Par défaut
    As-tu testé avec les options d'optimisations adéquates? (Il ne sert à rien de faire des tests de rapidité en mode Debug par exemple).

  6. #6
    Expert confirmé
    Avatar de Luc Hermitte
    Homme Profil pro
    Développeur informatique
    Inscrit en
    Août 2003
    Messages
    5 296
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Haute Garonne (Midi Pyrénées)

    Informations professionnelles :
    Activité : Développeur informatique
    Secteur : Aéronautique - Marine - Espace - Armement

    Informations forums :
    Inscription : Août 2003
    Messages : 5 296
    Par défaut
    std::vector::reserve() est ton ami -- et c'est ce que fait le tableau.
    Tu as les deque aussi sinon.
    Blog|FAQ C++|FAQ fclc++|FAQ Comeau|FAQ C++lite|FAQ BS|Bons livres sur le C++
    Les MP ne sont pas une hotline. Je ne réponds à aucune question technique par le biais de ce média. Et de toutes façons, ma BAL sur dvpz est pleine...

  7. #7
    Rédacteur
    Avatar de 3DArchi
    Profil pro
    Inscrit en
    Juin 2008
    Messages
    7 634
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Juin 2008
    Messages : 7 634
    Par défaut
    Salut,
    Citation Envoyé par Musix Voir le message
    [...]
    Remarque de méthode :
    Tu fais varier au - 3 paramètres :
    std::vector => new []
    std::copy => for
    std::istream_iterator =>operator>>

    Comment peux tu dire que tes différences de perf ne tiennent qu'au changement std::vector vs new ? Comment peux-tu garantir que cela ne vient pas du changement d'itérateurs de flux en lecture directe ?

  8. #8
    Futur Membre du Club
    Profil pro
    Inscrit en
    Décembre 2010
    Messages
    3
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Décembre 2010
    Messages : 3
    Par défaut
    Merci pour toutes vos réponses

    Première faute : j'étais en mode Debug
    Deuxième faute : tu as raison 3DArchi, trop de paramètres varient à la fois.

    J'utilisais déjà la fonction reserve(). Aussi bizarre que cela paraisse, ça améliore peu les performances. J'ai testé en mode release cette fois :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    t1 = clock();
    vector.reserve(size) ; // Test 1 : sans // Test 2 : avec
    copy(istream_iterator<string>(file),istream_iterator<string>(),back_inserter(vector)) ; 
    t2 = clock() ;
    Je passe de 0.56 sec à 0.48 sec en ajoutant la réserve.

    Quant à la comparaison vector vs [], j'obtiens désormais les mêmes ordres de grandeur que rmdak. Lorsque les deux structures sont remplies par l'opérateur >> les performances sont quasiment identiques.

  9. #9
    Membre éclairé

    Profil pro
    Inscrit en
    Septembre 2010
    Messages
    18
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Septembre 2010
    Messages : 18
    Par défaut
    J'utilisais déjà la fonction reserve(). Aussi bizarre que cela paraisse, ça améliore peu les performances.
    La ré allocation de mémoire lorsqu'un vector est plein est censée être "intelligente" au sens ou elle réserve non pas une case supplémentaire mais plutôt double (pas sur exactement de la quantité) la taille du vector en mémoire.

    Sa me rappel une entrée de la FAQ Stroustrup ou il parle du reserve vers la fin : http://www2.research.att.com/~bs/bs_...low-containers

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. vector<map<string, string> >::iterator ?
    Par scheme dans le forum C++
    Réponses: 11
    Dernier message: 10/12/2010, 09h32
  2. Réponses: 2
    Dernier message: 18/09/2010, 22h33
  3. Problème std::vector <std::string >
    Par TNT89 dans le forum SL & STL
    Réponses: 9
    Dernier message: 31/05/2008, 17h51
  4. conversion vector to string
    Par identifiant_bidon dans le forum C++
    Réponses: 18
    Dernier message: 15/11/2007, 10h40
  5. [jsp] Comment faire un cast de Vector to String?
    Par adil_vpb dans le forum Servlets/JSP
    Réponses: 2
    Dernier message: 05/03/2007, 11h29

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo