IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Index du forum

Recherche:

Type: Messages; Utilisateur: epsilon68

Page 1 sur 2 1 2

Recherche: Recherche effectuée en 0,02 secondes.

  1. Votes reçus
    +0 -0
    Réponses
    123
    Affichages
    11 174

    heu j'en sais rien, mais la STL tenait toujours...

    heu j'en sais rien, mais la STL tenait toujours le haut du pavé dans nos tests d'avant.

    dual-processor xeon:
    C =10000000: 1.094s
    OpenMP=10000000: 0.625s
    STL =10000000: 0.625s

    macosx intel...
  2. Votes reçus
    +0 -0
    Réponses
    123
    Affichages
    11 174

    je me suis trompé de benchmark, je vais corriger...

    je me suis trompé de benchmark,
    je vais corriger ce soir.

    sinon je trouve les resultats pas si mal que ca,
    pour mémoire j'avais obtenu avec le dual-processor xeon:
    C =10000000: 1.094s...
  3. Votes reçus
    +0 -0
    Réponses
    123
    Affichages
    11 174

    hop je ré-ouvre un peu ce débat, je suis sur mon...

    hop je ré-ouvre un peu ce débat, je suis sur mon mac avec gcc 4.2
    j'ai essayé de regarder un peu si Openmp etait aussi plus lent sur de petites boucles avec le code suivant qui est le meme que celui...
  4. Votes reçus
    +0 -0
    Réponses
    123
    Affichages
    11 174

    voila:

    voila:
  5. Votes reçus
    +0 -0
    Réponses
    123
    Affichages
    11 174

    ... attendons les prochains benchs ! si un...

    ... attendons les prochains benchs !
    si un expert assembleur nous lis alors j'aimerais bien avoir son avis sur le code généré 8-)
  6. Votes reçus
    +0 -0
    Réponses
    123
    Affichages
    11 174

    Je me méfie énormement .... je pense que le...

    Je me méfie énormement .... je pense que le compilateur fait beaucoup de choses derriere et la latence n'est plus mise en evidence ...

    Y-aurait-il un expert en assembleur qui pourrait nous...
  7. Votes reçus
    +0 -0
    Réponses
    123
    Affichages
    11 174

    attends j'avais enlevé le if donc en mettant ...

    attends j'avais enlevé le if

    donc en mettant

    #pragma omp parallel for if(LEN>10000) reduction(+:sum)

    j'obtiens:
    number of thread max: 4
    C =1000: 0.875s
    OpenMP=1000: 1.297s
  8. Votes reçus
    +0 -0
    Réponses
    123
    Affichages
    11 174

    number of thread max: 4 C =1000: 0.89s...

    number of thread max: 4
    C =1000: 0.89s
    OpenMP=1000: 10.735s

    et j'ai le code suivant (apres beaucoup de tests/modifs)

    Je ne comprends pas le if openmp,
    autant faire un if (en dessous d'une...
  9. Votes reçus
    +0 -0
    Réponses
    123
    Affichages
    11 174

    mais que ton implementation soit si rapide...

    mais que ton implementation soit si rapide m'etonne vraiment ...
    tu ne peux pas etre aussi rapide que le c quand meme .... tu as au minimum une legere penalité d'initialisation des threads ..

    Tu...
  10. Votes reçus
    +0 -0
    Réponses
    123
    Affichages
    11 174

    je n'obtiens pas du tout des resultats...

    je n'obtiens pas du tout des resultats coherents...
    si on pouvait maintenant changer d'une addition et appliquer une formule telle que cosinus ...
  11. Votes reçus
    +0 -0
    Réponses
    123
    Affichages
    11 174

    Je suis tres respectueux des licences et...

    Je suis tres respectueux des licences et j'apprecie ton travail.
  12. Votes reçus
    +0 -0
    Réponses
    123
    Affichages
    11 174

    ;-) j'aime vraiment OpenMP c'est pour ca que je...

    ;-) j'aime vraiment OpenMP c'est pour ca que je m'interesse beaucoup si il y a des eventuelles faiblesses, et de chercher la raison... Ton benchmark me passionne, la concurrence est un sujet qui me...
  13. Votes reçus
    +0 -0
    Réponses
    123
    Affichages
    11 174

    je suis d'accord que la reduction avec openmp est...

    je suis d'accord que la reduction avec openmp est limité.
    je pense aussi que ta section critique peut etre evitée en gardant les valeurs de chaque thread puis de faire la reduction manuellement (pas...
  14. Votes reçus
    +0 -0
    Réponses
    123
    Affichages
    11 174

    je pense qu'on peut eviter ta section critique....

    je pense qu'on peut eviter ta section critique.
    Aussi je ne vois pas pourquoi OpenMP aurait une latence, c'est bizarre.
    J'aurais bien aimé comparer vraiment en essayant d'autres facons de mon coté...
  15. Votes reçus
    +0 -0
    Réponses
    123
    Affichages
    11 174

    par exemple double threadvalues = new...

    par exemple


    double threadvalues = new double[ omp_get_num_threads_max()]

    #pragma omp for
    for( i=0 ; i<end-begin ; i++) {
    threadvalues[omp_get_thread_num()] = xxx;
    }
  16. Votes reçus
    +0 -0
    Réponses
    123
    Affichages
    11 174

    j'ai un doute sur: #pragma omp parallel if...

    j'ai un doute sur:


    #pragma omp parallel if (nchunks>1) firstprivate(func)
    {
    #pragma omp for schedule(dynamic,1)
    for (int i=0; i<nchunks; ++i)
    {
    int d=i*grain;
    ...
  17. Votes reçus
    +0 -0
    Réponses
    123
    Affichages
    11 174

    voila:

    voila:
  18. Votes reçus
    +0 -0
    Réponses
    123
    Affichages
    11 174

    ca me surprend quand meme drolement que OpenMP...

    ca me surprend quand meme drolement que OpenMP est plus lent que ta solution ... ca peut pas venir d'autre chose ?
  19. Votes reçus
    +0 -0
    Réponses
    123
    Affichages
    11 174

    voila...

    voila...
  20. Votes reçus
    +0 -0
    Réponses
    123
    Affichages
    11 174

    c'est l'hyperthreading si je ne m'abuse...

    c'est l'hyperthreading si je ne m'abuse...
  21. Votes reçus
    +0 -0
    Réponses
    123
    Affichages
    11 174

    je ne pense pas que l'addition soit representatif...

    je ne pense pas que l'addition soit representatif pour un benchmark. Regarde le mien quand j'ai utilisé un cos ... OpenMP etait plus de 2 fois plus rapide...

    ... j'adore OpenMP :D
  22. Votes reçus
    +0 -0
    Réponses
    123
    Affichages
    11 174

    ... j'attends tres impatiemment le nouveau bench...

    ... j'attends tres impatiemment le nouveau bench ....
  23. Votes reçus
    +0 -0
    Réponses
    123
    Affichages
    11 174

    il faudrait vraiment faire plus qu'une addition...

    il faudrait vraiment faire plus qu'une addition dans cette boucle ...
    une expression mathematique ? un cos tan etc..
  24. Votes reçus
    +0 -0
    Réponses
    123
    Affichages
    11 174

    a priori un benchmark comme cela ne montre pas...

    a priori un benchmark comme cela ne montre pas vraiment la superiorité du MT...
    il faut charger la mule pour le voir...
    juste en mettant: sum+=cos(X[j]/(double)i);
    j'obtiens:

    C =0: 37.813s...
  25. Votes reçus
    +0 -0
    Réponses
    123
    Affichages
    11 174

    flute j'avais loupe l'init du t0 :mouarf: en...

    flute j'avais loupe l'init du t0 :mouarf:

    en corrigeant tous ca j'obtiens:

    number max of threads:4
    C =10000000: 1.094s
    OpenMP=10000000: 0.625s
    STL =10000000: 0.625s
Affichage des résultats 1 à 25 sur 36
Page 1 sur 2 1 2