Bonjour,

je dois accélérer un GROS code java et j'hésite entre deux solutions, car je dispose d'un GROS cluster avec des centaines de CPU et bientôt quelques GPU.
Les deux options qui me semblent possibles sont :
- utiliser du C/C++ auto-vectorizé et lancé sur plusieurs CPU
- utiliser Cuda et faire tourner tout cela sur un GPU. Je tiens à préciser que dans mon cas le temps pris par les IO vers le GPU n'ont pas vraiment d'importance.

Est ce que quelqu'un aurait des informations sur ce qui est le plus rapide ?

Merci par avance.