Mais généralement, on essaie de laisser les données d'un côté ou de l'autre (HOST/DEVICE) et de rapatrier qu'en cas d'absolue nécessité...
Par contre, il me semble avoir lu sur les papier fourni par NVidia que la vitesse d'accès au cache propre à chaque WARP est identique à la vitesse d'accès d'un processeur à son cache... (véracité -> ?)
J'ai trouvé quelques documents écrit par V. Volkov, je vais commencer à les lire...
Si vous avez d'autres exemple / bench, je suis prenneur!




Répondre avec citation





Partager