Bonjour,
Quelqu’un peut m'aider pour optimiser ce noyau avec :
1) Les directives OpenMP pour paralléliser le noyau.
2) Les intrinsics pour écrire/optimiser le code, voir modifiez directement l'assembleur.
Voila le noyau :
Merci d'avance.
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16 void kernel (int n, double a[n], double b[n], double c[n]) { int i, j; for (j=0;j<n;j++) { for(i=0;i<n;i++) { c[i]+=b[n-1-i]; if (i<j) { c[i]+=a[j]; } } } }
Cordialement.
Partager