Bonjour,

Quelqu’un peut m'aider pour optimiser ce noyau avec :
1) Les directives OpenMP pour paralléliser le noyau.
2) Les intrinsics pour écrire/optimiser le code, voir modifiez directement l'assembleur.

Voila le noyau :
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
 
void kernel (int n, double a[n], double b[n], double c[n])
{
	int i, j;
	for (j=0;j<n;j++)
	{
		for(i=0;i<n;i++)
		{
			c[i]+=b[n-1-i];
			if (i<j)
			{
				c[i]+=a[j];
			}
		}
	}
}
Merci d'avance.



Cordialement.