Optimisation de code

**mickagame** · 04/12/2014, 09h16

J'ai quelques questions sur de l'optimisation de code.
Je travail sur un émulateur et l code suivant à pour but de lire un word stocké en big endian (sur une architecture little endian)
B = Base
A = Adresse
D = La donnée

1ère solution :

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

D = (B[A+0] << 8) | (B[A+1])

=> Je compte 2 accès mémoire (1 fois pour lire B[A+0] et une autre pour lire B[A+1))

2 ème solution :

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
D = *((u16*) (B + A)) /* On lit le word à l'adresse B + A */
D = ((D & 0xFF) << 8) | ((D & 0xFF00) >> 8) /* On swap les bytes */

=> Je compte 1 accès mémoire mais plus d'opération (je suppose que D est travaillée dans un registre ...)

3 ème solution :

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

D = ((*((u16*) (B + A)) & 0xFF) << 8) | ((*((u16*) (B + A)) & 0xFF00) >> 8)

=> Équivalent à la deuxième mais écrit en une seule ligne.
Est ce que le compilateur va détecter que *((u16*) (B + A)) est présent deux fois et ne va faire qu'un seul accès mémoire ?

Merci pour l'aide que vous pourrez m'apporter.

**bacelar** · 04/12/2014, 15h21

"Premature optimization is the root of all evil !" Donald Knuth

Laissez l'optimiseur de code faire sa besogne.

Une approche plus performante est le chargement de la valeur dans un registre 16bit comme AX sous Intel et utiliser une mécanique de swap entre AH et AL, il doit bien avoir un opcode pour ça

.

Ne jamais optimiser dans le vide.
Il y a de très grosse chance que l'optimiseur détecte ce pattern et utilise l'opcode mystère de swap inter-registre.
Mais on s'en cogne, il trouvera bien un truc qui augmentera les performances en diminuant les cache-miss, en réordonnant les instructions pour éviter des Stall dans les pipelines, en utilisant des instructions imbittables dans l'instruction-set à plusieurs centaines d'opcode du moindre CPU du marché.

En clair, faite le code le plus lisible possible.
N'optimiser que le code qui ne respecte pas les performances attendues et avec un profiler, pas avec le doigt mouillé.

Optimisation de code

C++/CLI

Discussions similaires

Partager

Partager