Envoyé par t.b.p.
Parce que c'est un VLIW et non un CISC? Le problème ce n'est pas l'obtention, mais le décodage (puis la distribution, puis...).
De même, on pourrait être amené à penser qu'Intel se serait dispensé d'une Trace Cache, pleine de µ-ops, sur son P4 s'il n'avait estimé que le jeu en valait la chandelle, n'est-il pas?
De son coté un k8 est censé soutenir 3 opérations par cycle, si tant est que l'on ne déborde sur une frontière de 16 octets, que le tout soit enrobé dans des bundle de 8 octets d'operation en Direct Path, que la densité de branchement soit idoine et qu'on ait un vent arriere favorable.
Mais je dois me faire des idées.