IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Assembleur Discussion :

Instructions SIMD (de MMX à SSE) sur des entiers, un mémo réalisé par Philippe Guesset


Sujet :

Assembleur

  1. #1
    Responsable Pascal, Lazarus et Assembleur


    Avatar de Alcatîz
    Homme Profil pro
    Ressources humaines
    Inscrit en
    Mars 2003
    Messages
    7 965
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 58
    Localisation : Belgique

    Informations professionnelles :
    Activité : Ressources humaines
    Secteur : Service public

    Informations forums :
    Inscription : Mars 2003
    Messages : 7 965
    Points : 59 721
    Points
    59 721
    Billets dans le blog
    2
    Par défaut Instructions SIMD (de MMX à SSE) sur des entiers, un mémo réalisé par Philippe Guesset
    Les "Single Instructions Multiple Data" sur des entiers
    Un mémo indispensable pour débuter avec les SIMD

    Les SIMD, acronyme de « Single Instructions Multiple Data » appliquent simultanément une même opération à plusieurs données. Ces jeux d’instructions concernent des entiers (signés ou non) ou des flottants. De l’antique MMX aux différentes versions de SSE, les SIMD ont progressé en richesse fonctionnelle et en registres. Le mémo téléchargeable qu'accompagne cet article de découverte vous permettra de débuter sans devoir vous plonger dans la très volumineuse documentation d'Intel ou AMD.

    Lire l'article de présentation

    Télécharger le mémo

    Voici un aperçu du mémo :


    Et vous ?
    Que pensez-vous de ce mémo ?
    Pour quels types de traitements utilisez-vous ce genre de jeu d'instructions ?

    Retrouvez les meilleurs cours et tutoriels Assembleur

  2. #2
    Invité
    Invité(e)
    Par défaut
    J'aime beaucoup cette approche synthétique des instructions SIMD car il y a vraiment de quoi se perdre dans les documents d'Intel et d'AMD.
    J'avais, un temps, envisagé une approche informatique de ce travail, histoire de faciliter le développement. Une sorte d'aide en ligne... Mais, comme souvent en ce qui me concerne, ce n'est qu'un caillou de plus dans le cimetière de mes bonnes intentions (R.I.P.).
    En tout cas, merci beaucoup, Philippe, pour cette excellente synthèse !

  3. #3
    Expert confirmé
    Avatar de BeanzMaster
    Homme Profil pro
    Amateur Passionné
    Inscrit en
    Septembre 2015
    Messages
    1 899
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Suisse

    Informations professionnelles :
    Activité : Amateur Passionné
    Secteur : Tourisme - Loisirs

    Informations forums :
    Inscription : Septembre 2015
    Messages : 1 899
    Points : 4 353
    Points
    4 353
    Billets dans le blog
    2
    Par défaut
    Bonjour Philippe, ayant utilisé les SIMD qu'avec des valeurs flottante majoritairement. Suite à notre petite discussion sur le forum de Lazarus et ton exemples, Je viens de découvrir et lire cet article, qui est une très bonne introduction sur l'utilisation des opérations sur les entiers. Je vais faire plus de recherche et pouvoir faire évoluer ma bibliothèque.

    Merci

    A Bientôt

    Jérôme

  4. #4
    Expert confirmé

    Homme Profil pro
    Directeur de projet
    Inscrit en
    Mai 2013
    Messages
    1 465
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Yvelines (Île de France)

    Informations professionnelles :
    Activité : Directeur de projet
    Secteur : Service public

    Informations forums :
    Inscription : Mai 2013
    Messages : 1 465
    Points : 4 645
    Points
    4 645
    Par défaut Remerciements
    Bonjour,

    Merci Jérôme.

    J'ai vu ta bibliothèque vectorielle. C'est du travail. Je pense que la charge de tests doit avoir au moins égalé l'écriture même.

    Si tu trouves des erreurs ou omissions dans le texte sur les SIMD entiers, n'hésite pas à les signaler. Cela me sera utile et en retour utile à tous.

    Philippe

  5. #5
    Expert confirmé
    Avatar de BeanzMaster
    Homme Profil pro
    Amateur Passionné
    Inscrit en
    Septembre 2015
    Messages
    1 899
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Suisse

    Informations professionnelles :
    Activité : Amateur Passionné
    Secteur : Tourisme - Loisirs

    Informations forums :
    Inscription : Septembre 2015
    Messages : 1 899
    Points : 4 353
    Points
    4 353
    Billets dans le blog
    2
    Par défaut
    Citation Envoyé par Guesset Voir le message
    Bonjour,

    Merci Jérôme.

    J'ai vu ta bibliothèque vectorielle. C'est du travail. Je pense que la charge de tests doit avoir au moins égalé l'écriture même.

    Si tu trouves des erreurs ou omissions dans le texte sur les SIMD entiers, n'hésite pas à les signaler. Cela me sera utile et en retour utile à tous.

    Philippe
    Bonjour, Philippe, merci, oui ce fût fastidieux au début. Et les tests unitaires ont été primordiales pour tester les résultats.
    Mais j'ai eu l'aide de Peter, un ancien ingénieur en informatiques qui est bien plus doué que moi en maths Malheureusement je n'ai plus de nouvelle depuis un moment (il profite de sa retraite pour voyager )
    Cette bibliothèque est loin d'être finalisée surtout justement en ce qui concerne la manipulation des valeurs de type byte, et Integer surtout. Il reste encore pas mal de méthode qui ne sont pas en assembleur

    Je n'ai pas trouvé d'erreurs dans ton articles et comme je te l'ai dis je suis plus à l'aise avec les virgules-flottantes dans ce domaine. Par un contre un point important qu'il faudrait étoffer c'est l'alignement des données (surtout en 64bits) car l'utilisation d'un movaps au lieu d'un movups si les données ne sont pas alignées renverra obligatoirement des résultats erronés. (cf plus bas)

    Ensuite il faut noter que les conventions d'appel ne sont pas les même suivant l'OS (Windows vs Unix)

    Avec la version 3.1.x et sup de FPC on a accès à un nouveau mot-clef (sous Windows uniquement pour respecter la convention d'appel de celui-ci) VectorCall. Ce qui permet de placer directement les paramètres d'une méthode dans les registres SIMD, ce qui évite donc l'appel a des movXXX pour initialiser les registres.

    Ex :

    Code delphi : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
     
    {$MODESWITCH ADVANCEDRECORDS} 
     
    Type
      TBZVector4fType = packed array[0..3] of Single;  //< Tableau aligné pour les vecteur 4D Single      
      TBZVector4f =  record  
      public     
         class operator +(constref A, B: TBZVector4f): TBZVector4f; {$ifdef USE_VECTORCALL} vectorcall; {$endif}overload;   
     
      case Byte of
          0: (V: TBZVector4fType);                        //< Array access
          1: (X, Y, Z, W: Single);                          //< Legacy access² 
          2: (Red, Green, Blue, Alpha: Single);      //< As Color components in RGBA order
          3: (AsVector3f : TBZVector3f);               //< As TBZVector3f
          4: (ST, UV : TBZVector2f);                     //< As Texture Coordinates
          5: (Left, Top, Right, Bottom: Single);      //< As Legacy Rect
          6: (TopLeft,BottomRight : TBZVector2f); //< As Bounding Rect
     
      end;
     
    Implementation
     
    class operator TBZVector4f.+(constref A, B: TBZVector4f): TBZVector4f; assembler; nostackframe; register; {$ifdef USE_VECTORCALL} vectorcall; {$endif}
    asm
      {$ifdef USE_VECTORCALL} 
         Addps xmm0, xmm1
      {$else}
      movaps xmm0, XMMWORD PTR [A]
      addps  xmm0, XMMWORD PTR [B]
      {$endif}
      movaps [RESULT], xmm0 // Ici il faut que je vérifie mais il me semble que du coup ce n'est plus obligatoire aussi avec VECTORCALL. Le registre XMM0 est automatiquement retourné
    end;


    Comme je le notifie plus haut, pour l'alignement des données (en 64 bits uniquement. En 32 bits les données sont par défaut non-alignées quoi qu'il arrive) pour utiliser les instructions SIMD, avec FPC il est recommandé de rajouter les directives suivantes en début d'unité :

    Code delphi : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
     
    // Même pour un code compiler en 32bits ça ne mange pas de pain de rajouter ces quelques directives
    {$ALIGN 16}
    {$CODEALIGN CONSTMIN=16}
    {$CODEALIGN LOCALMIN=16}
    {$CODEALIGN VARMIN=16}

    puis en fonction de ou on se trouve dans le code il faut faire ainsi (surtout si on se trouve dans une autre unité que celle qui contient nos méthodes):


    Code delphi : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    Const
      {$IFDEF CPU64}
        {$CODEALIGN CONSTMIN=16}
         cOneMinusVector4f    : TBZVector4f = (x:-1;y:-1;z:-1;w:-1);   
        {$CODEALIGN CONSTMIN=4}
      {$ELSE}
        cOneMinusVector4f    : TBZVector4f = (x:-1;y:-1;z:-1;w:-1);   
      {$ENDIF}

    Code delphi : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    Var
      {$IFDEF CPU64}
        {$CODEALIGN VARMIN=16}
         V1 : TBZVector4f;
        {$CODEALIGN VARMIN=4}
      {$ELSE}
         V1 : TBZVector4f;
      {$ENDIF}

    Code delphi : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    Type
       AClass = Class
      protected
        {$IFDEF CPU64}
          {$CODEALIGN RECORDMIN=16}
          FVector : TBZVector4f;
          {$CODEALIGN RECORDMIN=4}
        {$ELSE}
          FVector : TBZVector4f;
      {$ENDIF}
      end;


    Voilà, sinon pour infos, j'ai effectué quelques changements dans ma bibliothèques mais non présents dans le dépôt que tu cite. Je me répète encore mais, dès que j'aurais un peu plus de temps pour harmoniser mon autre projet tout ce "beanz" sera en ligne

    Merci

    A bientôt

    Jérôme

  6. #6
    Expert confirmé

    Homme Profil pro
    Directeur de projet
    Inscrit en
    Mai 2013
    Messages
    1 465
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Yvelines (Île de France)

    Informations professionnelles :
    Activité : Directeur de projet
    Secteur : Service public

    Informations forums :
    Inscription : Mai 2013
    Messages : 1 465
    Points : 4 645
    Points
    4 645
    Par défaut
    Bonjour Jérôme,

    Citation Envoyé par BeanzMaster Voir le message
    Avec la version 3.1.x et sup de FPC on a accès à un nouveau mot-clef (sous Windows uniquement pour respecter la convention d'appel de celui-ci) VectorCall. Ce qui permet de placer directement les paramètres d'une méthode dans les registres SIMD, ce qui évite donc l'appel a des movXXX pour initialiser les registres.
    C'est très intéressant. Et si ça a en plus le bon goût de fonctionner avec des entiers (mais je ne vois pas pourquoi cela ne passerait pas car je présume que ce type d'appel se moque du contenu)...

    Merci.

    A bientôt
    Philippe

Discussions similaires

  1. DataSet - Erreur de filtre sur des entiers
    Par Nnahaa dans le forum VB.NET
    Réponses: 7
    Dernier message: 21/06/2011, 12h28
  2. opération "et" de boole sur des entiers
    Par Crapuleux_Crapaud dans le forum Général Python
    Réponses: 2
    Dernier message: 17/06/2010, 23h06
  3. [DB2] LIKE sur des entiers
    Par heloise dans le forum DB2
    Réponses: 1
    Dernier message: 07/10/2004, 23h30

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo