1. #1
    Nouveau Candidat au Club
    Homme Profil pro
    Étudiant
    Inscrit en
    juillet 2017
    Messages
    2
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Bas Rhin (Alsace)

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : juillet 2017
    Messages : 2
    Points : 1
    Points
    1

    Par défaut Utilisation proc mixed pour modèle mixte à mesures répétées

    Bonjour à tous,

    Pour les besoins d'un essai clinique, j'ai à mettre en place un modele mixte à mesures répétées à l'aide de SAS.

    J'ai donc choisi d'utiliser la proc mixed mais je coince quant à l'utilisation des statements RANDOM et REPEATED. J'ai lu que cela dépendait fortement des données et de l'analyse souhaitée mais j'aimerais savoir s'il y avait des cas généraux dans lesquels l'on pourrait ranger l'utilisation de ces deux statements ?

    J'ai récemment lu que le statement RANDOM s'utiliserait surtout en présence de données balancées et le statement REPEATED pour des données non balancées. Est-ce réellement le cas ? Quand faut-il alors utiliser les deux statements ensemble ?

    En espérant que vous pourrez m'éclairer sur ces questions, je vous souhaite une bonne journée.

  2. #2
    Membre expert
    Avatar de olivier.decourt
    Homme Profil pro
    Formateur R/SAS/statistiques
    Inscrit en
    avril 2008
    Messages
    1 788
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 40
    Localisation : France

    Informations professionnelles :
    Activité : Formateur R/SAS/statistiques
    Secteur : Conseil

    Informations forums :
    Inscription : avril 2008
    Messages : 1 788
    Points : 3 954
    Points
    3 954

    Par défaut

    Bonjour.
    Pour moi les règles sont les suivantes (c'est ouvert à discussion)...

    RANDOM variable ; est pour le cas où les données sont corrélées mais pas des répétitions d'un même individu : ça sert à définir un effet aléatoire, comme un centre ou un médecin. On suppose une corrélation identique entre toutes les lignes qui partagent la même valeur.

    Ensuite sur les données répétées, et particulièrement répétées dans le temps...
    * Soit le temps est traité comme une variable continue (ce qui suppose qu'on ait assez de temps différents, pour moi au moins 4 ou 5 ; et que la relation entre Y et le temps soit linéaire) et on fera un modèle à pentes aléatoires, qu'on décrit dans SAS avec RANDOM intercept temps / SUBJECT=sujet TYPE=UN ;
    * Soit le temps est qualitatif (parce qu'on n'arrive pas à satisfaire les hypothèses du cas précédent, ou parce qu'on préfère) et on fera un modèle à structure de covariance, avec REPEATED temps / SUBJECT=sujet TYPE=x ; Le type est la forme qu'on suppose à la matrice des corrélations d'un sujet. Il y a beaucoup de formes possibles (CS, AR(1), TOEP, UN, etc.) et certaines ne sont pas forcément applicables à tes données : par exemple si les mesures ne sont pas espacées régulièrement, TOEP ou AR(1) n'ont pas de sens. Ce que je fais d'habitude c'est que je commence par me faire une liste des structures qui sont justifiables (cliniquement) et je les teste toutes : je garde celle qui a un AIC minimum.

    A noter que fourbement, certaines des écritures sont équivalentes :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    RANDOM intercept / SUBJECT=sujet ;
    RANDOM sujet ;
    REPEATED temps / SUBJECT=sujet TYPE=CS ;
    construisent toutes trois le même modèle, ce qui n'est pas évident de prime abord.

    Ce qui précède n'est que mon avis, et ne fait pas forcément l'objet d'un consensus. A valider auprès d'autres statisticiens.
    Par contre cette histoire de syntaxe selon l'équilibrage du plan ne me dit rien du tout ; tous les modèles mixtes d'une manière générale s'accommodent de données non balancées, y compris le fait que tous les sujets ne présentent pas toutes les visites.
    Bon courage.
    Olivier

  3. #3
    Nouveau Candidat au Club
    Homme Profil pro
    Étudiant
    Inscrit en
    juillet 2017
    Messages
    2
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Bas Rhin (Alsace)

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : juillet 2017
    Messages : 2
    Points : 1
    Points
    1

    Par défaut

    Bonjour Olivier,

    Tout d'abord, merci pour vos explications.

    Si je comprend bien, en présence d'un effet aléatoire et du temps considéré comme qualitatif, on aurait alors les deux statements ?

    Dans le cas du temps considéré continu, je ne comprend pas ce qui justifie la non-utilisation du REPEATED, car cela voudrait dire que la structure de covariance associée aux erreurs est la structure par défaut (donc type=vc) et donc que les observations réalisées sur tout individu aux différents instants sont indépendantes. Est-ce réaliste de supposer ça ?

    Je vais essayer de retrouver le document qui parlait du rapport avec l'équilibrage du plan et vous enverrais le lien.

  4. #4
    Membre expert
    Avatar de olivier.decourt
    Homme Profil pro
    Formateur R/SAS/statistiques
    Inscrit en
    avril 2008
    Messages
    1 788
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 40
    Localisation : France

    Informations professionnelles :
    Activité : Formateur R/SAS/statistiques
    Secteur : Conseil

    Informations forums :
    Inscription : avril 2008
    Messages : 1 788
    Points : 3 954
    Points
    3 954

    Par défaut

    Citation Envoyé par Reziak Voir le message
    Si je comprend bien, en présence d'un effet aléatoire et du temps considéré comme qualitatif, on aurait alors les deux statements ?
    Oui, il y aura un RANDOM pour l'effet aléatoire, sans options ; et un RANDOM temps / SUBJECT=... pour la partie "résidus corrélés par blocs".

    Citation Envoyé par Reziak Voir le message
    Dans le cas du temps considéré continu, je ne comprend pas ce qui justifie la non-utilisation du REPEATED, car cela voudrait dire que la structure de covariance associée aux erreurs est la structure par défaut (donc type=vc) et donc que les observations réalisées sur tout individu aux différents instants sont indépendantes. Est-ce réaliste de supposer ça ?
    En fait ce n'est pas ce que décrit le modèle. Un modèle à pentes aléatoires combine deux choses, comme le montre la syntaxe RANDOM intercept temps / SUBJECT=sujet
    1) D'une part, qu'il y a une variation individuelle de l'ordonnée à l'origine dans les droites qui décrivent la relation entre Y et le temps. Comme RANDOM intercept / SUBJECT=sujet est l'équivalent de RANDOM sujet qui est l'équivalent de REPEATED ... / SUBJECT=sujet TYPE=CS, ça revient à mettre une corrélation sur tous les résidus qui partagent le même sujet. Donc on ne suppose pas l'indépendance, loin de là.
    2) En plus de ça, on se dit que la pente de la relation au temps peut varier d'un individu à l'autre. Tous n'ont pas une évolution de Y au même rythme.
    La combinaison des parties 1 et 2 permet d'avoir autant de trajectoires différentes que de sujets, dans la limite du fait que ce sont des effets aléatoires : les écarts d'ordonnée à l'origine par rapport à la constante du modèle sont tirés dans une loi normale centrée. Idem pour les écarts de chaque sujet entre sa pente individuelle au temps, et la pente estimée par l'effet fixe temps dans le modèle : ces écarts de pente sont tirés dans une autre loi normale centrée.
    Le TYPE=UN des modèles à pentes aléatoires vient du fait qu'estimer une pente et une ordonnée à l'origine ne se fait pas avec deux estimateurs indépendants, mais corrélés négativement. Donc nos deux effets aléatoires sont tirés dans un couple de lois normales corrélées. Donc on doit toujours mettre TYPE=UN pour un modèle à pentes aléatoires.
    Mais il n'a rien à voir avec le TYPE=UN de REPEATED ! (On va finir par penser que SAS cherche à nous embrouiller avec toutes ces syntaxes qui se ressemblent...)

    Citation Envoyé par Reziak Voir le message
    Je vais essayer de retrouver le document qui parlait du rapport avec l'équilibrage du plan et vous enverrais le lien.
    Merci d'avance.
    Bon courage.
    Olivier

Discussions similaires

  1. Mesures répétées: proc mixed ou proc panel?
    Par dandan67 dans le forum SAS STAT
    Réponses: 0
    Dernier message: 10/05/2014, 16h21
  2. Proc mixed mesures répétées plutôt que moyennes
    Par julieh47 dans le forum SAS STAT
    Réponses: 3
    Dernier message: 13/08/2010, 15h25
  3. Modèle Mixte avec Mesures répétées
    Par elvolcano dans le forum R
    Réponses: 0
    Dernier message: 18/01/2010, 17h39
  4. Modèle mixte avec mesures répétées sur 2 variables
    Par medsas dans le forum SAS STAT
    Réponses: 1
    Dernier message: 15/06/2009, 15h57
  5. Utiliser un TQuery pour Proc.Stockée D2006
    Par sbeu dans le forum Bases de données
    Réponses: 3
    Dernier message: 16/01/2007, 15h01

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo