Précédent   Forum des professionnels en informatique > Logiciels > Solutions d'entreprise > Business Intelligence > SAS > SAS STAT
SAS STAT Forum d'entraide sur les fonctionnalités liées à la statistique sur SAS : statistique descriptive, test, régression, classification
Partagez cette discussion sur d'autres réseaux sociaux : Viadeo Twitter Google Facebook Digg Delicious MySpace Yahoo
Réponse Proposer ce sujet en actualité
 
Outils de la discussion
Publicité
'
Vieux 14/10/2011, 10h14   #1
Invité de passage
 
Femme
Inscription : octobre 2011
Messages : 35
Détails du profil
Informations personnelles :
Sexe : Femme
Localisation : France

Informations professionnelles :
Secteur : Santé

Informations forums :
Inscription : octobre 2011
Messages : 35
Points : 1
Points : 1
Par défaut Comparaison de moyennes sur mesures répétées

Bonjour
j'aimerai comparai la consommation moyenne de médicament d'un groupe de patients en fonction du temps. Mon fichier est organisé comme cela :
ID med1t0 med2t0.. med1T1 med2T1.. medt2 medt2 MoyT0 MoyT

Biensûr tous les patients n'ont pas le même nombre de médicaments.

Comment faire mon anova, comment organiser mes données?
j'ai cru comprendre qu'il fallait faire une proc GLM car en fonction des temps, je n'ai pas le meme nombre de patients dans mes groupes mais du coup je ne comprends pas ce que doit être mon Y et mes X dans model?

Merci par avance
craow87000 est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 14/10/2011, 10h59   #2
Membre Expert
 
Homme
Biostatisticien
Inscription : juin 2009
Messages : 1 145
Détails du profil
Informations personnelles :
Sexe : Homme
Localisation : Irlande

Informations professionnelles :
Activité : Biostatisticien
Secteur : Industrie Pharmaceutique

Informations forums :
Inscription : juin 2009
Messages : 1 145
Points : 1 763
Points : 1 763
Bonjour,

Peux tu nous reexpliquer plus en details et plus explicitement ce que tu cherches a modeliser? Quelles sont tes variables? Je ne comprends pas ce que tu veux faire...

proc GLM offre effectivement la possibilite de modeliser des donnes repetees. Le grand avantage de proc mixed par rapport a cette procedure est qu'elle va considerer toute l'information disponible et non uniquement les patients qui n'ont pas de donnees manquantes dans le temps. Rendez vous sur l'aide en ligne de sas

http://support.sas.com/documentation...#mixed_toc.htm

une doc assez explicative:

http://www.cba.ua.edu/~mhardin/ST610...NGITUDINAL.pdf

Manoutz
Manoutz est déconnecté   Envoyer un message privé Réponse avec citation 20
Vieux 14/10/2011, 11h42   #3
Invité de passage
 
Femme
Inscription : octobre 2011
Messages : 35
Détails du profil
Informations personnelles :
Sexe : Femme
Localisation : France

Informations professionnelles :
Secteur : Santé

Informations forums :
Inscription : octobre 2011
Messages : 35
Points : 1
Points : 1
Bonjour,

je ne veux rien "modéliser" juste voir si il y une différence statistique entre mes moyennes de consommations médicamenteuses. J'ai une base de 129 patients (1 ligne par patient) où j'ai les noms des médics consommés pour chaque période définie. j'ai calculé pour chaque période la consommation moyenne de médicaments de ma population et j'aimerai savoir si il y a une différence
à T0 la conso moyenne était de 8 médics, à T1 de 7,2 medics à T2 de 10 médics....;

voilà
craow87000 est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 14/10/2011, 20h33   #4
Membre Expert
 
Avatar de MEGAMIND2
 
Homme Brice Beare
Paris
Inscription : janvier 2011
Messages : 957
Détails du profil
Informations personnelles :
Nom : Homme Brice Beare
Localisation : France, Paris (Île de France)

Informations professionnelles :
Activité : Paris

Informations forums :
Inscription : janvier 2011
Messages : 957
Points : 1 368
Points : 1 368
Bonjour,
La proc NPAR1WAY ou TTEST en fonction de la distribution de tes variables.
En fonction du temps, je pense pas
MEGAMIND2 est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 15/10/2011, 20h11   #5
Invité de passage
 
Femme
Inscription : octobre 2011
Messages : 35
Détails du profil
Informations personnelles :
Sexe : Femme
Localisation : France

Informations professionnelles :
Secteur : Santé

Informations forums :
Inscription : octobre 2011
Messages : 35
Points : 1
Points : 1
la Ttest (appariée) ne prend en compte que 2 moyennes à comparer en même temps.
la npar1oneway : ma distribution est normale
craow87000 est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 16/10/2011, 08h31   #6
Expert Confirmé
 
Avatar de olivier.decourt
 
Homme Olivier Decourt
Formateur en informatique
Inscription : avril 2008
Messages : 1 467
Détails du profil
Informations personnelles :
Nom : Homme Olivier Decourt
Âge : 34
Localisation : France

Informations professionnelles :
Activité : Formateur en informatique
Secteur : Conseil

Informations forums :
Inscription : avril 2008
Messages : 1 467
Points : 2 828
Points : 2 828
Bonjour.
Je rejoins Manoutz dans sa proposition. Il n'y a rien d'effrayant dans un "modèle" : ça ne veut pas dire forcément "prédire". Ce sera un modèle simplissime, juste une extension des procédures de test classiques proposées par Brice.
Trois remarques cependant :
1) tes données sont normales, dis-tu. Les moyennes, oui. Mais les comptages par patient ? Plutôt des lois de Poisson, sauf s'ils ont une consommation extrêmement élevée de médicaments (Poisson avec moyenne élevée ~ normale).
2) la question que du souhaites poser serait : moyenne(nb de médicaments) =? temps et s'il n'y a pas d'effet temps, tu auras prouvé que la consommation médicamenteuse n'évolue pas au fil de l'étude. Sinon, tu devras faire des comparaisons de temps à temps (2 à 2) et là il te faudra faire un grand nombre de tests simultanés : dans les procédures de modélisation, l'instruction LSMEANS avec DIFF et ADJUST permet de faire ça proprement.
3) mais finalement dans ce "modèle" du point 2, tu n'as pas des observations indépendantes, car les moyennes sont construites sur des répétitions de patients. Il faudrait donc essayer différentes structures de corrélation entre répétitions d'un modèle patient (option TYPE dans REPEATED) et déterminer celle qui est la plus appropriée.

Sur une base avec 3 variables (ID, TEMPS, NB_MEDICAMENTS) et une ligne par combinaison patient x temps, je te proposerais le modèle suivant, avec une proc GENMOD pour bien prendre en compte la distribution de Poisson.
Code :
1
2
3
4
5
6
PROC GENMOD DATA=... ;
  CLASS temps id ;
  MODEL nb_medicaments = temps / DIST=POISSON LINK=LOG ;
  LSMEANS temps / DIFF=ALL ADJUST=TUKEY ;
  REPEATED SUBJECT=id / TYPE=UN CORRW ;
RUN ;
Dans ce code j'ai demandé une matrice de corrélation libre (TYPE=UN) et son affichage pour le patient 1 (option CORRW). Ca te donnera des pistes pour essayer ensuite une structure plus simple (AR, CS, MDEP).
J'ai utilisé une proc GENMOD parce qu'elle est disponible dans toutes les versions de SAS sur le marché actuellement. Mais il serait plus flexible de prendre une proc GLIMMIX : elle est en production dans SAS 9.2 et t'offrira des critères type Akaike et Schwarz pour choisir ta structure de corrélation, et un choix plus vaste de structures.

Bon courage en tout cas.
Olivier
olivier.decourt est déconnecté   Envoyer un message privé Réponse avec citation 10
Vieux 17/10/2011, 11h35   #7
Invité de passage
 
Femme
Inscription : octobre 2011
Messages : 35
Détails du profil
Informations personnelles :
Sexe : Femme
Localisation : France

Informations professionnelles :
Secteur : Santé

Informations forums :
Inscription : octobre 2011
Messages : 35
Points : 1
Points : 1
bonjour,

merci pour ces informations.

j'ai essayé la commande proposée mais il y a un petit problème.

Code :
1
2
3
4
5
6
7
8
9
10
11
21   PROC GENMOD DATA=medinap.e ;
22     CLASS temps nir ;
23     MODEL n = temps / DIST=POISSON LINK=LOG ;
24     LSMEANS temps / DIFF=ALL ADJUST=TUKEY ;
                           -
                           22
                           76
ERROR 22-322: Syntax error, expecting one of the following: ;, ALPHA, CL, CORR, COV, DIFF, E.
ERROR 76-322: Syntax error, statement will be ignored.
25     REPEATED SUBJECT=nir/ TYPE=UN CORRW ;
26   RUN ;
craow87000 est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 17/10/2011, 13h11   #8
Expert Confirmé
 
Avatar de olivier.decourt
 
Homme Olivier Decourt
Formateur en informatique
Inscription : avril 2008
Messages : 1 467
Détails du profil
Informations personnelles :
Nom : Homme Olivier Decourt
Âge : 34
Localisation : France

Informations professionnelles :
Activité : Formateur en informatique
Secteur : Conseil

Informations forums :
Inscription : avril 2008
Messages : 1 467
Points : 2 828
Points : 2 828
Effectivement, j'ai confondu avec une autre procédure (MIXED ? GLIMMIX ? les deux ?). Bref, c'est juste DIFF. Pas de =ALL à l'horizon.
olivier.decourt est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 17/10/2011, 15h13   #9
Invité de passage
 
Femme
Inscription : octobre 2011
Messages : 35
Détails du profil
Informations personnelles :
Sexe : Femme
Localisation : France

Informations professionnelles :
Secteur : Santé

Informations forums :
Inscription : octobre 2011
Messages : 35
Points : 1
Points : 1
si j'enleve aussi turkey ca fonctionne. Mais du coup comme proc GLM et Anova, il ne prend pas en compte les observations avec des données manquantes
craow87000 est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 18/10/2011, 10h13   #10
Membre Expert
 
Homme
Biostatisticien
Inscription : juin 2009
Messages : 1 145
Détails du profil
Informations personnelles :
Sexe : Homme
Localisation : Irlande

Informations professionnelles :
Activité : Biostatisticien
Secteur : Industrie Pharmaceutique

Informations forums :
Inscription : juin 2009
Messages : 1 145
Points : 1 763
Points : 1 763
je rejoins les remarques tres justes d'Olivier. La proc GENMOD semble faire pas mal l'affaire au regard des nouveaux elements.

Qq remarques:
1/ http://support.sas.com/kb/23/230.html. Dans proc mixed, le type AR(1) ne fonctionne que pour des intervalles de temps equidistants. je ne sais ce qu'il en est pour proc GENMOD. Dans le doute...

2/ apparement on ne peut pas choisir le type d'ajustement dans le LSMEANS de la GENMOD. C'est surement du 2 a 2 (chaque temps sera compare a chaque autre temps). A voir si ca convient, sinon il faudra surement s'orienter vers un ESTIMATE ou un CONTRAST statement.

manoutz
Manoutz est déconnecté   Envoyer un message privé Réponse avec citation 00
Réponse Proposer ce sujet en actualité
Outils de la discussion



Fuseau horaire GMT +2. Il est actuellement 07h15.


 
 
 
 
Partenaires

Hébergement Web