IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

R Discussion :

Anova sous R


Sujet :

R

  1. #1
    Membre confirmé
    Homme Profil pro
    Inscrit en
    Avril 2011
    Messages
    64
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Drôme (Rhône Alpes)

    Informations forums :
    Inscription : Avril 2011
    Messages : 64
    Par défaut Anova sous R
    Bonjour,

    Actuellement stagiaire, je sèche un peu sur le logiciel R où je dois réaliser une anova a 2 facteurs : type d'intervention et chirurgiens

    Pour chaque chirurgien et intervention j'ai une moyenne sur la duree d'opération et la durée de l'opération réelle. Mais pour un même chirurgiens et une même opération, cette moyenne peut changer d'un jour à l'autre (si ce n'est tout le temps). On me demande de tester si ces moyennes sont correctement calculés, autrement dit, de tester si elles sont juste.

    Je suppose qu'il s'agit d'une ANOVA à 2 facteurs (avec interactions je pense), mais n'en n'ayant jamais réalisé sous un logiciel (avec autant de données), je dois bien avoué que je sèche complètement.

    Je ne sais pas si j'ai été bien clair dans l'explication de ma problématique, donc si vous avez des questions pour clarifier tout ça, aucun problème :-)

    J'espere que quelqu'un ici pourra me venir en aide.

    Bonne journée et Merci d'avance.

  2. #2
    Modératrice

    Femme Profil pro
    Statisticienne, Fondatrice de la société DACTA
    Inscrit en
    Juin 2010
    Messages
    893
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 37
    Localisation : France, Loire Atlantique (Pays de la Loire)

    Informations professionnelles :
    Activité : Statisticienne, Fondatrice de la société DACTA

    Informations forums :
    Inscription : Juin 2010
    Messages : 893
    Par défaut
    Bonjour,


    Quelques pistes où jeter un oeil :

    http://zoonek2.free.fr/UNIX/48_R_2004/17.html#2

    http://pbil.univ-lyon1.fr/R/enseignement.html


    Bonne continuation


    Cordialement,

    A.D.

    Forum R
    Fournir le code utilisé (pensez aux balises code !), les packages nécessaires, ainsi qu'un court mais représentatif extrait du jeu de données et les éventuels messages d'erreur.
    Recherche d'informations concernant R : RSiteSearch / tutoriels : http://r.developpez.com/cours/ .

    Pensez également au bouton "Résolu" et à voter (en bas à droite des messages) lorsque vous avez obtenu une réponse satisfaisante.

  3. #3
    Inactif  


    Homme Profil pro
    Inscrit en
    Novembre 2008
    Messages
    5 288
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 49
    Localisation : France, Rhône (Rhône Alpes)

    Informations professionnelles :
    Secteur : Santé

    Informations forums :
    Inscription : Novembre 2008
    Messages : 5 288
    Par défaut
    Tu peux regarder sur wikipédia > anova. Tu as les explications et le code R pour 2 variables sans interaction. Pour l'interaction, il suffit de modifier le modèle utilisé

  4. #4
    Membre confirmé
    Homme Profil pro
    Inscrit en
    Avril 2011
    Messages
    64
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Drôme (Rhône Alpes)

    Informations forums :
    Inscription : Avril 2011
    Messages : 64
    Par défaut
    Merci pour vos réponses, je vais y jeter un oeil

  5. #5
    Membre confirmé
    Homme Profil pro
    Inscrit en
    Avril 2011
    Messages
    64
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Drôme (Rhône Alpes)

    Informations forums :
    Inscription : Avril 2011
    Messages : 64
    Par défaut
    Allez, les problèmes commencent... Vive les novives :S

    Alors je pense qu'avant de pouvoir mettre mes colonnes d'excel (mes variables), il faut que j'importe d'abord mes données.

    Voilà la commande que je tape :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    data<-read.table("C:\Documents and Settings\.../ANOVA1.xls",sep=";",header=TRUE)
    R m'affiche :
    Erreur : '\D' est un code escape non reconnu dans une chaîne de caractères débutant "C:\D"
    Pourquoi :'( ?

    Lorsque j'aurais réussi à importer mes données, grâce à header=TRUE, si je tape le libellé de ma variable sur R, j'obtiendrai les valeurs de ma variable ?

    Cordialement

    C.V

  6. #6
    Membre Expert
    Avatar de pitipoisson
    Homme Profil pro
    Chercheur
    Inscrit en
    Septembre 2006
    Messages
    1 942
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 46
    Localisation : France, Finistère (Bretagne)

    Informations professionnelles :
    Activité : Chercheur
    Secteur : Agroalimentaire - Agriculture

    Informations forums :
    Inscription : Septembre 2006
    Messages : 1 942
    Par défaut
    Citation Envoyé par lyonnaisdu26 Voir le message
    Pourquoi :'( ?
    Parce que "\" a une signification particulière : c'est un caractère d'échappement. Il permet par exemple de faire des tabulations "\t"... mais "\D" n'a pas de signification.

    Un "\" littéral est obtenu par "\\" :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    data<-read.table("C:\\Documents and Settings\\.../ANOVA1.xls",sep=";",header=TRUE)
    Ou pour ne pas t'embêter avec tout ça :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    data<-read.table("C:/Documents and Settings/.../ANOVA1.xls",sep=";",header=TRUE)
    fonctionne également très bien.

  7. #7
    Modératrice

    Femme Profil pro
    Statisticienne, Fondatrice de la société DACTA
    Inscrit en
    Juin 2010
    Messages
    893
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 37
    Localisation : France, Loire Atlantique (Pays de la Loire)

    Informations professionnelles :
    Activité : Statisticienne, Fondatrice de la société DACTA

    Informations forums :
    Inscription : Juin 2010
    Messages : 893
    Par défaut
    Citation Envoyé par lyonnaisdu26 Voir le message
    Lorsque j'aurais réussi à importer mes données, grâce à header=TRUE, si je tape le libellé de ma variable sur R, j'obtiendrai les valeurs de ma variable ?
    Pas exactement.
    Si "tab" est la variable dans laquelle est stocké le jeu de données (via
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    > tab<-read.table("C:/Documents and Settings/.../ANOVA1.xls",sep=";",header=TRUE)
    ), alors pour accéder par exemple à la variable "var1", il faudra faire :



    Cordialement,

    A.D.


    PS: Pour ne pas être bloqué avec des "petits" soucis de ce genre, mon conseil est de commencer par parcourir les nombreuses docs d'aide et tuto existantes pour débuter avec R. Bonne continuation

    Forum R
    Fournir le code utilisé (pensez aux balises code !), les packages nécessaires, ainsi qu'un court mais représentatif extrait du jeu de données et les éventuels messages d'erreur.
    Recherche d'informations concernant R : RSiteSearch / tutoriels : http://r.developpez.com/cours/ .

    Pensez également au bouton "Résolu" et à voter (en bas à droite des messages) lorsque vous avez obtenu une réponse satisfaisante.

  8. #8
    Membre confirmé
    Homme Profil pro
    Inscrit en
    Avril 2011
    Messages
    64
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Drôme (Rhône Alpes)

    Informations forums :
    Inscription : Avril 2011
    Messages : 64
    Par défaut
    Bonjour, merci beaucoup pour votre aide .

    J'ai enfin réussi à importer mes données

    Donc voilà mon code

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    donnees<-read.delim2("C:\\Documents and Settings\\cvialle\\Bureau\\Stats_Cyril/ANOVA1.txt",dec=",",sep="\t",header=TRUE)
    J'ai fait enregistré sous, txt avec tabulation ca marche niquel.

    Alors maintenant je vais passer au chose sérieuse et beaucoup moins drôle ^^. La fameuse et célèbre ANOVA ^^

    Il est fort possible que je reposte un message dans les 30 min qui suivent donc restez ne partez pas je vous prie :-p

    Cordialement

    C.V

  9. #9
    Membre confirmé
    Homme Profil pro
    Inscrit en
    Avril 2011
    Messages
    64
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Drôme (Rhône Alpes)

    Informations forums :
    Inscription : Avril 2011
    Messages : 64
    Par défaut
    ReBonjour à tous

    Comme promis, un nouveau petit message ^^

    Donc je me suis lancé dans l'ANOVA à 2 facteurs.

    Voilà mon code :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
     
    donnees<-read.delim2("C:\\Documents and Settings\\..../ANOVA1.txt",dec=",",sep="\t",header=TRUE)
    facchir<-as.factor(donnees$chir)
    facint<-as.factor(donnees$int)
    r<-aov(donnees$duree_moyenne~facchir*facint)
    anova(r)
    Lors de l'avant dernière étape (r<-aov(.....)) R plante. Je le laisse ramer pendant 5 min mais rien à faire.
    Je n'ai qu'environ 600 enregistrements, donc je ne pense pas que le problème vienne du nombre de données (3*500=1500 données)

    Ai-je un problème de machine (ce qui m'étonnerais)? De code (ce qui m'étonnerais beaucoup moi^^) ?

    J'ai egalement testé
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    > anova(lm(donnees$duree_moyenne~facchir*facint))
    J'y comprend vraiment pas grand chose...


    Cordialement

    C V

  10. #10
    Membre Expert
    Avatar de pitipoisson
    Homme Profil pro
    Chercheur
    Inscrit en
    Septembre 2006
    Messages
    1 942
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 46
    Localisation : France, Finistère (Bretagne)

    Informations professionnelles :
    Activité : Chercheur
    Secteur : Agroalimentaire - Agriculture

    Informations forums :
    Inscription : Septembre 2006
    Messages : 1 942
    Par défaut
    Que te donne
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    class(donnees$duree_moyenne)
    ?

  11. #11
    Membre confirmé
    Homme Profil pro
    Inscrit en
    Avril 2011
    Messages
    64
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Drôme (Rhône Alpes)

    Informations forums :
    Inscription : Avril 2011
    Messages : 64
    Par défaut
    Citation Envoyé par pitipoisson Voir le message
    Que te donne
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    class(donnees$duree_moyenne)
    ?
    R me donne "numeric"

    Ce qui est logique puisque j'ai des durées. Enfin lorsque j'ai importé ma table sur excel, il m'a transformé mon format HH:MM en *.********** avec beaucoup de chiffres après la virgule et le chiffre avant la virgule est généralement 0 ou 1 j'ai donc des nombres très petits.
    Mon problème vient-il de là ?

  12. #12
    Membre Expert
    Avatar de pitipoisson
    Homme Profil pro
    Chercheur
    Inscrit en
    Septembre 2006
    Messages
    1 942
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 46
    Localisation : France, Finistère (Bretagne)

    Informations professionnelles :
    Activité : Chercheur
    Secteur : Agroalimentaire - Agriculture

    Informations forums :
    Inscription : Septembre 2006
    Messages : 1 942
    Par défaut
    Ça c'est bon, donc...
    Et que représente la variable "int" ?

    Edit: j'avais pas vu ta dernière "édition" du message ! Ça change peut-être quelque chose.

  13. #13
    Membre confirmé
    Homme Profil pro
    Inscrit en
    Avril 2011
    Messages
    64
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Drôme (Rhône Alpes)

    Informations forums :
    Inscription : Avril 2011
    Messages : 64
    Par défaut
    Citation Envoyé par pitipoisson Voir le message
    Ça c'est bon, donc...
    Et que représente la variable "int" ?
    int correspond aux noms de l'interventions, j'ai environ 250 modalités pour cette variables.

    et je devance ta dernière questions, chir c'est le nom des mes chirurgiens, un peu plus de 150 modalités

  14. #14
    Membre Expert
    Avatar de pitipoisson
    Homme Profil pro
    Chercheur
    Inscrit en
    Septembre 2006
    Messages
    1 942
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 46
    Localisation : France, Finistère (Bretagne)

    Informations professionnelles :
    Activité : Chercheur
    Secteur : Agroalimentaire - Agriculture

    Informations forums :
    Inscription : Septembre 2006
    Messages : 1 942
    Par défaut
    Citation Envoyé par lyonnaisdu26 Voir le message
    int correspond aux noms de l'interventions, j'ai environ 250 modalités pour cette variables.

    et je devance ta dernière questions, chir c'est le nom des mes chirurgiens, un peu plus de 150 modalités
    Citation Envoyé par lyonnaisdu26 Voir le message
    ...Je n'ai qu'environ 600 enregistrements, donc je ne pense pas que le problème vienne du nombre de données (3*500=1500 données)
    ... Et donc tu as environ 37500 combinaisons (i.e. autant de paramètres à estimer pour les interactions, sans compter les autres) avec seulement 600 enregistrements
    1. autant te dire que l'ANOVA ne me semble pas du tout adaptée ici (mais qu'est-ce qui pourrait l'être ?).
    2. Il n'est pas étonnant que R rame (et te donne l'impression d'avoir planté) si tu lui donnes autant de facteurs et d'interactions à traiter. (c'est un avis simplement basé sur mon intuition.)

  15. #15
    Membre confirmé
    Homme Profil pro
    Inscrit en
    Avril 2011
    Messages
    64
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Drôme (Rhône Alpes)

    Informations forums :
    Inscription : Avril 2011
    Messages : 64
    Par défaut
    Citation Envoyé par pitipoisson Voir le message
    ... Et donc tu as environ 37500 combinaisons (i.e. autant de paramètres à estimer pour les interactions, sans compter les autres) avec seulement 600 enregistrements
    1. autant te dire que l'ANOVA ne me semble pas du tout adaptée ici (mais qu'est-ce qui pourrait l'être ?).
    2. Il n'est pas étonnant que R rame (et te donne l'impression d'avoir planté) si tu lui donnes autant de facteurs et d'interactions à traiter. (c'est un avis simplement basé sur mon intuition.)
    Ah d'accord, j'avais vraiment pas pensé à ça et c'est vrai que vu sous cet angle cela explique tout.

    Y'a t-il une solution pour tester si mes moyennes sont justes autre que l'ANOVA ?

    J'avais pensé à regrouper mes données mais je me vois mal regrouper une Anuscopie avec une Cellulite gangréneuse lol.
    Enfin je vais voir avec mon maître de stage si je peux regrouper certaines interventions.

    Admettons que je regroupe donc 2 interventions, je fais la moyenne des 2 interventions? J'ai peur quand même que ca fausse mon jeu de données.

  16. #16
    Membre confirmé
    Homme Profil pro
    Inscrit en
    Avril 2011
    Messages
    64
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Drôme (Rhône Alpes)

    Informations forums :
    Inscription : Avril 2011
    Messages : 64
    Par défaut
    Après avoir laisser patoger R pendant un moment, j'obtiens la sortie suivante. A t-elle du sens au vue du nombre d'interaction ...
    On voit que pour les facteurs seuls, la p-value est très largement inférieur à 0.05, il n'explique donc pas la duree_moyenne. Par contre, les 2 facteurs en interaction semble expliquer la duree_moyenne.

    Que dois-je en conclure, que mes moyennes sont justes ?

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
     
    Analysis of Variance Table
     
    Response: donnees$duree_moyenne
                    Df  Sum Sq    Mean Sq F value Pr(>F)    
    facchir         56 0.16948 0.00302639  19.115 <2e-16 ***
    facint         265 0.59843 0.00225821  14.264 <2e-16 ***
    facchir:facint 141 0.02270 0.00016101   1.017 0.4685    
    Residuals       98 0.01552 0.00015832                   
    ---
    Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 
    >

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Analyse de la variance (ANOVA) sous contrainte
    Par aucunexperience dans le forum SAS STAT
    Réponses: 4
    Dernier message: 11/01/2010, 11h52
  2. Problème d'installation oracle 8.1.7 sous NT
    Par Anonymous dans le forum Installation
    Réponses: 7
    Dernier message: 02/08/2002, 15h18
  3. OmniORB : code sous Windows et Linux
    Par debug dans le forum CORBA
    Réponses: 2
    Dernier message: 30/04/2002, 18h45
  4. Je ne peux établir une connexion cliente sous Linux.
    Par Anonymous dans le forum CORBA
    Réponses: 5
    Dernier message: 16/04/2002, 16h57
  5. Réponses: 4
    Dernier message: 27/03/2002, 12h03

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo