IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

R Discussion :

Problème summary d'une anova


Sujet :

R

  1. #1
    Nouveau membre du Club
    Femme Profil pro
    Inscrit en
    Mars 2013
    Messages
    54
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Localisation : France

    Informations forums :
    Inscription : Mars 2013
    Messages : 54
    Points : 33
    Points
    33
    Par défaut Problème summary d'une anova
    Bonjour à tous,

    après avoir fait une régression linéaire multivariée, je souhaite pouvoir additionner les coefficients de chacunes de ces variables. Lorsque je fais le summary de ma régression linéaire (appelons la res.lm) soit summary(res.lm) :

    le résultat que j'obtiens me donne l'intercept (je ne sais pas ce que signifie réellement l'intercept, j'ai cru comprendre que c'était le premier point par rapport à l'origine mais je ne vois pas vraiment ce que ça signifie), puis j'ai les résultats pour les différentes variables de ma régression . Le problème est que je n'ai pas toutes les modalités pour chaque variable :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    Coefficients:
                                           Estimate Std. Error t value Pr(>|t|)    
    (Intercept)                           -5.037811   0.470745 -10.702  < 2e-16 ***
    PrécédentClasse 2 (risque modéré)      0.666295   0.429581   1.551  0.12297    
    PrécédentClasse 3 (risque élevé)       1.625639   0.774259   2.100  0.03742 *  
    PrécédentClasse 4 (risque très élevé)  1.428841   0.302544   4.723 5.25e-06 ***
    WsolSEMIS DIRECT                       1.591007   0.642596   2.476  0.01439 *  
    WsolTCS                                0.773452   0.284668   2.717  0.00735 ** 
    SensibilitéVClasse 2                  -0.078399   0.385679  -0.203  0.83919    
    SensibilitéVClasse 3                  -0.440350   0.312829  -1.408  0.16128    
    LABOMYCSA                              0.839812   0.435438   1.929  0.05564 .  
    TraitementOUI                         -0.016168   0.267702  -0.060  0.95192    
    sPluieFlo                              0.001490   0.006447   0.231  0.81757

    par exemple pour ma variable appelée "Wsol" j'ai le résultat de "SEMIS DIRECT", le résultat de "TCS", mais normalement je devrais avoir une autre modalité (qui s'appelle "LABOUR") qui n’apparaît pas ... Comment faire pour l'obtenir ?

    Je suppose que ça a un lien avec l'intercept mais vu que je ne sais pas à quoi lui même il correspond ....

    Merci pour votre aide

  2. #2
    Modératrice

    Femme Profil pro
    Statisticienne, Fondatrice de la société DACTA
    Inscrit en
    Juin 2010
    Messages
    893
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 36
    Localisation : France, Loire Atlantique (Pays de la Loire)

    Informations professionnelles :
    Activité : Statisticienne, Fondatrice de la société DACTA

    Informations forums :
    Inscription : Juin 2010
    Messages : 893
    Points : 2 673
    Points
    2 673
    Par défaut
    Bonjour,

    Le problème ici n'est pas un problème de R mais plutôt de statistiques

    Je vous conseille donc de reprendre vos cours ou de regarder un peu de docs sur la méthode de l'ANOVA, notamment sur les différents paramètres qui composent le modèle.

    Quelques infos cependant :
    • Le paramètre "intercept" obtenu en sortie de R correpond à la constante du modèle d'anova.
    • La variable "Wsol" qui est une variable qualitative à 3 modalités (d'après votre message) n'entraine la création que de 2 paramètres dans le modèle car une des modalités (ici la modalite "LABOUR", mais cela peut être spécifié dans R) est prise comme modalité de référence, afin d'assurer un nombre de degrés de liberté correct au modèle.


    Bonne continuation et n'hésitez par à revenir avec des questions plus précises une fois que vous aurez déblayer le côté stats de la chose


    Cordialement,


    A.D.

  3. #3
    Nouveau membre du Club
    Femme Profil pro
    Inscrit en
    Mars 2013
    Messages
    54
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Localisation : France

    Informations forums :
    Inscription : Mars 2013
    Messages : 54
    Points : 33
    Points
    33
    Par défaut
    Dois je comprendre que R prends pour valeur de référence la constante "intercept" ?
    Ou est ce que ma modalité prise comme valeur de référence est considérée comme 0 ?

    Merci

  4. #4
    Membre confirmé
    Inscrit en
    Mars 2013
    Messages
    208
    Détails du profil
    Informations forums :
    Inscription : Mars 2013
    Messages : 208
    Points : 461
    Points
    461
    Par défaut
    Salut,

    Citation Envoyé par Fnouch Voir le message
    Dois je comprendre que R prends pour valeur de référence la constante "intercept" ?
    Non, l'intercept est une constante qui s'ajoute à la somme des coefficients*variables quelque soit la modalité de ces dernières.

    Ou est ce que ma modalité prise comme valeur de référence est considérée comme 0 ?
    Oui c'est ca.
    La modalité de réference d'une variable est prise comme ayant un effet neutre (+0 dans la somme), et c'est à cette référence que tu peux comparer l'effet des autres modalités de la variable.

  5. #5
    Nouveau membre du Club
    Femme Profil pro
    Inscrit en
    Mars 2013
    Messages
    54
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Localisation : France

    Informations forums :
    Inscription : Mars 2013
    Messages : 54
    Points : 33
    Points
    33
    Par défaut
    D'accord. Apparemment, R choisit la modalité de référence par ordre alphabétique ...
    Mon objectif était d'additionner les coefficients des modalités selon différentes combinaisons de modalités, donc il me faut tous les coefficients de toutes les modalités... Mais j'ai bien l'impression que c'est impossible

  6. #6
    Modératrice

    Femme Profil pro
    Statisticienne, Fondatrice de la société DACTA
    Inscrit en
    Juin 2010
    Messages
    893
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 36
    Localisation : France, Loire Atlantique (Pays de la Loire)

    Informations professionnelles :
    Activité : Statisticienne, Fondatrice de la société DACTA

    Informations forums :
    Inscription : Juin 2010
    Messages : 893
    Points : 2 673
    Points
    2 673
    Par défaut
    Bonjour,

    A mon avis, il faut avant tout que vous parveniez à déterminer précisément ce que vous souhaitez faire / obtenir comme résultats et ensuite décider de la méthode / du modèle à utiliser. Après, je pense que R peut faire à peu près n'importe quoi (dans le cas de modèles linéaires du moins ^^).

    En effet, avec par exemple le paramètre "contrasts" de la fonction lm, vous pouvez jouer sur la forme du modèle et donc les types de paramètres obtenus en sortie.
    Vous pouvez également choisir un modèle sans intercept en écrivant dans R une formule de la forme : lm( y ~ x - 1, data ) .

    Le problème principal ici est donc, je pense, de déterminer précisément ce que vous souhaitez fair (en terme statistiques), et ensuite nous pourrons peut-être vous conseiller sur comment l'appliquer avec le logiciel R.


    Bonne continuation


    Cordialement,


    A.D.

  7. #7
    Nouveau membre du Club
    Femme Profil pro
    Inscrit en
    Mars 2013
    Messages
    54
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Localisation : France

    Informations forums :
    Inscription : Mars 2013
    Messages : 54
    Points : 33
    Points
    33
    Par défaut
    je voulais additionner des coefficients selon certaines combinaisons agronomiques de façon à les comparer à un indice de risque préalablement établi ...

    Pour résoudre ce problème de modalité qui n’apparaît pas je pense qu'il faudrait que je crée une boucle pour que pour chacune de mes variables soient crée une variable par modalité. Pour reprendre l'exemple de la variable "Wsol" comportant 3 modalités : "LABOUR", "TCS", "SEMIS DIRECT". Il faudrait donc trois variables distinctes : "LABOUR", "TCS", "SEMIS DIRECT".


    et ce, pour toutes les variables qui m’intéressent ...

  8. #8
    Modératrice

    Femme Profil pro
    Statisticienne, Fondatrice de la société DACTA
    Inscrit en
    Juin 2010
    Messages
    893
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 36
    Localisation : France, Loire Atlantique (Pays de la Loire)

    Informations professionnelles :
    Activité : Statisticienne, Fondatrice de la société DACTA

    Informations forums :
    Inscription : Juin 2010
    Messages : 893
    Points : 2 673
    Points
    2 673
    Par défaut
    Bonjour,

    Je ne suis pas sûr que vous compreniez bien le fonctionnement d'un tel modèle.
    En effet, il repose sur la résolution d'équations linéaires et doit donc avoir un nombre de degrés de liberté cohérent pour qu'il existe une unique solution. C'est pour cette raison que pour les variables qualitatives, on fixe une des modalités à zéro.
    Le fait de créer une variable (codée en 0/1 j'imagine) pour chacune des modalités ne résoudra donc pas la problème.

    Je pense qu'il faudrait que vous vous renseigniez sur la manière dont est construit l'indice de risque dont vous parlez.
    Une piste peut-être, il arrive que dans certains cas, on "reconstruise" le coefficient pris comme référence comme étant l'opposé de la somme des autres coefficients.
    Par exemple, avec LABOUR comme modalité de référence, cela donnerait :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    coeff(LABOUR) = - coeff(TCS) - coeff(SEMIS DIRECT)
    Après, c'est à vous de voir si c'est cohérent et également ce qui se fait dans votre domaine spécifique...

    Bonne continuation


    Cordialement,

    A.D.

Discussions similaires

  1. problème de niveaux sur une ANOVA
    Par Fnouch dans le forum R
    Réponses: 3
    Dernier message: 11/04/2013, 14h58
  2. Réponses: 13
    Dernier message: 23/12/2004, 18h01
  3. Problème mémoire avec une dll par chargement dynamique
    Par widze19 dans le forum C++Builder
    Réponses: 6
    Dernier message: 15/12/2003, 13h20
  4. Réponses: 3
    Dernier message: 29/08/2003, 10h57
  5. problème xsl : inclure une donnée xml dans une balise html
    Par djodjo dans le forum XSL/XSLT/XPATH
    Réponses: 3
    Dernier message: 03/01/2003, 09h24

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo