IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

R Discussion :

MLG- Analyse de résultats (déviance pvalue et tests)


Sujet :

R

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Candidat au Club
    Homme Profil pro
    étudiant
    Inscrit en
    Août 2012
    Messages
    3
    Détails du profil
    Informations personnelles :
    Sexe : Homme

    Informations professionnelles :
    Activité : étudiant
    Secteur : Finance

    Informations forums :
    Inscription : Août 2012
    Messages : 3
    Par défaut MLG- Analyse de résultats (déviance pvalue et tests)
    Bonjour,

    Je rencontre un problème pour analyser mes résultats sur le logiciel R.
    J'ai effectué un modèle linéaire généralisé pour répartir la performance d'un fond financier sur des indices boursiers. Et j'ai essayé plusieurs lois (normale, gamma, poisson). Je ne sais pas laquelle choisir et analyser si mes résultats sont pertinents ou non.

    Voilà mes différents résultats :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
    37
    38
    39
    40
    41
    42
    43
    44
    45
    46
    47
    48
    49
    50
    51
    52
    53
    54
    55
    56
    57
    58
    59
    60
    61
    62
    63
    64
    65
    66
    67
    68
    69
    70
    71
    72
    73
    74
    75
    76
    77
    78
    79
    80
    81
    82
    83
    84
    85
    86
    87
    88
    89
    90
    91
    92
    
    > darwin <- glm(VL ~ eonia + cac40 + eurostox, 
    +                 family = gaussian, data = tab) 
    > summary(darwin) 
      
    Call: 
    glm(formula = VL ~ eonia + cac40 + eurostox, family = gaussian, 
        data = tab) 
      
    Deviance Residuals: 
        Min       1Q   Median       3Q      Max   
    -3.2566  -0.3086   0.0233   0.3049   1.6322   
      
    Coefficients: 
                 Estimate Std. Error t value Pr(>|t|)     
    (Intercept) 216.09259    9.45576  22.853  < 2e-16 *** 
    eonia        -1.69600    0.09220 -18.395  < 2e-16 *** 
    cac40         0.58803    0.01607  36.602  < 2e-16 *** 
    eurostox     -0.06077    0.01722  -3.529 0.000455 *** 
    --- 
    Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 
      
    (Dispersion parameter for gaussian family taken to be 0.2473806) 
      
        Null deviance: 13015.85  on 503  degrees of freedom 
    Residual deviance:   123.69  on 500  degrees of freedom 
    AIC: 732.27 
      
    Number of Fisher Scoring iterations: 2 
      
      
      
    > darwin <- glm(VL ~ eonia + cac40 + eurostox, 
    +                 family = poisson, data = tab) 
    Il y a eu 50 avis ou plus (utilisez warnings() pour voir les 50 premiers) 
    > summary(darwin) 
      
    Call: 
    glm(formula = VL ~ eonia + cac40 + eurostox, family = poisson, 
        data = tab) 
      
    Deviance Residuals: 
         Min        1Q    Median        3Q       Max   
    -0.32653  -0.03075  -0.00023   0.03445   0.18239   
      
    Coefficients: 
                  Estimate Std. Error z value Pr(>|z|)   
    (Intercept)  6.0494129  1.9830324   3.051  0.00228 ** 
    eonia       -0.0201637  0.0193475  -1.042  0.29733   
    cac40        0.0063521  0.0033999   1.868  0.06172 . 
    eurostox    -0.0006962  0.0036497  -0.191  0.84872   
    --- 
    Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 
      
    (Dispersion parameter for poisson family taken to be 1) 
      
        Null deviance: 139.7011  on 503  degrees of freedom 
    Residual deviance:   1.3748  on 500  degrees of freedom 
    AIC: Inf 
      
    Number of Fisher Scoring iterations: 3 
      
      
    > darwin <- glm(VL ~ eonia + cac40 + eurostox, 
    +                 family = Gamma, data = tab) 
    > summary(darwin) 
      
    Call: 
    glm(formula = VL ~ eonia + cac40 + eurostox, family = Gamma, 
        data = tab) 
      
    Deviance Residuals: 
          Min         1Q     Median         3Q        Max   
    -0.032848  -0.003389  -0.000242   0.003527   0.020328   
      
    Coefficients: 
                  Estimate Std. Error t value Pr(>|t|)     
    (Intercept) -7.649e-03  1.192e-03  -6.415 3.27e-10 *** 
    eonia        2.377e-04  1.164e-05  20.418  < 2e-16 *** 
    cac40       -6.876e-05  2.062e-06 -33.347  < 2e-16 *** 
    eurostox     8.086e-06  2.216e-06   3.649 0.000291 *** 
    --- 
    Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 
      
    (Dispersion parameter for Gamma family taken to be 3.330897e-05) 
      
        Null deviance: 1.500985  on 503  degrees of freedom 
    Residual deviance: 0.016679  on 500  degrees of freedom 
    AIC: 828.53 
      
    Number of Fisher Scoring iterations: 3

    Comment utiliser les deux valeurs indiquées pour la déviance? Et les pvalues données à côté des coefficients?
    Quel test puis-je faire par ailleurs pour valider le modèle choisi? J'ai déjà constaté que mes résidus suivent une loi normale à l'aide d'un qqplot et le code suivant :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    > X = sum(residuals(darwin,type="pearson")^2)
    > ddl <- df.residual(darwin)
    > 1-pchisq(X,ddl)
    trouvé sur le site ftp://ftp.cirad.fr/pub/group-r/group...hes/AIC_v3.pdf, me donne 1 pour valeur pour chaque modèle. Comment interpréter ce résultat?

    Je vous remercie d'avance pour le temps que vous consacrerez à me répondre.

    Pafo33

  2. #2
    Membre émérite

    Homme Profil pro
    Cyber Security & AI
    Inscrit en
    Février 2009
    Messages
    506
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Oise (Picardie)

    Informations professionnelles :
    Activité : Cyber Security & AI

    Informations forums :
    Inscription : Février 2009
    Messages : 506
    Billets dans le blog
    2
    Par défaut
    Tu sembles avoir tous les éléments en main. Le AIC (Akaike Information Criterion), soit le AICc, ils permettraient de déterminer la qualité de ton modèle. Ton modèle gamma semble meilleur que le normal et ton modèle de poisson est à rejeter.

    Les pvalues te donnent la significativité de tes variables. Plus il y a d'étoiles et meilleure elle est. Apparemment toutes tes variables sont significatives.

  3. #3
    Candidat au Club
    Homme Profil pro
    étudiant
    Inscrit en
    Août 2012
    Messages
    3
    Détails du profil
    Informations personnelles :
    Sexe : Homme

    Informations professionnelles :
    Activité : étudiant
    Secteur : Finance

    Informations forums :
    Inscription : Août 2012
    Messages : 3
    Par défaut
    Merci beaucoup pour ta réponse rapide.

    Néanmoins, il me semble que l'AIC doit être le plus petit possible. J'aurais donc été tenté de répondre que la loi normale est la plus appropriée.

    Sais-tu également comment expliquer les valeurs de déviance observées? (déviances nulles, residual deviance)? Je pensais que ces dernières devaient être proches de 1. Or c'est ici loin d'être le cas.

    Je dois rédiger un rapport où je cherche à expliquer quels arguments me permettent de valider mon modèle... Connais-tu d'autres tests que je peux effectuer pour confirmer la modélisation?

    Merci.

  4. #4
    Membre averti
    Homme Profil pro
    Inscrit en
    Juin 2012
    Messages
    56
    Détails du profil
    Informations personnelles :
    Sexe : Homme

    Informations forums :
    Inscription : Juin 2012
    Messages : 56
    Par défaut
    Je te confirme que le AIC doit être le plus faible possible, par contre as-tu utilisé une méthode de sélection de variables pour réaliser ton modèle (stepwise, backward, forward)? Tes résultats me paraissent étranges...

  5. #5
    Candidat au Club
    Homme Profil pro
    étudiant
    Inscrit en
    Août 2012
    Messages
    3
    Détails du profil
    Informations personnelles :
    Sexe : Homme

    Informations professionnelles :
    Activité : étudiant
    Secteur : Finance

    Informations forums :
    Inscription : Août 2012
    Messages : 3
    Par défaut
    Je n'ai pas utilisé de méthode de sélection de variables. J'ai cependant noté une très forte corrélation entre le cac40 et l'eurostoxx mais j'ai choisi de conserver ces deux variables par besoin dans mon étude. Pourquoi mes résultats te semblent-ils étranges?

    Comment fonctionnent les méthodes de sélection de variables dont tu parles?

    Merci de ta réponse.

Discussions similaires

  1. Réponses: 3
    Dernier message: 27/11/2013, 11h57
  2. Résultat aléatoire sur un test d'input radio
    Par Darkaurora dans le forum jQuery
    Réponses: 3
    Dernier message: 03/10/2013, 12h21
  3. Régression analyse sans résultat complex
    Par ERICKO dans le forum Algorithmes et structures de données
    Réponses: 0
    Dernier message: 21/06/2013, 10h20
  4. [AC-2000] requête analyse croisée : résultat erroné
    Par etoileetoile dans le forum Requêtes et SQL.
    Réponses: 1
    Dernier message: 04/10/2009, 11h55
  5. Analyser le résultat d'une page
    Par speed034 dans le forum Langage
    Réponses: 1
    Dernier message: 25/05/2009, 08h44

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo