IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Méthodes prédictives Discussion :

Résultats d'une régression linéaire


Sujet :

Méthodes prédictives

  1. #1
    Modérateur
    Avatar de ToTo13
    Homme Profil pro
    Chercheur en informatique
    Inscrit en
    Janvier 2006
    Messages
    5 793
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 46
    Localisation : Etats-Unis

    Informations professionnelles :
    Activité : Chercheur en informatique
    Secteur : Santé

    Informations forums :
    Inscription : Janvier 2006
    Messages : 5 793
    Par défaut Résultats d'une régression linéaire
    Bonjour,

    j'ai des caractéristiques qui décrivent un phénomène à différents instants. Afin d'évaluer la performance individuelle de chaque caractéristique, je fais une régression linéaire avec validation croisée, puis je calcule deux corrélations et deux erreurs pour évaluer le résultats.

    Donc pour une variable, je fais quelque chose du genre :
    • Entrées : phénomène P={P_t1, ..., P_tn}$, caractéristique $C={C_t1, ..., C_tn}$
    • Régression linéaire de $P$ en fonction de $C$, plus leave one out.
    • Calcul de deux corrélations (linéaire et spearman) et de deux erreur (moyenne de erreurs absolues et des carrés)


    Pour certaines de ces variables, les deux corrélations sont très bonnes (> 0.9), mais lorsque je regarde les valeurs prédites, je m'aperçois qu'elles sont toutes proches de la moyenne (des valeurs à prédire, donc de la moyenne de $P$). Donc les erreurs sont grandes, ce qui voudrait donc dire que les résultats sont mauvais.

    Comment est il possible d'avoir de si bonnes corrélations avec d'aussi mauvaises erreurs ?
    Y a t-il un moyen de corriger cela ?

    Pour les précision techniques, j'utilise weka avec l'option "-S 1" afin de ne pas faire de sélection de variables.

    Merci par avance pour votre aide.
    Consignes aux jeunes padawans : une image vaut 1000 mots !
    - Dans ton message respecter tu dois : les règles de rédaction et du forum, prévisualiser, relire et corriger TOUTES les FAUTES (frappes, sms, d'aurteaugrafe, mettre les ACCENTS et les BALISES) => ECRIRE clairement et en Français tu DOIS.
    - Le côté obscur je sens dans le MP => Tous tes MPs je détruirai et la réponse tu n'auras si en privé tu veux que je t'enseigne.(Lis donc ceci)
    - ton poste tu dois marquer quand la bonne réponse tu as obtenu.

  2. #2
    Expert confirmé

    Profil pro
    Inscrit en
    Janvier 2007
    Messages
    10 610
    Détails du profil
    Informations personnelles :
    Âge : 67
    Localisation : France

    Informations forums :
    Inscription : Janvier 2007
    Messages : 10 610
    Billets dans le blog
    2
    Par défaut
    je ne connais pas weka ou spearman, mais je suppose que tu as (ou tu peux calculer) un sigma..


    • Peut-être ton sigma est-il très grand.. Ce qui ferait une bonne corrélation, et une valeur prédite proche de la moyenne.

    • Autre explication : tu modélises linéairement quelque chose qui n'est pas linéaire..


    As-tu essayé juste un moindre-carrés généralisé ? juste voir si ça donne la même chose...

  3. #3
    Modérateur
    Avatar de ToTo13
    Homme Profil pro
    Chercheur en informatique
    Inscrit en
    Janvier 2006
    Messages
    5 793
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 46
    Localisation : Etats-Unis

    Informations professionnelles :
    Activité : Chercheur en informatique
    Secteur : Santé

    Informations forums :
    Inscription : Janvier 2006
    Messages : 5 793
    Par défaut
    Salut Souviron,
    merci pour tes réponses !!!

    Citation Envoyé par souviron34 Voir le message
    je ne connais pas weka ou spearman, mais je suppose que tu as (ou tu peux calculer) un sigma.
    • Peut-être ton sigma est-il très grand.. Ce qui ferait une bonne corrélation, et une valeur prédite proche de la moyenne.
    Qu'appelles tu sigma ?
    Peux tu me conseiller un lien ?


    Citation Envoyé par souviron34 Voir le message
    • Autre explication : tu modélises linéairement quelque chose qui n'est pas linéaire..
    Oui, c'est très certainement le cas. Pour l'instant c'est juste une phase de tests/approximations/etc.


    Citation Envoyé par souviron34 Voir le message
    As-tu essayé juste un moindre-carrés généralisé ? juste voir si ça donne la même chose...
    Non :-(
    Est ce que tu aurais un code à me conseiller (C, C++, Java) ?
    Consignes aux jeunes padawans : une image vaut 1000 mots !
    - Dans ton message respecter tu dois : les règles de rédaction et du forum, prévisualiser, relire et corriger TOUTES les FAUTES (frappes, sms, d'aurteaugrafe, mettre les ACCENTS et les BALISES) => ECRIRE clairement et en Français tu DOIS.
    - Le côté obscur je sens dans le MP => Tous tes MPs je détruirai et la réponse tu n'auras si en privé tu veux que je t'enseigne.(Lis donc ceci)
    - ton poste tu dois marquer quand la bonne réponse tu as obtenu.

  4. #4
    Expert confirmé

    Profil pro
    Inscrit en
    Janvier 2007
    Messages
    10 610
    Détails du profil
    Informations personnelles :
    Âge : 67
    Localisation : France

    Informations forums :
    Inscription : Janvier 2007
    Messages : 10 610
    Billets dans le blog
    2
    Par défaut
    Citation Envoyé par ToTo13 Voir le message
    Qu'appelles tu sigma ?
    Peux tu me conseiller un lien ?
    Methode des moindres carres (Wiki)

    C'est l'écart-type

    En général on prend 1, 1.2 ou 2 sigmas pour les "bonnes" mesures...


    Citation Envoyé par ToTo13 Voir le message
    Non :-(
    Est ce que tu aurais un code à me conseiller (C, C++, Java) ?

    Il me semble que j'avais mis un code C (ou Fortran ??) dans la rubrique Contribuez (pour le fit d'ellipse. Dans les premiers de la rubrique). Ca allait jusqu'à 10 paramètres. Tu peux encore augmenter. La seule difficulté est l'inversion de la matrice, mais en prenant le code initial c'est assez facile.

    [EDIT] :

    c'est ici en Fortran

    [/EDIT]

  5. #5
    Modérateur
    Avatar de ToTo13
    Homme Profil pro
    Chercheur en informatique
    Inscrit en
    Janvier 2006
    Messages
    5 793
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 46
    Localisation : Etats-Unis

    Informations professionnelles :
    Activité : Chercheur en informatique
    Secteur : Santé

    Informations forums :
    Inscription : Janvier 2006
    Messages : 5 793
    Par défaut
    j'ai calculé le distance au carré, soit le S(theta) dans le lien que tu as partagé.

    Je ne connais pas le fortran, je vais essayer de trouver un code.

    Merci pour ton aide !
    Consignes aux jeunes padawans : une image vaut 1000 mots !
    - Dans ton message respecter tu dois : les règles de rédaction et du forum, prévisualiser, relire et corriger TOUTES les FAUTES (frappes, sms, d'aurteaugrafe, mettre les ACCENTS et les BALISES) => ECRIRE clairement et en Français tu DOIS.
    - Le côté obscur je sens dans le MP => Tous tes MPs je détruirai et la réponse tu n'auras si en privé tu veux que je t'enseigne.(Lis donc ceci)
    - ton poste tu dois marquer quand la bonne réponse tu as obtenu.

  6. #6
    Expert confirmé

    Profil pro
    Inscrit en
    Janvier 2007
    Messages
    10 610
    Détails du profil
    Informations personnelles :
    Âge : 67
    Localisation : France

    Informations forums :
    Inscription : Janvier 2007
    Messages : 10 610
    Billets dans le blog
    2
    Par défaut
    Citation Envoyé par ToTo13 Voir le message
    j'ai calculé le distance au carré, soit le S(theta) dans le lien que tu as partagé.

    Je ne connais pas le fortran, je vais essayer de trouver un code.

    Merci pour ton aide !
    je peux te fournir le code en C demain (dans la journee de samedi)

  7. #7
    Modérateur
    Avatar de ToTo13
    Homme Profil pro
    Chercheur en informatique
    Inscrit en
    Janvier 2006
    Messages
    5 793
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 46
    Localisation : Etats-Unis

    Informations professionnelles :
    Activité : Chercheur en informatique
    Secteur : Santé

    Informations forums :
    Inscription : Janvier 2006
    Messages : 5 793
    Par défaut
    Ce serait merveilleux :-)
    Consignes aux jeunes padawans : une image vaut 1000 mots !
    - Dans ton message respecter tu dois : les règles de rédaction et du forum, prévisualiser, relire et corriger TOUTES les FAUTES (frappes, sms, d'aurteaugrafe, mettre les ACCENTS et les BALISES) => ECRIRE clairement et en Français tu DOIS.
    - Le côté obscur je sens dans le MP => Tous tes MPs je détruirai et la réponse tu n'auras si en privé tu veux que je t'enseigne.(Lis donc ceci)
    - ton poste tu dois marquer quand la bonne réponse tu as obtenu.

  8. #8
    Expert confirmé

    Profil pro
    Inscrit en
    Janvier 2007
    Messages
    10 610
    Détails du profil
    Informations personnelles :
    Âge : 67
    Localisation : France

    Informations forums :
    Inscription : Janvier 2007
    Messages : 10 610
    Billets dans le blog
    2
    Par défaut
    Salut

    Alors pas vraiment testé, mais j'ai porté le code en C ci-dessous

    Code C : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
    37
    38
    39
    40
    41
    42
    43
    44
    45
    46
    47
    48
    49
    50
    51
    52
    53
    54
    55
    56
    57
    58
    59
    60
    61
    62
    63
    64
    65
    66
    67
    68
    69
    70
    71
    72
    73
    74
    75
    76
    77
    78
    79
    80
    81
    82
    83
    84
    85
    86
    87
    88
    89
    90
    91
    92
    93
    94
    95
    96
    97
    98
    99
    100
    101
    102
    103
    104
    105
    106
    107
    108
    109
    110
    111
    112
    113
    114
    115
    116
    117
    118
    119
    120
    121
    122
    123
    124
    125
    126
    127
    128
    129
    130
    131
    132
    133
    134
    135
    136
    137
    138
    139
    140
    141
    142
    143
    144
    145
    146
    147
    148
    149
    150
    151
    152
    153
    154
    155
    156
    157
    158
    159
    160
    161
    162
    163
    164
    165
    166
    167
    168
    169
    170
    171
    172
    173
    174
    175
    176
    177
    178
    179
    180
    181
    182
    183
    184
    185
    186
    187
    188
    189
    190
    191
    192
    193
    194
    195
    196
    197
    198
    199
    200
    201
    202
    203
    204
    205
    206
    207
    208
    209
    210
    211
    212
    213
    214
    215
    216
    217
    218
    219
    220
    221
    222
    223
    224
    225
    226
    227
    #include <math.h>
     
    #ifndef PI
    #define PI 3.14159265359
    #endif
     
    #define ACCURACY 1.0e-12
     
     
     
    /*
    ***********************************************************
           SOLVE LINEAR SYSTEM VIA GAUSSIAN ELIMINATION
                 ( 10.01.1979 K. BANSE )
                                  (SACLAY - HPCCD - 1982/84)
      Ported to C
       Jean Souviron 2015/12/13
    ***********************************************************
    */
    int LNSYS(double *Array, double *X, int Order )
    {
      int    i, j, k, MaxRow, Length ;
      double Save, Rmax, Mid ;
     
      Length = Order+1 ;
     
      for ( k = 0 ; k < (Order-1) ; k++ )
        {
    /*
    --- Get largest pivotal element
    */
          Save = 0.0 ;
     
          for ( j = k ; j < Order ; j++ )
    	{
    	  Rmax = fabs(Array[j*Length+k]);
    	  if( Save < Rmax )
    	    {
    	      Save = Rmax ;
    	      MaxRow = j ;
    	    }
    	}
     
    /*
    --- Exchange rows
    */
          for ( j = k ; j < Length ; j++ )
    	{
    	  Save = Array[k*Length+j] ;
    	  Array[k*Length+j] = Array[MaxRow*Length+j] ;
    	  Array[MaxRow*Length+j]= Save ;
    	}
     
    /*
    --- Test if array is singular
    */
          Mid = Array[k*Length+k] ;
          if ( fabs(Mid) < ACCURACY )
    	{
    	  for ( j = 0 ; j < Order ; j++ )
    	    X[j] = 0.0 ;
    	  return 0 ;
    	}
     
    /*
    --- Substract row from lower rows
    */
          for ( i = k+1 ; i < Order ; i++ )
    	{
    	  Save = Array[i*Length+k] / Mid ;
    	  Array[i*Length+k] = 0.0 ;
     
    	  for ( j = k+1 ; j < Length ; j++ )
    	    Array[i*Length+j] = Array[i*Length+j] - (Save*Array[k*Length+j]) ;
    	}
        }
     
    /*
    ================
     
     Calculate vector X
     
    ================
    */
      X[Order-1] = Array[Length*(Order-1)+Order] / Array[Length*(Order-1)+Order-1] ;
     
      for ( k = 1 ; k < Order ; k++ )
        {
          i = Order + 1 - k ;
     
          Save = Array[i*Length+Order+1] ;
     
          for ( j = i+1 ; j < Order ; j++ )
    	Save = Save - Array[i*Length+j]*X[j] ;
     
          X[i] = Save / Array[i*Length+i] ;
        }
     
      return 1 ;
    }
     
    /*
    ***********************************************************************
          GENERALIZED LEAST-SQUARE FOR ANY NUMBER OF PARAMETERS
                          (Jean SOUVIRON - DAO Victoria - 1985)
             (METHOD OF R. SEDGEWICK in ALGORITHMS
                                        ADDISON-WESLEY PUBLISHING CO.
                                        1984)
          Modified 2015/12/12 Jean Souviron
             Porting to C
    	 Upgrading to take any number of parameters
     
    -----------------------------------------------------------------------
     
          INPUT :
                     NDims = NUMBER OF DIFFERENT PARAMETERS+1 (for the data to be fitted to)
                      NPts = TOTAL NUMBER OF POINTS
               InputMatrix = ARRAY OF PARAMETERS FOR EACH POINT
                             (LAST VECTOR HAS TO BE THE DATA TO BE FITTED)
          OUTPUT :
              OutputCoeffs = ARRAY OF COEFFICIENTS (dimension NDims-1 )
                     Sigma
     
          RETURN VALUE :
               1 if everything is OK
               0 if an error occurred (memory or singular array)
     
     
      Example : if we want to fit an ellipse with a group of points according to
                equation x2/a2 + y2/b2 = 1
     
                the input matrix will be N pts long, and 3 columns wide, with for
                each point the x2, the y2, and 1.
                the output coeffs will be 2 items, 1/a2 and 1/b2
                the sigma will be computed by applying these coeffs to the first 2 columns
    	    for each point, and comparing with the result (1).
                
     
    ***********************************************************************
    */
    int LeastSquares ( double *InputMatrix, int NDims, int NPts, 
    		   double **OutputCoeffs, double *Sigma )
    {
      double *Coeffs=NULL ;
      double  T, Z1, Z2 ;
      int     i,j, k, io = 0, ko, NParams ;
     
     
      NParams = NDims-1 ;
     
    /*
      Allocations
    */
      if ( (*OutputCoeffs = (double *)calloc(NParams, sizeof(double))) == NULL )
        return 0 ;
      if ( (Coeffs = (double *)calloc(NParams*NDims, sizeof(double))) == NULL )
        {
          free (*OutputCoeffs);
          *OutputCoeffs = NULL ;
          return 0 ;
        }
     
    /*
      Initializations
    */
      io = 0 ;
      for ( i = 0 ; i < NParams ; i++ )
        {
          (*OutputCoeffs)[i] = 0.0 ;
     
          for ( j = 0 ; j < NDims ; j++ )
    	{
    	  T = 0.0 ;
     
    	  for ( k=0 ; k < NPts ; k++ )
    	    {
    	      ko = k * NDims ;
     
    	      Z1 = InputMatrix[ko+i] ;
    	      Z2 = InputMatrix[ko+j] ;
     
    	      T = T + (Z1*Z2) ;
    	    }
     
    	  Coeffs[io+j]= T ;
    	}
          io = io + NDims ;
        }
     
    /*
    -----------------
       Solving by gaussian elimination
    -----------------
    */
      if ( LNSYS(Coeffs, *OutputCoeffs, NParams) != 1 )
        {
          free ( Coeffs );
          free ( *OutputCoeffs ) ;
          *OutputCoeffs = NULL ;
          return 0 ;
        }
      free ( Coeffs );
     
    /*
    -----------------
      Computes sigma
    -----------------
    */
      *Sigma = 0.0 ;
      for ( i = 0 ; i < NPts ; i++ )
        { 
          Z1 = InputMatrix[i*NDims+NParams]; /* The value to be compared with */
     
          for ( j = 0 ; j < NParams ; j++ )
    	{
    	  Z1= Z1 - ((*OutputCoeffs)[j]*InputMatrix[i*NDims+j]) ;
    	}
     
          if( Z1 < 0.0 ) 
    	Z1 = -Z1;
     
          *Sigma = *Sigma + Z1 ;
        }
     
      *Sigma = (*Sigma/(double)NPts)*sqrt(PI/2.0) ;
      return 1 ;
    }

    Si tu trouves des erreurs ou si tu trouves un autre code, "feel free"

    J'ai généralisé à N paramètres en entrée (avantage du C par rapport au Fortran ;-))

    En entrée tu fournis une matrice (ici un tableau 1D) qui contient :
    • pour chaque point de mesure une ligne
    • dans cette ligne les différentes valeurs des paramètres pour ce point et la dernière colonne est la valeur à comparer


    En sortie tu as un tableau (1D) des coefficients correspondants aux colonnes identifiées (valeurs à fitter / paramètres). J'ai mis un exemple dans le cartouche.

    [EDIT]

    Je vais aller le soumettre sur le forum Fortran pour que quelqu'un vérifie, même si ça m'a l'air "ben correc"...
    [/EDIT]

  9. #9
    Modérateur
    Avatar de ToTo13
    Homme Profil pro
    Chercheur en informatique
    Inscrit en
    Janvier 2006
    Messages
    5 793
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 46
    Localisation : Etats-Unis

    Informations professionnelles :
    Activité : Chercheur en informatique
    Secteur : Santé

    Informations forums :
    Inscription : Janvier 2006
    Messages : 5 793
    Par défaut
    Merci infiniment, je teste tout cela asap !
    Consignes aux jeunes padawans : une image vaut 1000 mots !
    - Dans ton message respecter tu dois : les règles de rédaction et du forum, prévisualiser, relire et corriger TOUTES les FAUTES (frappes, sms, d'aurteaugrafe, mettre les ACCENTS et les BALISES) => ECRIRE clairement et en Français tu DOIS.
    - Le côté obscur je sens dans le MP => Tous tes MPs je détruirai et la réponse tu n'auras si en privé tu veux que je t'enseigne.(Lis donc ceci)
    - ton poste tu dois marquer quand la bonne réponse tu as obtenu.

  10. #10
    Expert confirmé

    Profil pro
    Inscrit en
    Janvier 2007
    Messages
    10 610
    Détails du profil
    Informations personnelles :
    Âge : 67
    Localisation : France

    Informations forums :
    Inscription : Janvier 2007
    Messages : 10 610
    Billets dans le blog
    2
    Par défaut
    Salut et bonne année...

    il y a des bugs, je suis en train de corriger ça, je devrais te poster le résultat demain.

    (j'ai fait appel à des bonnes volontés côté Fortran, mais personne n'a répondu )

  11. #11
    Modérateur
    Avatar de ToTo13
    Homme Profil pro
    Chercheur en informatique
    Inscrit en
    Janvier 2006
    Messages
    5 793
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 46
    Localisation : Etats-Unis

    Informations professionnelles :
    Activité : Chercheur en informatique
    Secteur : Santé

    Informations forums :
    Inscription : Janvier 2006
    Messages : 5 793
    Par défaut
    Merci infiniment !!!
    Consignes aux jeunes padawans : une image vaut 1000 mots !
    - Dans ton message respecter tu dois : les règles de rédaction et du forum, prévisualiser, relire et corriger TOUTES les FAUTES (frappes, sms, d'aurteaugrafe, mettre les ACCENTS et les BALISES) => ECRIRE clairement et en Français tu DOIS.
    - Le côté obscur je sens dans le MP => Tous tes MPs je détruirai et la réponse tu n'auras si en privé tu veux que je t'enseigne.(Lis donc ceci)
    - ton poste tu dois marquer quand la bonne réponse tu as obtenu.

  12. #12
    Expert confirmé

    Profil pro
    Inscrit en
    Janvier 2007
    Messages
    10 610
    Détails du profil
    Informations personnelles :
    Âge : 67
    Localisation : France

    Informations forums :
    Inscription : Janvier 2007
    Messages : 10 610
    Billets dans le blog
    2
    Par défaut
    OK...

    Le code est porté et testé et figure dans une nouvelle contribution que j'ai mise en ligne ici.

    Tu y trouveras les moindres carrés généralisés à N paramètres..


  13. #13
    Modérateur
    Avatar de ToTo13
    Homme Profil pro
    Chercheur en informatique
    Inscrit en
    Janvier 2006
    Messages
    5 793
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 46
    Localisation : Etats-Unis

    Informations professionnelles :
    Activité : Chercheur en informatique
    Secteur : Santé

    Informations forums :
    Inscription : Janvier 2006
    Messages : 5 793
    Par défaut

    Je jète un coup d'oeil ASAP !
    Consignes aux jeunes padawans : une image vaut 1000 mots !
    - Dans ton message respecter tu dois : les règles de rédaction et du forum, prévisualiser, relire et corriger TOUTES les FAUTES (frappes, sms, d'aurteaugrafe, mettre les ACCENTS et les BALISES) => ECRIRE clairement et en Français tu DOIS.
    - Le côté obscur je sens dans le MP => Tous tes MPs je détruirai et la réponse tu n'auras si en privé tu veux que je t'enseigne.(Lis donc ceci)
    - ton poste tu dois marquer quand la bonne réponse tu as obtenu.

  14. #14
    Invité de passage
    Homme Profil pro
    Chargé d’études
    Inscrit en
    Octobre 2011
    Messages
    1
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Rhône (Rhône Alpes)

    Informations professionnelles :
    Activité : Chargé d’études
    Secteur : High Tech - Produits et services télécom et Internet

    Informations forums :
    Inscription : Octobre 2011
    Messages : 1
    Par défaut
    Citation Envoyé par ToTo13 Voir le message
    J'ai des caractéristiques qui décrivent un phénomène à différents instants. Afin d'évaluer la performance individuelle de chaque caractéristique, je fais une régression linéaire avec validation croisée, puis je calcule deux corrélations et deux erreurs pour évaluer le résultats.

    Donc pour une variable, je fais quelque chose du genre :
    • Entrées : phénomène P={P_t1, ..., P_tn}$, caractéristique $C={C_t1, ..., C_tn}$
    • Régression linéaire de $P$ en fonction de $C$, plus leave one out.
    • Calcul de deux corrélations (linéaire et spearman) et de deux erreur (moyenne de erreurs absolues et des carrés)


    Pour certaines de ces variables, les deux corrélations sont très bonnes (> 0.9), mais lorsque je regarde les valeurs prédites, je m'aperçois qu'elles sont toutes proches de la moyenne (des valeurs à prédire, donc de la moyenne de $P$). Donc les erreurs sont grandes, ce qui voudrait donc dire que les résultats sont mauvais.

    Comment est il possible d'avoir de si bonnes corrélations avec d'aussi mauvaises erreurs ?
    Bonjour,

    Ne connaissant pas votre niveau en statistique, je me permet de vous demander si vous aviez testé les hypothèses d'une régression multiple?

    Avez vous à faire à des séries temporelles? Si oui il faut faire extrêmement attention à l’auto corrélation. Qu'entendez vous par " les deux corrélations très bonne"? Entre la variable à prédire et un des descripteurs?
    Quoi qu'il soit il faut étudier la distribution des résidus à l'aide de graphique et de tests.
    Le lien d'un document pour bien pratiquer la régression multiple (http://eric.univ-lyon2.fr/~ricco/cou...a_pratique.pdf

  15. #15
    Modérateur
    Avatar de ToTo13
    Homme Profil pro
    Chercheur en informatique
    Inscrit en
    Janvier 2006
    Messages
    5 793
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 46
    Localisation : Etats-Unis

    Informations professionnelles :
    Activité : Chercheur en informatique
    Secteur : Santé

    Informations forums :
    Inscription : Janvier 2006
    Messages : 5 793
    Par défaut
    Après une étude statistique de ma variable à prédire, il s'agit d'un problème non linéaire, que je tente de prédire avec un système linéaire. Il est alors possible d'avoir des très bonnes corrélations entre les prédictions et la variables à prédire, mais aussi avoir des erreurs élevées. Un graphique prédiction/topredict montre que les modèles créés ont du sens.
    Consignes aux jeunes padawans : une image vaut 1000 mots !
    - Dans ton message respecter tu dois : les règles de rédaction et du forum, prévisualiser, relire et corriger TOUTES les FAUTES (frappes, sms, d'aurteaugrafe, mettre les ACCENTS et les BALISES) => ECRIRE clairement et en Français tu DOIS.
    - Le côté obscur je sens dans le MP => Tous tes MPs je détruirai et la réponse tu n'auras si en privé tu veux que je t'enseigne.(Lis donc ceci)
    - ton poste tu dois marquer quand la bonne réponse tu as obtenu.

Discussions similaires

  1. Moyenne géométrique dans une régression linéaire
    Par Lilouche52 dans le forum SAS STAT
    Réponses: 2
    Dernier message: 06/06/2013, 09h13
  2. Tous les résultats d'une régression logistique
    Par nanou2183 dans le forum SAS STAT
    Réponses: 3
    Dernier message: 13/08/2012, 16h19
  3. LaTeX PGFplots / Tikzpicture tracer une régression linéaire
    Par galaxie87 dans le forum Tableaux - Graphiques - Images - Flottants
    Réponses: 0
    Dernier message: 16/07/2010, 22h09
  4. Réponses: 2
    Dernier message: 22/12/2006, 20h24
  5. [NaN] Calcul d'une régression linéaire
    Par GLDavid dans le forum Langage
    Réponses: 1
    Dernier message: 24/10/2006, 12h55

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo