IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Méthodes prédictives Discussion :

Résultats d'une régression linéaire


Sujet :

Méthodes prédictives

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Modérateur
    Avatar de ToTo13
    Homme Profil pro
    Chercheur en informatique
    Inscrit en
    Janvier 2006
    Messages
    5 793
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 46
    Localisation : Etats-Unis

    Informations professionnelles :
    Activité : Chercheur en informatique
    Secteur : Santé

    Informations forums :
    Inscription : Janvier 2006
    Messages : 5 793
    Par défaut Résultats d'une régression linéaire
    Bonjour,

    j'ai des caractéristiques qui décrivent un phénomène à différents instants. Afin d'évaluer la performance individuelle de chaque caractéristique, je fais une régression linéaire avec validation croisée, puis je calcule deux corrélations et deux erreurs pour évaluer le résultats.

    Donc pour une variable, je fais quelque chose du genre :
    • Entrées : phénomène P={P_t1, ..., P_tn}$, caractéristique $C={C_t1, ..., C_tn}$
    • Régression linéaire de $P$ en fonction de $C$, plus leave one out.
    • Calcul de deux corrélations (linéaire et spearman) et de deux erreur (moyenne de erreurs absolues et des carrés)


    Pour certaines de ces variables, les deux corrélations sont très bonnes (> 0.9), mais lorsque je regarde les valeurs prédites, je m'aperçois qu'elles sont toutes proches de la moyenne (des valeurs à prédire, donc de la moyenne de $P$). Donc les erreurs sont grandes, ce qui voudrait donc dire que les résultats sont mauvais.

    Comment est il possible d'avoir de si bonnes corrélations avec d'aussi mauvaises erreurs ?
    Y a t-il un moyen de corriger cela ?

    Pour les précision techniques, j'utilise weka avec l'option "-S 1" afin de ne pas faire de sélection de variables.

    Merci par avance pour votre aide.
    Consignes aux jeunes padawans : une image vaut 1000 mots !
    - Dans ton message respecter tu dois : les règles de rédaction et du forum, prévisualiser, relire et corriger TOUTES les FAUTES (frappes, sms, d'aurteaugrafe, mettre les ACCENTS et les BALISES) => ECRIRE clairement et en Français tu DOIS.
    - Le côté obscur je sens dans le MP => Tous tes MPs je détruirai et la réponse tu n'auras si en privé tu veux que je t'enseigne.(Lis donc ceci)
    - ton poste tu dois marquer quand la bonne réponse tu as obtenu.

  2. #2
    Expert confirmé

    Profil pro
    Inscrit en
    Janvier 2007
    Messages
    10 610
    Détails du profil
    Informations personnelles :
    Âge : 67
    Localisation : France

    Informations forums :
    Inscription : Janvier 2007
    Messages : 10 610
    Billets dans le blog
    2
    Par défaut
    je ne connais pas weka ou spearman, mais je suppose que tu as (ou tu peux calculer) un sigma..


    • Peut-être ton sigma est-il très grand.. Ce qui ferait une bonne corrélation, et une valeur prédite proche de la moyenne.

    • Autre explication : tu modélises linéairement quelque chose qui n'est pas linéaire..


    As-tu essayé juste un moindre-carrés généralisé ? juste voir si ça donne la même chose...

  3. #3
    Modérateur
    Avatar de ToTo13
    Homme Profil pro
    Chercheur en informatique
    Inscrit en
    Janvier 2006
    Messages
    5 793
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 46
    Localisation : Etats-Unis

    Informations professionnelles :
    Activité : Chercheur en informatique
    Secteur : Santé

    Informations forums :
    Inscription : Janvier 2006
    Messages : 5 793
    Par défaut
    Salut Souviron,
    merci pour tes réponses !!!

    Citation Envoyé par souviron34 Voir le message
    je ne connais pas weka ou spearman, mais je suppose que tu as (ou tu peux calculer) un sigma.
    • Peut-être ton sigma est-il très grand.. Ce qui ferait une bonne corrélation, et une valeur prédite proche de la moyenne.
    Qu'appelles tu sigma ?
    Peux tu me conseiller un lien ?


    Citation Envoyé par souviron34 Voir le message
    • Autre explication : tu modélises linéairement quelque chose qui n'est pas linéaire..
    Oui, c'est très certainement le cas. Pour l'instant c'est juste une phase de tests/approximations/etc.


    Citation Envoyé par souviron34 Voir le message
    As-tu essayé juste un moindre-carrés généralisé ? juste voir si ça donne la même chose...
    Non :-(
    Est ce que tu aurais un code à me conseiller (C, C++, Java) ?
    Consignes aux jeunes padawans : une image vaut 1000 mots !
    - Dans ton message respecter tu dois : les règles de rédaction et du forum, prévisualiser, relire et corriger TOUTES les FAUTES (frappes, sms, d'aurteaugrafe, mettre les ACCENTS et les BALISES) => ECRIRE clairement et en Français tu DOIS.
    - Le côté obscur je sens dans le MP => Tous tes MPs je détruirai et la réponse tu n'auras si en privé tu veux que je t'enseigne.(Lis donc ceci)
    - ton poste tu dois marquer quand la bonne réponse tu as obtenu.

  4. #4
    Expert confirmé

    Profil pro
    Inscrit en
    Janvier 2007
    Messages
    10 610
    Détails du profil
    Informations personnelles :
    Âge : 67
    Localisation : France

    Informations forums :
    Inscription : Janvier 2007
    Messages : 10 610
    Billets dans le blog
    2
    Par défaut
    Citation Envoyé par ToTo13 Voir le message
    Qu'appelles tu sigma ?
    Peux tu me conseiller un lien ?
    Methode des moindres carres (Wiki)

    C'est l'écart-type

    En général on prend 1, 1.2 ou 2 sigmas pour les "bonnes" mesures...


    Citation Envoyé par ToTo13 Voir le message
    Non :-(
    Est ce que tu aurais un code à me conseiller (C, C++, Java) ?

    Il me semble que j'avais mis un code C (ou Fortran ??) dans la rubrique Contribuez (pour le fit d'ellipse. Dans les premiers de la rubrique). Ca allait jusqu'à 10 paramètres. Tu peux encore augmenter. La seule difficulté est l'inversion de la matrice, mais en prenant le code initial c'est assez facile.

    [EDIT] :

    c'est ici en Fortran

    [/EDIT]

  5. #5
    Modérateur
    Avatar de ToTo13
    Homme Profil pro
    Chercheur en informatique
    Inscrit en
    Janvier 2006
    Messages
    5 793
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 46
    Localisation : Etats-Unis

    Informations professionnelles :
    Activité : Chercheur en informatique
    Secteur : Santé

    Informations forums :
    Inscription : Janvier 2006
    Messages : 5 793
    Par défaut
    j'ai calculé le distance au carré, soit le S(theta) dans le lien que tu as partagé.

    Je ne connais pas le fortran, je vais essayer de trouver un code.

    Merci pour ton aide !
    Consignes aux jeunes padawans : une image vaut 1000 mots !
    - Dans ton message respecter tu dois : les règles de rédaction et du forum, prévisualiser, relire et corriger TOUTES les FAUTES (frappes, sms, d'aurteaugrafe, mettre les ACCENTS et les BALISES) => ECRIRE clairement et en Français tu DOIS.
    - Le côté obscur je sens dans le MP => Tous tes MPs je détruirai et la réponse tu n'auras si en privé tu veux que je t'enseigne.(Lis donc ceci)
    - ton poste tu dois marquer quand la bonne réponse tu as obtenu.

  6. #6
    Expert confirmé

    Profil pro
    Inscrit en
    Janvier 2007
    Messages
    10 610
    Détails du profil
    Informations personnelles :
    Âge : 67
    Localisation : France

    Informations forums :
    Inscription : Janvier 2007
    Messages : 10 610
    Billets dans le blog
    2
    Par défaut
    Citation Envoyé par ToTo13 Voir le message
    j'ai calculé le distance au carré, soit le S(theta) dans le lien que tu as partagé.

    Je ne connais pas le fortran, je vais essayer de trouver un code.

    Merci pour ton aide !
    je peux te fournir le code en C demain (dans la journee de samedi)

  7. #7
    Invité de passage
    Homme Profil pro
    Chargé d’études
    Inscrit en
    Octobre 2011
    Messages
    1
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Rhône (Rhône Alpes)

    Informations professionnelles :
    Activité : Chargé d’études
    Secteur : High Tech - Produits et services télécom et Internet

    Informations forums :
    Inscription : Octobre 2011
    Messages : 1
    Par défaut
    Citation Envoyé par ToTo13 Voir le message
    J'ai des caractéristiques qui décrivent un phénomène à différents instants. Afin d'évaluer la performance individuelle de chaque caractéristique, je fais une régression linéaire avec validation croisée, puis je calcule deux corrélations et deux erreurs pour évaluer le résultats.

    Donc pour une variable, je fais quelque chose du genre :
    • Entrées : phénomène P={P_t1, ..., P_tn}$, caractéristique $C={C_t1, ..., C_tn}$
    • Régression linéaire de $P$ en fonction de $C$, plus leave one out.
    • Calcul de deux corrélations (linéaire et spearman) et de deux erreur (moyenne de erreurs absolues et des carrés)


    Pour certaines de ces variables, les deux corrélations sont très bonnes (> 0.9), mais lorsque je regarde les valeurs prédites, je m'aperçois qu'elles sont toutes proches de la moyenne (des valeurs à prédire, donc de la moyenne de $P$). Donc les erreurs sont grandes, ce qui voudrait donc dire que les résultats sont mauvais.

    Comment est il possible d'avoir de si bonnes corrélations avec d'aussi mauvaises erreurs ?
    Bonjour,

    Ne connaissant pas votre niveau en statistique, je me permet de vous demander si vous aviez testé les hypothèses d'une régression multiple?

    Avez vous à faire à des séries temporelles? Si oui il faut faire extrêmement attention à l’auto corrélation. Qu'entendez vous par " les deux corrélations très bonne"? Entre la variable à prédire et un des descripteurs?
    Quoi qu'il soit il faut étudier la distribution des résidus à l'aide de graphique et de tests.
    Le lien d'un document pour bien pratiquer la régression multiple (http://eric.univ-lyon2.fr/~ricco/cou...a_pratique.pdf

  8. #8
    Modérateur
    Avatar de ToTo13
    Homme Profil pro
    Chercheur en informatique
    Inscrit en
    Janvier 2006
    Messages
    5 793
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 46
    Localisation : Etats-Unis

    Informations professionnelles :
    Activité : Chercheur en informatique
    Secteur : Santé

    Informations forums :
    Inscription : Janvier 2006
    Messages : 5 793
    Par défaut
    Après une étude statistique de ma variable à prédire, il s'agit d'un problème non linéaire, que je tente de prédire avec un système linéaire. Il est alors possible d'avoir des très bonnes corrélations entre les prédictions et la variables à prédire, mais aussi avoir des erreurs élevées. Un graphique prédiction/topredict montre que les modèles créés ont du sens.
    Consignes aux jeunes padawans : une image vaut 1000 mots !
    - Dans ton message respecter tu dois : les règles de rédaction et du forum, prévisualiser, relire et corriger TOUTES les FAUTES (frappes, sms, d'aurteaugrafe, mettre les ACCENTS et les BALISES) => ECRIRE clairement et en Français tu DOIS.
    - Le côté obscur je sens dans le MP => Tous tes MPs je détruirai et la réponse tu n'auras si en privé tu veux que je t'enseigne.(Lis donc ceci)
    - ton poste tu dois marquer quand la bonne réponse tu as obtenu.

Discussions similaires

  1. Moyenne géométrique dans une régression linéaire
    Par Lilouche52 dans le forum SAS STAT
    Réponses: 2
    Dernier message: 06/06/2013, 09h13
  2. Tous les résultats d'une régression logistique
    Par nanou2183 dans le forum SAS STAT
    Réponses: 3
    Dernier message: 13/08/2012, 16h19
  3. LaTeX PGFplots / Tikzpicture tracer une régression linéaire
    Par galaxie87 dans le forum Tableaux - Graphiques - Images - Flottants
    Réponses: 0
    Dernier message: 16/07/2010, 22h09
  4. Réponses: 2
    Dernier message: 22/12/2006, 20h24
  5. [NaN] Calcul d'une régression linéaire
    Par GLDavid dans le forum Langage
    Réponses: 1
    Dernier message: 24/10/2006, 12h55

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo