IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Statistiques, Data Mining et Data Science Discussion :

Coefficient de corrélation exponentielle


Sujet :

Statistiques, Data Mining et Data Science

  1. #1
    Membre du Club
    Profil pro
    Inscrit en
    Février 2007
    Messages
    182
    Détails du profil
    Informations personnelles :
    Localisation : France, Paris (Île de France)

    Informations forums :
    Inscription : Février 2007
    Messages : 182
    Points : 52
    Points
    52
    Par défaut Coefficient de corrélation exponentielle
    Bonjour à toutes et à tous!

    Je vous explique mes réflexions, vous pourrez ensuite me dire si vous trouvez que ca à un sens... ou non!
    Je fit un ensemble de courbes par une régression exponentielle (logarithmique) comme indiqué dans ce post, avec M1 : y = a.exp(bx)+H ou H est un indicateur de translation des données en Y.

    j'éffectue donc une régression linéaire : log(y-H) = log(A).x + B et j'ai vu sur wikipedia que le coéfficent de corrélation linéaire ('r')donnait une indication sur la "distribution" des points comparativement au modèle (si je m'exprime bien) :
    r = cov(X,Y) / (sig(X).sig(Y)).

    J'imagine donc que je peux déduire un coéfficient de corrélation exponentielle adapté à mon modèle à partir de la :
    r2 = cov(X,(Y-H)) / (sig(X).sig(Y-H))

    Je pensais avoir correctement résonné quand j'ai plotté le résultat suivant :


    Mais quand j'utilie r2 sur mon modèle j'obtient un r2 = -1 sur une expo donc tous les points ne sont pas parfaitement alignés! pourquoi ? Comment expliquer ca ? j'ai du commettre une erreur!?

    Et voici le résultat qui me chagrine :


    Merci!

  2. #2
    Rédacteur
    Avatar de Zavonen
    Profil pro
    Inscrit en
    Novembre 2006
    Messages
    1 772
    Détails du profil
    Informations personnelles :
    Âge : 76
    Localisation : France

    Informations forums :
    Inscription : Novembre 2006
    Messages : 1 772
    Points : 1 913
    Points
    1 913
    Par défaut
    L'alignement parfait correspond au cas ou la droite de regression de y en x coïncide avec la droite de regression de x en y.
    Pour le coeff cela veut dire qu'il vaut +1 OU -1.
    Ce qu'on trouve est plus important que ce qu'on cherche.
    Maths de base pour les nuls (et les autres...)

  3. #3
    Membre du Club
    Profil pro
    Inscrit en
    Février 2007
    Messages
    182
    Détails du profil
    Informations personnelles :
    Localisation : France, Paris (Île de France)

    Informations forums :
    Inscription : Février 2007
    Messages : 182
    Points : 52
    Points
    52
    Par défaut
    Exactement, je suis parfaitement d'accord!
    Je suppose donc que le coéfficient de corrélation de mon modèle est "viable".

    Le Hic majeur c'est que pour un coéfficient r=-1 à la 2ème sous série, j'ai un des points qui ... sort de la "droite" (qui est en fait une exponentielle). Je ne devrais pas avoir -1! (j'ai regardé, il s'agit en fait de 0.997 et des brouettes, mais quand meme!)

  4. #4
    Expert éminent sénior

    Profil pro
    Inscrit en
    Janvier 2007
    Messages
    10 603
    Détails du profil
    Informations personnelles :
    Âge : 66
    Localisation : France

    Informations forums :
    Inscription : Janvier 2007
    Messages : 10 603
    Points : 17 913
    Points
    17 913
    Billets dans le blog
    2
    Par défaut
    visiblement ça marche parfaitement avec tes points rouges.
    Avec les bleus moins bien...

    Et un R de 0.997, ça veut dire quand même 3 pour 1000 d'erreur.. Pas si mal...
    "Un homme sage ne croit que la moitié de ce qu’il lit. Plus sage encore, il sait laquelle".

    Consultant indépendant.
    Architecture systèmes complexes. Programmation grosses applications critiques. Ergonomie.
    C, Fortran, XWindow/Motif, Java

    Je ne réponds pas aux MP techniques

  5. #5
    Membre du Club
    Profil pro
    Inscrit en
    Février 2007
    Messages
    182
    Détails du profil
    Informations personnelles :
    Localisation : France, Paris (Île de France)

    Informations forums :
    Inscription : Février 2007
    Messages : 182
    Points : 52
    Points
    52
    Par défaut
    oui, alors j'ai oublié d'expliquer un peu le graphique : les points rouges sont les points calculés par le modèle pour essayer d'approcher les données réelles (les points bleus). C'est un essai de Fit en fait. et la courbe verte passe forcément par les points rouges (normal ces points font partie de cette courbe). Vous me suivez ? le fil rouge, sur le bouton rouge, le fil vert sur le bouton vert...

    Donc je suppose que si chaque point rouge (modèle) était exactement sur chaque point bleu (données), je devrais avoir un r=-1. Or c'est ce que j'obtient, mais ce n'est pas le cas : des points sont outs.

  6. #6
    Expert éminent sénior

    Profil pro
    Inscrit en
    Janvier 2007
    Messages
    10 603
    Détails du profil
    Informations personnelles :
    Âge : 66
    Localisation : France

    Informations forums :
    Inscription : Janvier 2007
    Messages : 10 603
    Points : 17 913
    Points
    17 913
    Billets dans le blog
    2
    Par défaut
    oui mais 2 choses au moins viennent perturber.....

    1) ton coefficient de corrélation a été calculé sur une droite par rapport à un log.. donc je ne sais pas trop comment ça pourrait s'interpréter...
    2) comme on l'a discuté dans l'autre post, ça a été normalisé, et encore une fois le coefficient de corrélation s'applique à ce truc normalisé...

    En fait pour bien vérifier, il faudrait que tu traces les coordonées normalisées et en log... et ça devrait coller.... N'oublie pas que pour revenir à l'original, tu fais une exponentielle.. Un petit écart se traduit par une puissance...


    Donc comme corrélation, je pendrais plutôt l'écart-type (de toutes façons tu n'as que très peu de mesures, mais le fit ayant l'air bon elles ont l'air bien réparties de part et d'autre de la courbe).. qui d'ailleurs parlera plus aux gens à qui tu présenteras, car ce sera dans la même unité....

    PS: faudra que tu me dises comment tu insères tes images comme ça , j'y arrive pas
    "Un homme sage ne croit que la moitié de ce qu’il lit. Plus sage encore, il sait laquelle".

    Consultant indépendant.
    Architecture systèmes complexes. Programmation grosses applications critiques. Ergonomie.
    C, Fortran, XWindow/Motif, Java

    Je ne réponds pas aux MP techniques

  7. #7
    Membre du Club
    Profil pro
    Inscrit en
    Février 2007
    Messages
    182
    Détails du profil
    Informations personnelles :
    Localisation : France, Paris (Île de France)

    Informations forums :
    Inscription : Février 2007
    Messages : 182
    Points : 52
    Points
    52
    Par défaut
    En fait pour ce coéfficient de corrélation, je me suis basé sur :
    1 - Ma formule de départ : y = a.exp(bx) + H
    2 - La régression linéaire associée : y = ax + b -> log(y-H) = log(a).x + B
    3 - Le coéfficient de corrélation linéaire est : r = cov(x,y) / (Var(x).Var(y))
    4 - j'en déduit que le coéfficient pour mes données est : r' = cov(x,log(y-H)) / (Var(x).Var(log(y-h)))

    Ici je n'applique pas de normalisation comme dans le post précédent (merci pour le coup de main) (je suis dans le cas d'une exponentielle décroissante), l'introduction du H suffit en fait.

    Donc ca devrait en théorie marcher, mais je pense que c'est biaisé par quelque chose.

    L'écart type est pas mal, mais j'aimerais vraiment vraiment pouvoir sortir un coéfficient de corrélation ce serait tip top!!!

    Merci!
    PS : pour mettre mes images, je mets mon image jpg sur un serveur ftp, et j'insère un lien "Insérer une image" ou je rentre l'adresse du lien vers l'image. voili voila

Discussions similaires

  1. Coefficient de corrélation intra classe
    Par elvolcano dans le forum SAS STAT
    Réponses: 7
    Dernier message: 25/04/2019, 17h35
  2. Coefficient de corrélation
    Par Vassili68 dans le forum MATLAB
    Réponses: 5
    Dernier message: 22/04/2010, 17h46
  3. Interprétation coefficient de corrélation
    Par Liun971 dans le forum Signal
    Réponses: 2
    Dernier message: 01/07/2008, 08h20
  4. Réponses: 2
    Dernier message: 13/07/2007, 14h59
  5. Coefficient de corrélation
    Par oceanediana dans le forum Access
    Réponses: 7
    Dernier message: 26/07/2006, 07h03

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo