IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Statistiques, Data Mining et Data Science Discussion :

Coéfficient de détermination R²


Sujet :

Statistiques, Data Mining et Data Science

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Membre confirmé
    Profil pro
    Inscrit en
    Février 2007
    Messages
    182
    Détails du profil
    Informations personnelles :
    Localisation : France, Paris (Île de France)

    Informations forums :
    Inscription : Février 2007
    Messages : 182
    Par défaut Coéfficient de détermination R²
    Salut tout le monde,

    J'ai un gros problème de terminlologie avec ce qu'on appelle la variance expliquée, ou variance inter-classes, ou coéfficient de détermination et qui s'écrit (d'après une formule trouvée sur le net) :
    R² = variance expliquée / variance totale.

    Problème : j'ai un article ou l'auteur appelle R² 'variance expliquée' et après avoir cherché sur le net à plusieurs reprises, je n'arrive pas à cerner la chose : peut-on appeller R² coéfficient de détermination ET variance expliquée ? il y a quelque chose qui m'échappe la....

    merci de votre aide
    Gian
    PS : peut-etre est-ce parce que variance expliquée ou coéfficient de détermination, les deux restent un rapport de variance ?

  2. #2
    Membre émérite
    Avatar de ol9245
    Homme Profil pro
    Chercheur
    Inscrit en
    Avril 2007
    Messages
    985
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 63
    Localisation : France, Hérault (Languedoc Roussillon)

    Informations professionnelles :
    Activité : Chercheur

    Informations forums :
    Inscription : Avril 2007
    Messages : 985
    Billets dans le blog
    1
    Par défaut
    Bjr,

    la variance expliquée, tout comme les coefficients de corrélation etc, sont des notions issues de l'algèbre linéaire :

    Observation = Modèle + résidu

    Le modèle peut être nimporte quoi (modèle généralisé) mais le plus souvent un modèle linéaire et, pourquoi pas, une simple droite de régression. Tout cela n'est pas important.

    en modèle de variance, ça s'écrit :
    Var(observations) = var(Modèle + résidu)
    en développant :
    Var(observations) = var(Modèle) + var(résidu) + 2* covariance (modèle,résidu).

    Le principe de résolution des modèles dit "aux moindre carrés" garantit que le modèle a "absorbé" le maximum de variance possible et que, par conséquent, la covariance modèle-résidu est nulle. Dans ce cas, après résolution du modèle, on a :

    Var(observations) = var(Modèle) + var(résidu)

    et la qualité du modèle s'exprime par son aptitude à "capter" le maximum de variance possible :

    r2 = var(Modèle) / Var(observations)

    OL

  3. #3
    Membre averti
    Profil pro
    Inscrit en
    Avril 2007
    Messages
    52
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Avril 2007
    Messages : 52
    Par défaut différence entre coefficient de determination et coefficient de correlation
    Bonjour,

    je reviens sur ce sujet qui a été répondu il y a longtemps parce que j'aimerai bien connaitre la ddifférence entre le coefficient de détermination r² et le coefficient de correlation r.

    Est ce que le premier est tout simplement le carré du second? D'après les formules pour obtenir ces coefficients, je dirai non, mais peut être je me trompe

    Merci

  4. #4
    Membre expérimenté


    Profil pro
    Inscrit en
    Septembre 2006
    Messages
    3 176
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Septembre 2006
    Messages : 3 176
    Par défaut
    Bonjour,
    Le coefficient du R² représente la qualité de la régression et est égale au carré du coefficient de corrélation. Même si au premier abord ces équations semblent différénte c'est bien la cas.
    Il existe bien évidemment une démonstration un peu longuette mais assez simple.
    Les balises code
    FAQ SAS
    Rubrique SAS

    Si vous souhaitez contribuer à la rubrique SAS, contactez-moi ou tout autre membre de l'équipe BI par MP.

  5. #5
    Membre confirmé
    Profil pro
    Inscrit en
    Avril 2007
    Messages
    92
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Avril 2007
    Messages : 92
    Par défaut
    Salut

    Avant tout, le R² n'est en aucune sorte semblable au R (corrélation) et surtout pas son carré.

    Parlant intuitivement le R exprime une corrélation entre 2 variables.
    Le R² exprime la relation entre deux ensemblent de varibles généralement un ensemble input et un ensemble outpout.

    Je donne quelque exemple de R² en partiques:
    1) la relation entre les entrées et les sorties d'une usines. On suppose qu'on a un ensemble d'observations et qu'on a trouvé des relations approchés du genre y_i=somme (a1_ij * x_j) où les y_i sont les outputs et les x_j les inputs. ce genre de relation s'appelle relation de cointegration
    Cette relation n'est pas déterministe donc il y a une erreur qui est du par exemple aux déchés qu'on ne peux pas quantifiés, au fait qu'il y a un quart d'heure lors de la production (décalage horaire) et d'autre facteurs qu'on ne controle pas. L'information expliquée par la relation ainci trouvé n'est jamais totale, on la note par R² et elle est forcémént inférieur à 1. Mainteant on doit avoir un minimum de R² pour valider cette relation. Un R² de 0.75 peut etre largement suffisant dans un cas et pas dans d'autres.

    2) En analyse de donnée aussi on définit le R² qui quantifie l'information restante. Par exemple si nous partant d'un ensemble d'individus ayant différent revenus et de l'ensemble de produits consommé par ces individus. l'ACP (analyse en composantes principales) donne des axes de consommations qui sont obtenus en utilisant les informations qu'on a sur la relation individu-consommation. Supposant qu'on a obtenu un axes interprété par produit de première nécessité (lait, ..) et que indépendamment du revenu de l'individu on a la meme consommation pour tout bien de cet axe. Maintenant nous voulons voir si cette interprétation est valide ou pas donc on calcule le R² qui relie dans ce cas les biens aux axes. Un R² de 0.8 exprime que sur l'ensemble de départ notre constat est valide (0.75 est un R² très satisfesant en analyse de donnée).

    Bref voilà le R² exprime le degré de validité de la relation dérivée des données dans un cas où on est loin d'etre déterministe (l'erreur existe)

  6. #6
    Membre averti
    Profil pro
    Inscrit en
    Avril 2007
    Messages
    52
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Avril 2007
    Messages : 52
    Par défaut
    salut à tous et particulièrement à RO_student

    Moi je n'arrive plus à suivre la discussion surtout avec tes affirmations qui s'opposent à tout ce qui a été précdemment dit

    Je suis d'accord que le r² permet de traduire la variance expliquée du modèle. D'après mes recherches, tous les auteurs s'accordent pour dire que le coef de détermination r² est égal au carré du coef de correlation. Peux-tu me donner quelques références pour m'éclairer un peu plus

    Merci

Discussions similaires

  1. Déterminer la Valeur la plus grande dans une table
    Par arnaud_verlaine dans le forum Langage SQL
    Réponses: 9
    Dernier message: 22/08/2014, 23h35
  2. Déterminer le CPUID
    Par ZuZu dans le forum Assembleur
    Réponses: 9
    Dernier message: 21/05/2008, 13h09
  3. Réponses: 5
    Dernier message: 25/03/2003, 17h27
  4. déterminer la version de Winsock installée
    Par BlueX_scf dans le forum Web & réseau
    Réponses: 7
    Dernier message: 24/02/2003, 10h23
  5. Déterminer l'adresse d'une application en mémoire
    Par Gib dans le forum x86 32-bits / 64-bits
    Réponses: 9
    Dernier message: 11/06/2002, 14h27

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo