IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

R Discussion :

calculer corrélation entres multiples variables sur R


Sujet :

R

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Membre averti
    Femme Profil pro
    Étudiant
    Inscrit en
    Septembre 2018
    Messages
    44
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Localisation : Allemagne

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Septembre 2018
    Messages : 44
    Par défaut calculer corrélation entres multiples variables sur R
    Bonjour,


    je suis nouvelle sur R j'ai une question sur le calcule de corrélation entres plusieurs variables dans un tableau excel , je sais comment importer le fichiers ,

    ma question c'est quel méthode suivre pour calculer la corrélation entres plusieurs variables et présenter ça sur un graphique

    je cherche une méthode simple vraiment

    merci

  2. #2
    Membre averti
    Femme Profil pro
    Consultant CRM
    Inscrit en
    Août 2019
    Messages
    17
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Localisation : France, Yvelines (Île de France)

    Informations professionnelles :
    Activité : Consultant CRM
    Secteur : Conseil

    Informations forums :
    Inscription : Août 2019
    Messages : 17
    Par défaut
    Bonjour,

    Ce n'est pas vraiement ce que je fais en ce moment mais j'ai chercher pour toi voici une methode avec un nuage de point qui presente un exemple entier.

    https://mathsp.tuxfamily.org/spip.php?article293$


    j'espère que ça peut t'aider!

  3. #3
    Membre expérimenté
    Homme Profil pro
    Data scientist
    Inscrit en
    Février 2017
    Messages
    211
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Data scientist
    Secteur : Conseil

    Informations forums :
    Inscription : Février 2017
    Messages : 211
    Par défaut
    Hello,

    tu peux utiliser le package corrplot

    voilà un exemple :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
     
    install.packages("corrplot") #installer si pas installer
    library(corrplot)
    corrplot(mcor, type="upper", order="hclust", tl.col="black", tl.srt=45)

  4. #4
    Membre averti
    Femme Profil pro
    Étudiant
    Inscrit en
    Septembre 2018
    Messages
    44
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Localisation : Allemagne

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Septembre 2018
    Messages : 44
    Par défaut
    Bonjour ,

    j'ai utilisé la matrice de corrélation comme ça voilà code :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    > M<-cor(Donn2[,-1])
    > M
                              Litrage produit Rapportinjection      Format Nbre passage eau
    Litrage produit                 1.0000000       0.20415852  0.27658465       0.67426686
    Rapportinjection                0.2041585       1.00000000 -0.12380173       0.31795429
    Format                          0.2765846      -0.12380173  1.00000000      -0.05253294
    Nbre passage eau                0.6742669       0.31795429 -0.05253294       1.00000000
    Pertes totales PF(%)           -0.5233907      -0.07581707 -0.52733899      -0.22555675
    Pertes PF secteur 3 (eur)              NA               NA          NA               NA
    Coût pertes Secteur 3 (L)       0.6742669       0.31795429 -0.05253294       1.00000000
                              Pertes totales PF(%) Pertes PF secteur 3 (eur) Coût pertes Secteur 3 (L)
    Litrage produit                    -0.52339068                        NA                0.67426686
    Rapportinjection                   -0.07581707                        NA                0.31795429
    Format                             -0.52733899                        NA               -0.05253294
    Nbre passage eau                   -0.22555675                        NA                1.00000000
    Pertes totales PF(%)                1.00000000                        NA               -0.22555675
    Pertes PF secteur 3 (eur)                   NA                         1                        NA
    Coût pertes Secteur 3 (L)          -0.22555675                        NA                1.00000000
    mais y'a un problème ce que le variable perte en euro s'affiche en NA avec tous les autres variables

    et après j'ai utilisé corrplot pour représenter la corrélation entre les variables et voilà ce qui me donne :

    Nom : Rplot01.png
Affichages : 510
Taille : 14,3 Ko

    Je ne comprends pas pourquoi j'ai ce problème de NA ?

    Si vous avez des idées merci



    Comment on peut interpréter le corrélogramme ? La couleur bleu veut dire le degré de corrélation entre les variables et couleur rouge que les variables sont pas corrélées c'est ça ?

    et aussi quand j'ai utilisé order = "hclust" ça me donne un Error :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    > corrplot(M, type="upper", order="hclust", tl.col="black", tl.srt=45)
    Error in hclust(as.dist(1 - corr), method = hclust.method) : 
      NA/NaN/Inf in foreign function call (arg 11)
    cette erreur je pense c'est parce que j'ai des NAN comment résoudre ce problème ?

  5. #5
    Membre averti
    Femme Profil pro
    Consultant CRM
    Inscrit en
    Août 2019
    Messages
    17
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Localisation : France, Yvelines (Île de France)

    Informations professionnelles :
    Activité : Consultant CRM
    Secteur : Conseil

    Informations forums :
    Inscription : Août 2019
    Messages : 17
    Par défaut
    Bonjour,

    peut être en remplaçant les NA par 0 à tester si c'est pas encore fait.

    bonne journée

  6. #6
    Membre émérite
    Homme Profil pro
    Chercheur
    Inscrit en
    Décembre 2015
    Messages
    327
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Haute Garonne (Midi Pyrénées)

    Informations professionnelles :
    Activité : Chercheur
    Secteur : Enseignement

    Informations forums :
    Inscription : Décembre 2015
    Messages : 327
    Par défaut
    Les NA proviennent certainement de données manquantes dans la data.frame d'origine Donn2. Donc deux solutions, soit modifier l'argument use de la fonction cor (use="complete.obs", ce qui supprime les lignes où il manque des données, soit supprimer les colonnes où il y a des NA,ce qui permet de calculer les corrélations pour tous les individus.

    La couleur bleu veut dire le degré de corrélation entre les variables et couleur rouge que les variables sont pas corrélées c'est ça ?
    Comment alors interpréter des gros et des petits ronds rouges ? De plus, la signification des couleurs est données par l'échelle de couleur à droite de la matrice.

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Corrélations entre plusieurs variables
    Par Dideal18 dans le forum MATLAB
    Réponses: 1
    Dernier message: 24/09/2013, 09h01
  2. Réponses: 4
    Dernier message: 07/08/2012, 20h51
  3. Réponses: 0
    Dernier message: 14/03/2012, 17h08
  4. Corrélation entre deux variables
    Par RM2006 dans le forum MATLAB
    Réponses: 2
    Dernier message: 08/01/2009, 17h43
  5. Calcul durée entre 2 variables
    Par MOUSQUETAIRE32 dans le forum Débuter
    Réponses: 3
    Dernier message: 02/12/2008, 01h12

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo