PCA{FactoMineR} Cercle des corrélations

**CupOfAppleTea** · 04/03/2013, 17h54

Bonjour,
J'ai fait une ACP avec la fonction PCA du package FactoMineR et sur le graphe de sortie je n'obtiens pas de cercle de corrélation. Seulement mes variables placées selon les 2 premiers axes de mon ACP, mais pas de cercle (cf. pièce jointe).

Voici mon code :

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
a=read.table("totaldata2.txt",header=TRUE)
z=PCA(a[,-c(1)],graph=T,scale.unit=F,quali.sup=1:3)

Comment puis-je obtenir le cercle des corrélation?
Merci de votre aide!

**arm3366** · 05/03/2013, 09h29

Bonjour,

Je pense que tu devrais avoir une liste

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

listeVAR <- z$var

contenant toutes les informations sur les variables actives.

BC

**CupOfAppleTea** · 05/03/2013, 11h42

Il y a bien la commande:

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

$var$cor

Mais je ne comprends pas la sortie de cette commande. En voici le début:

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
5
6
> z$var$cor
          Dim.1         Dim.2         Dim.3         Dim.4         Dim.5
X400  0.7044234  0.6972447666  0.0032425827 -0.0918712633 -2.074036e-02
X401  0.6999258  0.7021095505  0.0016827976 -0.0860622901 -1.164070e-02
X402  0.7029790  0.6995144310  0.0016878852 -0.0835322014 -1.525771e-02
X403  0.7039987  0.6977874328  0.0046004261 -0.0862880234 -1.492602e-02

X400, X401, X402, X403 sont mes 4 premières variables.

De plus, j'aurais souhaité obtenir quelque chose de visuel. Mais peut-être n'est ce pas possible avec la fonction "PCA".

**arm3366** · 05/03/2013, 12h37

Mais je ne comprends pas la sortie de cette commande. En voici le début:

1 Si vous lisez cette table par ligne vous aurez:
correllation(X400, DIM)= 0.7044234, correlation(X400, DIM2)=0.6972447666, ...
2 Si vous la lisez par colonne: la première colonne correspondra aux corrélations entre tes variables et la première composante DIM1.

De plus, j'aurais souhaité obtenir quelque chose de visuel. Mais peut-être n'est ce pas possible avec la fonction "PCA".

Le graphique du cercle de corrélation, vous obtenez en même temps que le graphique des individus, dés que vous appelez la fonction PCA.

exemple

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
 
library(FactoMineR)
data(decathlon)
res.pca <- PCA(decathlon, quanti.sup = 11:12, quali.sup=13)

**CupOfAppleTea** · 05/03/2013, 12h46

C'est justement là tout mon problème, lorsque je rentre la ligne de code suivante:

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

z=PCA(a[,-c(1)],graph=T,ncp=5,scale.unit=F,quali.sup=1:3)

Je n'obtiens pas directement le cercle des corrélations mais simplement le graphe que je vous ai mis en pièce jointe. J'ai bien essayé ces lignes :

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
library(FactoMineR)
data(decathlon)
res.pca <- PCA(decathlon, quanti.sup = 11:12, quali.sup=13)

Et en effet, là j'obtiens le cercle des corrélations sur le graphe. D'où ma question : pourquoi dans le cas des données fournies avec la fonction PCA j'obtiens ce cercle alors qu'avec mes données non??? Je ne comprends pas.

J'ai réussi à le retrouver via la fonction "s.corcircle" du package "ade4" mais le résultat n'est pas aussi "sympa" (cf. pièce jointe).

**arm3366** · 05/03/2013, 13h30

Peut être qu'il faudrait plus regarder la structure de vos données. Sinon, sur ce lien vous avez une très bonne documention sur l'utilisation du package FactoMineR et sur celui-ci quelques idées pour l’interprétation de l'ACP.

BC

**CupOfAppleTea** · 05/03/2013, 16h08

Alors en fait le cercle des corrélations n'apparait pas sur la figure de sortie du fait de cette partie du code :

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

scale.unit=F

Lorsque je mets "True" et que toutes les variables sont centrées réduites, le cercle des corrélations apparait sur le graphe, soit:

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

z=PCA(a[,-c(1)],graph=T,ncp=5,scale.unit=T,quali.sup=1:3)

Ce qui ne m'arrange pas car toutes mes variables ont la même unité! Y-a-t'il un moyen de le faire comprendre à la fonction PCA?

**torquemada** · 23/10/2015, 12h19

Bonjour,
Un peu tard mais cela peut tjrs servir
J'ai eu le même pb aujourd'hui

Une solution semble être d'utiliser le menu déroulant de factominer

**Lebou NDIAYE** · 15/03/2018, 11h42

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
5
projet1=read.table(file.choose(), header=T, sep=";",row.names = 1)
projet1
# ON CHARGE LE PACKAGE FACTOMINER
library(FactoMineR)
cv=PCA(projet1)

Ca affiche l'erreur suivante :

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
"Error in get(getOption("device"))(width = min(14, 8 * (xmax - xmin)/(ymax -  : 
  unused arguments (width = min(14, 8 * (xmax - xmin)/(ymax - ymin)), height = 8)"

**faubry** · 15/03/2018, 22h35

scale.unit=FALSE signifie qu'on analyse une matrice de variance/covariance et non une matrice de corrélation. En conséquence, scale.unit=FALSE ne peut pas garantir que la norme des vecteurs-variables est l'unité dans l'espace N-dimensionnel où N est le nombre de variables, donc ne peut pas non plus garantir que la projection de ces vecteurs-variables sur le plan représenté dans le plot (souvent le plan dimension 1 x dimension 2) ne dépasse pas le cercle de rayon unité. Par contre scale.unit=TRUE projette toujours ces vecteurs à l'intérieur du cercle de corrélation qui est un cercle de rayon unité. Dans ce cas, le tracé de ce cercle et la position des vecteurs dans ce cercle a un sens, sens que cela n'a pas avec scale.unit=FALSE. En effet,avac scale.unit=TRUE, les variables projetées sur le cercle de corrélation sont celles qui sont intégralement dans ce plan et donc orthogonales aux autres dimensions.

De manière informelle, scale.unit=TRUE permet d'analyser l'information commune entre paires de variables indépendamment de l'amplitude des variables en les transformant en unités arbitraires de dispersion ou en d'autres termes à combien d'unités de dispersion d'une variable correspond une unité de dispersion de l'autre - tandis que scale.unit=FALSE analyse ce qu'une variable apporte sur l'autre en terme d'amplitude ou à combien d'unités réelles d'une variable correspond une unité réelle de l'autre (par exemple à combien de cm correspond une variation d'un an pour scale.unit=FALSE tandis que pour scale.unit=TRUE, ce sera à combien de cm / sd(cm) correspond une variation de un an/sd(an) ou sd(x) est la déviation standard de la variable x dans mes données).

**Lebou NDIAYE** · 20/03/2018, 12h42

Envoyé par faubry

scale.unit=FALSE signifie qu'on analyse une matrice de variance/covariance et non une matrice de corrélation. En conséquence, scale.unit=FALSE ne peut pas garantir que la norme des vecteurs-variables est l'unité dans l'espace N-dimensionnel où N est le nombre de variables, donc ne peut pas non plus garantir que la projection de ces vecteurs-variables sur le plan représenté dans le plot (souvent le plan dimension 1 x dimension 2) ne dépasse pas le cercle de rayon unité. Par contre scale.unit=TRUE projette toujours ces vecteurs à l'intérieur du cercle de corrélation qui est un cercle de rayon unité. Dans ce cas, le tracé de ce cercle et la position des vecteurs dans ce cercle a un sens, sens que cela n'a pas avec scale.unit=FALSE. En effet,avac scale.unit=TRUE, les variables projetées sur le cercle de corrélation sont celles qui sont intégralement dans ce plan et donc orthogonales aux autres dimensions.

De manière informelle, scale.unit=TRUE permet d'analyser l'information commune entre paires de variables indépendamment de l'amplitude des variables en les transformant en unités arbitraires de dispersion ou en d'autres termes à combien d'unités de dispersion d'une variable correspond une unité de dispersion de l'autre - tandis que scale.unit=FALSE analyse ce qu'une variable apporte sur l'autre en terme d'amplitude ou à combien d'unités réelles d'une variable correspond une unité réelle de l'autre (par exemple à combien de cm correspond une variation d'un an pour scale.unit=FALSE tandis que pour scale.unit=TRUE, ce sera à combien de cm / sd(cm) correspond une variation de un an/sd(an) ou sd(x) est la déviation standard de la variable x dans mes données).

PCA{FactoMineR} Cercle des corrélations

R

Discussions similaires

Partager

Partager