-
ACM sous le logiciel R
Bonjour,
Nous travaillons sur une base de données sur les mares d'un territoire. Nous avons 297 mares d'inventoriées. Le tableau de base, comprend 27 variables. Avec toutes les données récoltées, nous voulons réalisées des analyses multivariées et notamment une ACM pour voir si une typologie des mares se dégage avec toutes les valeurs récoltées. Pour cela nous avons commencé par homogénéiser toutes nos données en variables qualitatives. Ensuite nous avons fait un diagramme des valeurs propres afin de voir quels sont les axes qui ont le plus d'informations et nous en avons 3 qui contiennent 36% de l'information. Mais le problème est que le premier axe comprend 4 variables discriminantes "le contexte de la mare, le régime hydrologique, la profondeur et le stade d'évolution". Le 2ème comporte la surface en eau libre de la mare et la nature du fond de la mare. Le 3eme comporte seulement et encore le contexte de la mare. Afin de régler ce problème de variables qui reviennent plusieurs fois, nous avons voulu faire un test de corrélation de nos variables pour voir celles qui étaient les plus importantes, mais nous avons des variables qualitatives et le test de corrélation ne se fait qu'avec des variables quantitatives. Auriez-vous une solution pour savoir comment choisir les variables à prendre en compte et comment représenter les 3 axes sur une ACM ?
Nous avons essayé le cercle des corrélations pour voir quelles sont les variables que nous pourrions supprimer, mais certaines étiquettes apparaissent deux fois, comme "contexte.bois" et une autre "contexte.bois.." avec deux petits points. Or, nous avons vérifié que toutes les modalités soient marquées de la même manière. Auriez-vous une explication ?
J'espère que nous avons été clairs, merci d'avance.
Bien cordialement.
-
première question : quel est le package utilisé et les fonctions utilisées de ce package ?
deuxième question : que signifie 'le Xième axe comprend' suivi d'une variable ou d'une liste de variable ?
troisième question : pourquoi parler de variables discriminantes ? L'objectif d'une ACM n'a jamais été d'effectuer une analyse discriminante.
Quant aux "contexte.bois" et autres "contexte.bois..", cela fait penser à un problème de lecture d'un fichier texte de type csv avec de temps en temps une virgule (ou autre séparateur de colonne) suivant directement l'étiquette et de temps en temps un blanc (ou plusieurs) entre le dernier caractère de l'étiquette et le séparateur de colonne.