Bonjour,
Nous travaillons sur une base de données sur les mares d'un territoire. Nous avons 297 mares d'inventoriées. Le tableau de base, comprend 27 variables. Avec toutes les données récoltées, nous voulons réalisées des analyses multivariées et notamment une ACM pour voir si une typologie des mares se dégage avec toutes les valeurs récoltées. Pour cela nous avons commencé par homogénéiser toutes nos données en variables qualitatives. Ensuite nous avons fait un diagramme des valeurs propres afin de voir quels sont les axes qui ont le plus d'informations et nous en avons 3 qui contiennent 36% de l'information. Mais le problème est que le premier axe comprend 4 variables discriminantes "le contexte de la mare, le régime hydrologique, la profondeur et le stade d'évolution". Le 2ème comporte la surface en eau libre de la mare et la nature du fond de la mare. Le 3eme comporte seulement et encore le contexte de la mare. Afin de régler ce problème de variables qui reviennent plusieurs fois, nous avons voulu faire un test de corrélation de nos variables pour voir celles qui étaient les plus importantes, mais nous avons des variables qualitatives et le test de corrélation ne se fait qu'avec des variables quantitatives. Auriez-vous une solution pour savoir comment choisir les variables à prendre en compte et comment représenter les 3 axes sur une ACM ?
Nous avons essayé le cercle des corrélations pour voir quelles sont les variables que nous pourrions supprimer, mais certaines étiquettes apparaissent deux fois, comme "contexte.bois" et une autre "contexte.bois.." avec deux petits points. Or, nous avons vérifié que toutes les modalités soient marquées de la même manière. Auriez-vous une explication ?
J'espère que nous avons été clairs, merci d'avance.
Bien cordialement.
Partager