Bonsoir à tous,
Je me permet de vous questionner par rapport à un sujet sur lequel je travaille depuis bientôt 6 mois. Je possède un tableau de données de 38000 lignes x 48 colonnes : 47 explicatives et une à expliquer.
En vu d'une regression logistique, je réalise des ACM et ACP sur les données mais je ne vois pas les clés d'analyses permettant une sélectionne des variables explicatives qui pourraient jouer un rôle dans le modèle final. Je vois ai joint la représentation des variables lors d'une ACP engageant 14 des 47 variables explicatives (ma variable à expliquer en illustrative est en bleu sur la figure) et je sais pas comment sélectionner des variables plus importantes que d'autres grâce à ce graph..
J'écoute toutes vos suggestions, j'ai également pensé à réaliser des tests de corrélations
Bonne soirée.
Partager