Bonjour,

Actuellement je travaille sur un "projet". Je dispose d'un train qui contient deux variables qualitatives et plusieurs autres quantitatives (p=122, plus de 1010 observations, et oui cela demandera beaucoup de temps...) et d'un output binaire (0 et 1).

Je cherche à réduire le nombre de variables en employant des méthodes de sélection des variables (Lasso, AIC, BIC, etc) ensuite à supprimer les individus aberrants/trop influents. Mais avant de commencer, je me demande si je dois faire ceci :

Code : Sélectionner tout - Visualiser dans une fenêtre à part
modele <- lm(output~.,data=train)
ou

Code : Sélectionner tout - Visualiser dans une fenêtre à part
modele <- glm(output~.,data=train,family='binomial')
glm puisque je suis dans le cas d'une régression logistique, n'est-ce pas ?

Merci infiniment.