Bonjour,
Actuellement je travaille sur un "projet". Je dispose d'un train qui contient deux variables qualitatives et plusieurs autres quantitatives (p=122, plus de 1010 observations, et oui cela demandera beaucoup de temps...) et d'un output binaire (0 et 1).
Je cherche à réduire le nombre de variables en employant des méthodes de sélection des variables (Lasso, AIC, BIC, etc) ensuite à supprimer les individus aberrants/trop influents. Mais avant de commencer, je me demande si je dois faire ceci :
ou
Code : Sélectionner tout - Visualiser dans une fenêtre à part modele <- lm(output~.,data=train)
glm puisque je suis dans le cas d'une régression logistique, n'est-ce pas ?
Code : Sélectionner tout - Visualiser dans une fenêtre à part modele <- glm(output~.,data=train,family='binomial')
Merci infiniment.
Partager