Bonjour,
Je veux faire une prédiction via une régression logistique, pour cela j'ai divisé ma dataframe en Training et testing.
Puis j'ai appliqué une régression GLM sur la partie testing (80% de la base), mais les résultats sont un peux choquants pour moi.
Toutes les variables ne sont pas significatives!!??
Voici le script que j'ai utilisé :
Est-ce que quelqu'un parmi vous pourra m'aider svp??
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7 library(caTools) split=sample.split(data,SplitRatio = 0.80) split training=subset(data,split=="TRUE") testing=subset(data,split=="FALSE") model=glm(diag~., training, family = binomial(link = logit)) summary(model)
Partager