Bonjour,
Je veux faire une prédiction via une régression logistique, pour cela j'ai divisé ma dataframe en Training et testing.
Puis j'ai appliqué une régression GLM sur la partie testing (80% de la base), mais les résultats sont un peux choquants pour moi.
Toutes les variables ne sont pas significatives!!??
Voici le script que j'ai utilisé :

Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
library(caTools)
split=sample.split(data,SplitRatio = 0.80)
split
training=subset(data,split=="TRUE")
testing=subset(data,split=="FALSE")
model=glm(diag~., training, family = binomial(link = logit))
summary(model)
Est-ce que quelqu'un parmi vous pourra m'aider svp??