salut;
est ce que quelqu'un peut m'aider! j'ai un problème avc la construction de medel logistique de la prédiction de la survie
voici la question
Construisez un échantillon d’apprentissage (80%) et de validation (20%). Comparez les caractéristiques de ces deux échantillons.
Construisez un modèle logistique sur l’échantillon d’apprentissage permettant de prédire la survie à 24 mois en fonction de la dose de radiothérapie reçue (eqd2), de l’âge, du BMI et de la fraction d’éjection ventriculaire.
Faites une représentation graphique (courbe ROC)
voila ce que j'ai fait mais ça me pareil c'est pas la bonne réponse

Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
s=sample(1:548,467,replace=FALSE) 
v=setdiff(c(1:548),s) 
length(s)
length(v)
train=x[s,]
test=x[v,]
dim(test) 
dim(train)
summary(train)
summary(test)
 
 
mod1=glm(deadstat~eqd2+age+bmi+fev1pc_t0,data=train[which(train$survmonth>="24"),],family="binomial")
p_estimated_train=predict(mod1,type="response")
p_estimated_test=predict(mod1,newdata=test,type="response")
roc(test$deadstat,p_estimated_test)
 
length(p_estimated_train)
length(p_estimated_test)
head(p_estimated_train)
head(p_estimated_test)
tail(p_estimated_train)
tail(p_estimated_test)
 
 
library(pROC)
roc(test$deadstat,p_estimated_test)
plot(roc(test$deadstat,p_estimated_test),xlab="spécificité",ylab="sensibilité",main="courbe ROC")