Bonjour,
je présente mon problème :
je souhaite réaliser une régression logistique et pour ce faire j'ai réaliser des analyse univariées sur mes variables.
J'ai donc sélectionné les variables qui sont possiblement des "facteurs d'interaction".
Puis j'en arrive à l'analyse multivariée, j'ai deux question précises :
J'ai réalisé une sélection de variables en utilisant la méthode du backward selection (descendante).
Pour ce faire, j'ai éliminé une à une les variables qui avaient une trop forte p_value (tout en regardant que les coefficients - beta - ne varient pas trop).
Ma première question est la suivante : Quel est le seuil à partir duquel on juge que les coefficients estimés varient "trop" ? 0.20 ? 0.15 ? Et donc dans ce cas là, on conserve la variable qu'on souhaitait retirer même si sa p_value est très forte.

Exemple, lorsque je supprime la variable statut_tabac (qui est composé des sous-variables indicatrices tabac_1 et tabac_2) :
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
 
/*Modèle complet*/                                                                                                                                                                                             
proc logistic data=projet.Bonami;                                                                                                                                                                              
class Hta groupe_bis revasc diabete Class_SEVERITY_0_H4 ;                                                                                                                                                      
model evol_binaire(ref="1") = Hta groupe_bis revasc tabac1 tabac2 diabete Class_SEVERITY_0_H4;                                                                                                                 
test tabac1,tabac2;                                                                                                                                                                                            
run;
Nom : SAS.png
Affichages : 21
Taille : 15,3 Ko

le modèle une fois les variables tabac_1 et tabac_2 supprimées :
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
 
/* Modèle sans tabac*/                                                                                                                                                                                         
proc logistic data=projet.Bonami;                                                                                                                                                                              
class Hta groupe_bis revasc diabete Class_SEVERITY_0_H4 ;                                                                                                                                                      
model evol_binaire(ref="1") = Hta groupe_bis revasc diabete Class_SEVERITY_0_H4;                                                                                                                               
run;
Nom : SAS.png
Affichages : 20
Taille : 13,0 Ko


Puis une fois le modèle complet obtenu, je dois vérifier les interactions entre mes variables restantes ? Et là, je ne sais pas comment m'y prendre. Test de Wald ?
Est-ce que je dois tester une à une les interactions entre chaque couple de variable ? Ou est-ce que je lance le modèle complet avec les interactions et j'enlève une à une les interactions avec les plus fortes p_values ?

Je vous joins mon code :

Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
 
proc logistic data=projet.Bonami;                                                                                                                                                                              
class Hta groupe_bis revasc Class_SEVERITY_0_H4 ;                                                                                                                                                              
model evol_binaire(ref="1") = Hta groupe_bis revasc tabac1 tabac2 Class_SEVERITY_0_H4                                                                                                                          
groupe_bis*Hta groupe_bis*revasc groupe_bis*tabac1 groupe_bis*tabac2 groupe_bis*Class_SEVERITY_0_H4 ;                                                                                                          
test tabac1,tabac2;                                                                                                                                                                                            
run;
Nom : SAS.png
Affichages : 19
Taille : 23,7 Ko

Merci pour votre aide !