Bonjour,
Je réalise actuellement une proc logistic sur une base contenant une dizaine de variables (âge de l'individu, sexe de l'individu, durée du prêt, capital emprunté, taux du pret, localisation, etc.) et environ 500 000 lignes.
Le but ici est d'estimer la probabilité de décès mensuelle moyenne des individus présentant les mêmes caractéristiques. Je dispose d'une variable sinistre binaire; 0 lorsque l'individu ne meurt pas sur la durée de son prêt, 1 sinon.
Le code suivant permet d'obtenir la probabilité de décès moyenne des individus présentant les mêmes modalités pour les variables explicatives retenues dans mon modèle:
Code sas : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5 proc logistic data = mabase descending; class age (ref="[age1;age2[") sexe(ref="M") duree(ref="[duree_mens1;duree_mens2[") capital(ref="[tranche1;tranche2[") taux(ref="[taux1;taux2[") localisation(ref="localisation1") var_suivantes(ref="var_suivantes1") /param=ref; model sinistre = age sexe duree capital taux localisation var_suivantes; output out=tab pp=p; run;
Le souci c'est que je ne sais pas comment intégrer la dimension mensuelle à mon modèle. Est ce que l'option weight permet de pallier à ce problème ?
Code sas : Sélectionner tout - Visualiser dans une fenêtre à part WEIGHT duree_pret;
La durée du prêt étant toujours mensuelle.
Si oui, comment interpréter la probabilité obtenue avec la régression logistique?
Si non, comment pourrais-je faire selon vous ?
Je ne sais pas trop comment m'orienter et je reconnais qu'il est assez urgent que je trouve une solution donc toute aide ou idée est vraiment la bienvenue.
Merci !
Partager