Bonjour tout le monde !
Je me tourne vers vous car j'ai une panne d'inspiration concernant un problème statistique ^_^'...
Voilà mon problème :
Je dispose d'une base de données qui contient des informations sur des individus ayant saisi un dossier en ligne pour une demande de financement. Chaque ligne de cette table concerne un seul individu.
Lorsque un individu fait une demande de financement, un score calcule si son dossier est acceptable ou non en fonction des informations concernant l'individu : la variable "ACC" sera donc égale à 1 si son dossier est accepté, 0 sinon.
Sur une période de 2 mois, des centaines d'individus ont effectué des saisies chaque jour, il est donc possible de calculer un taux d'acceptation quotidien.
Forcément, chaque jour, le taux d'acceptation varie, il peut être de 58% le lundi, de 63% le mardi, ou encore 51% le vendredi.
Mon objectif est d'être capable d'expliquer les variations quotidiennes du taux d'acceptation.
Par exemple : Entre lundi et mardi, le taux d'acceptation a augmenté de 5%. A quoi cela est dû ?
Il faut que je sois capable de dire :
- 50% de cette augmentation est due au fait qu'il y a eu 15% de mariés de plus le mardi par rapport au lundi qui ont effectué des demandes de financement
- 25% de cette augmentation est due au fait qu'il y a eu 6% de cadres de plus le mardi par rapport au lundi
- etc.
En somme, je connais les informations propres à chaque individu dans la table. Je suis donc capable de calculer le taux d'acceptation quotidien, le taux de CSP+, le taux de mariés, le taux de moins de 25 ans etc...
Ca fait plusieurs que je me trifouille le cerveau, et je manque cruellement d'idées -_-...
J'ai fait une régression log-linéaire qui permet de dire que, sur l'ensemble de la période, le fait de se déclarer "CSP+" joue favorablement sur l'augmentation du taux d'acceptation, mais je n'arrive pas à expliquer les variations quotidiennes...
J'espère que vous aurez quelques idées :-P.
Merci d'avance,
Pacman301
Partager