Bonjour à tous,

voila mon problème, j'ai une base client composée d'environ 100 000 clients sur une période de 9 mois. Pour chacun d'eux j'ai plusieurs informations concernant les variables sociologiques (sexe, âge, métier...), auxquelles on rajoute des variables quantitatives concernant le nombre de produits achetés pour un mois donné, ainsi que la rémunération perçue chaque mois.
Je souhaiterai expliquer les déterminants de l'achat de produits (qui est unique en termes de caractéristiques) selon toutes ces variables. En sachant que seulement 10 500 clients procèdent à des achats sur la période, et la majorité des clients qui achètent très peu de produits mais certains achètent des quantités très importantes et plusieurs fois sur la période (écart-type supérieur à la moyenne).

j'avais dans l'idée de faire une régression logistique avec comme variable expliquée achat=1 et 0 sinon, cependant le problème est la gestion du temps (les revenus ne sont pas identique à chaque période de temps et ces derniers sont très importants pour expliquer le comportement d'achat ).Les individus qui ne font rien sont largement surreprésentés.De plus passer en panel n'est pas une bonne idée dans la mesure où très peu de clients achètent plusieurs fois sur la période mais certains le font quand même.

Je me permets de poser cette question à tout hasard, est-ce que quelqu'un aurait une idée sur la méthode statistique la plus appropriée pour étudier ce type de comportement en tenant compte des problématiques suivantes: dispersion importante de la variable dépendante, personnes qui achètent moins nombreuses que les personnes qui ne font rien, certaines personnes achètent plusieurs fois dans le mois, les revenus sont différents chaque mois.

Peut-être que quelqu'un a une idée sur le modèle le plus approprié (logit, modèle de comptage ....car là j'avoue que je suis largué avec les modèles qualitatifs