Bonjour à tous
J'ai une base de données commençant au 01/01/1995 d'assurés dont certains sont en état d'invalidité. J'ai envie de calibrer la loi de survie de la population en invalidité.
Cependant, je ne peux utiliser les données des personnes en invalidité entre 1995 et 2000 (entrés et sortis sur la période) car mes données ne sont pas fiables, je les exclue.
Je commence donc mon étude au 01/01/2000 mais par contre je veux garder les personnes invalides à cet date (entrés avant et toujours vivantes au 01/01/2000).
Je regarde la durée survécu en invalidité en tenant compte de la durée déjà survécu avant le début de mon étude :
- pour les assurés qui rentrent en invalidité après 01-01-2000 et quelque soit la date, je considère une durée à l'entrée nulle et j'observe leur sortie (pour décès ou censure)
- pour les assurés qui sont déjà en invalidité au 01-01-2000, je considère leur durée dans l'état d'invalidité au 01-01-2000 et je fais en sorte qu'ils intègrent mon exposition à risque uniquement quand la durée d'observation est supérieure à leur durée dans l'état.
Pour moi, il s'agit d'entrée retardées: pour ceux qui rentrent après le début de l'étude, le fait de les faire commencer en 0 et d'observer la durée permet de capter leur durée de vie et fait l'hypothèse d'une stabilité du risque dans le temps.
Pour ceux déjà en invalidité à l'entrée, le fait de les intégrer dans le risk set à l'instant T (qui est leur durée déjà écoulée dans l'état) permet d'impacter la bonne durée écoulé lors d'un événement (par exemple pour un assuré qui rentre au 15/06/1996 et qui décède au 15/01/2000, je veux que ce décès impacte la durée de survie de la 4eme année et non de la première année si mon observation commence en 2000).
Est ce que ma méthode est OK ? ou y a t-il un biais qui peut être corrigé ?
Merci d'avance
Actaman
Partager