Bonjour,
J'ai une table qui contient des observations, certaines sont manquantes et d'autres renseignées. Ces observations sont classées par ordre chronologique.
Je voudrais créer une variable qui m'indique toutes les observations bornées par la première observation renseignée et la dernière, pour chaque identifiant.
La difficulté est que la dernière observations n'est pas forcément celle qui est suivie d'une valeur manquante ou du nouvel identifiant. Un exemple pour clarifier les choses:
Voici à quoi ressemble la table en entrée:
Année ID valeur
1998 1 .
1999 1 .
2000 1 2
2001 1 3
2002 1 4
2003 1 5
2004 1 .
1998 2 1
1999 2 .
2000 2 2
2001 2 .
2002 2 4
2003 2 5
2004 2 .
J'aimerais en résultat obtenir une table de la forme:
Année ID valeur tag
1998 1 . 0
1999 1 . 0
2000 1 2 1
2001 1 3 1
2002 1 4 1
2003 1 5 1
2004 1 . 0
1998 2 1 1
1999 2 . 1
2000 2 2 1
2001 2 . 1
2002 2 4 1
2003 2 5 1
2004 2 . 0
En fait, je souhaite imputer des valeurs aux seules observations qui sont "encadrées" par des observations renseignées.
En gros, je suppose que la première fois qu’apparaît une observation pour un individu son activité démarre, la dernière fois
sont activité s'éteint et entre les deux, c'est un problème de report des données que je vais imputer. En dehors, c'est des "vraies" valeurs manquantes qu'il faut conserver telle quelle.
Merci par avance
Partager