régression linéaire: variable retardée
Bonjour tout le monde,
je veux créer une variable retardé (-3), sur une variable quantitative. Un extrait de ma dataframe:
heure |
nombre clients |
00:00 |
50 |
00:30 |
80 |
01:00 |
100 |
01:30 |
70 |
02:00 |
30 |
02:30 |
200 |
03:00 |
60 |
03:30 |
210 |
je veux avoir ça:
Heure |
Nombre clients |
Nombre clients 1 |
Nombre clients 2 |
Nombre clients 3 |
00:00 |
50 |
. |
. |
. |
00:30 |
80 |
130 |
. |
. |
01:00 |
100 |
180 |
230 |
. |
01:30 |
70 |
170 |
250 |
300 |
02:00 |
30 |
100 |
200 |
280 |
02:30 |
200 |
230 |
300 |
400 |
03:00 |
60 |
260 |
290 |
360 |
03:30 |
210 |
270 |
410 |
440 |
Je ne sais pas si c'est claire, en fait le but est dire qu'à chaque fois que le flux de des clients de 00:00 s'étalent sur une heure et demie, donc ils vont être comptabiliser à 00:00, à 00:30 et à 01:00 tout en comptabilisant le flux initial de l'heure en question donc à 00:30 c'est 50+80.
Voila ce que j'ai essayé comme code:
Code:
1 2 3
| Nombre clients 1= lag(tab$Nombre clients, -1)
Nombre clients 2= lag(tab$Nombre clients, -2)
Nombre clients 3= lag(tab$Nombre clients, -3) |
mais ça me donne ça:
Heure |
Nombre clients |
Nombre clients 1 |
Nombre clients 2 |
Nombre clients 3 |
00:00 |
50 |
50 |
50 |
50 |
00:30 |
80 |
80 |
80 |
80 |
01:00 |
100 |
100 |
100 |
100 |
01:30 |
70 |
70 |
70 |
70 |
02:00 |
30 |
30 |
30 |
30 |
02:30 |
200 |
200 |
200 |
200 |
03:00 |
60 |
60 |
60 |
60 |
03:30 |
210 |
210 |
210 |
210 |
Merci d'avance de votre aide