Bonjour à tous,

Je suis étudiant et je dois faire la prévision du 1er Novembre au 30 Novembre des recettes par cinéma pour 11 films (dont les dates de sorties sont très aléatoires, certaines en septembre d'autres en octobre, au plus 60 valeurs par film). Je suis familier avec R mais je n'avais jamais fait de times series auparavant.

On doit choisir le modèle et étant donné qu'on doit minimiser le RMSE et qu'il y ait saisonnalité et tendance j'aimerais faire un modèle ARIMA. Le lissage de Winters n'est pas possible étant donné que l'on n'a pas assez d'observations.

Je ne suis pas certain car j'ai commencé à me renseigner sur les times series d'autant plus que le modèle arima n'est efficace que pour des jeux de données avec beaucoup de valeurs.

En général, sur le graphique on remarque une tendance baissière avec saisonnalité (tous les 7 jours) mais il est très difficile de vérifier la stationnarité à cause du faible nombre de données. Je ne sais pas comment interpréter les output des tests adf (augmented dickey fuller) pour vérifier la stationnarité et le box-test de pierce.

Voici les commandes que j'ai fait sur R pour un film avec 27 observations :

Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
data=read.csv("Predictionss.csv",header=TRUE, sep=";")
attach(data)
require(forecast)
require(tseries)
require(fArma)
 
data1<-ts(logdat, start=2011.923,freq=365)
plot(data1)
 
adf.test(data1)
 
acf(data1)
pacf(data1)
 
(à faire si série non stationnaire)
ddata<-diff(data1)
ndiffdata<-length(ddata)
plot(1:ndiffdata,ddata)
=>hétérodasticité
 
adf.test(ddata)
Box.test(data1,lag=10,type="Box-Pierce")
 
auto.arima(data1,D=1)
 
model <- auto.arima(data1,d=1)
 
predict(model,n.ahead = 30,interval = c("prediction"))
 
forecast(model,,start=2011.9969)
accuracy(fcast)   
fcast<-forecast(model,h=7,start=2011.923)
summary(fcast)
plot(fcast)

=> J'ai un problème au niveau du point en gras, D=7 étant la valeur pour laquelle la saisonnalité se vérifie (tous les 7 jours on a un pic), R répond qu'il n'a pas assez de données. Donc, par défaut D=0 et donc les prévisions ne tiennent pas compte de la saisonnalité. Comment est-ce que je peux résoudre ce problème??
Comment choisir un modèle selon les résultats de l'acf et pacf??

Merci pour vos réponses.