Bonjour (ou bonsoir)

Je travaille sur un petit projet. Je dispose de trois jeux de données : train.csv, test.csv et output.csv.

Les tailles de ces fichiers sont énormes : dim(data_train)= [13000,200] = dim(data_output) (on verra plus tard pour data_test)

J'ai une petite question : est-ce que je dois faire baisser le nombre des observations ? Car 13000 c'est trop, beaucoup...
Si oui je vais appliquer l'ACP (ou d'autres méthodes..)

Pour commencer, je dois faire ceci :

Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
# transformer en séries temporelles :
s <- ts(data_train)
?

Merci infiniment