Bonjour (ou bonsoir)
Je travaille sur un petit projet. Je dispose de trois jeux de données : train.csv, test.csv et output.csv.
Les tailles de ces fichiers sont énormes : dim(data_train)= [13000,200] = dim(data_output) (on verra plus tard pour data_test)
J'ai une petite question : est-ce que je dois faire baisser le nombre des observations ? Car 13000 c'est trop, beaucoup...
Si oui je vais appliquer l'ACP (ou d'autres méthodes..)
Pour commencer, je dois faire ceci :
?
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2 # transformer en séries temporelles : s <- ts(data_train)
Merci infiniment
Partager