-
Taille table Rstudio
Bonjour,
J'aimerais savoir si vous aviez une idée de la taille maximale de table de données que peut gérer R ?
Est-il complètement inimaginable de penser faire tourner une "simple" régression logistique, ou encore une Random Forest, une KRLS, une SVM, une régression PLS, un algo du K-plus proches voisins sur des millions de lignes et une quinzaine de variables ? (Le but de mon étude est prédictif)
Merci d'avance
-
La longueur maximale d'un vecteur (donc le nombre de lignes maximal d'une dataframe) est égal à 2**31-1 soit plus de 2 milliards.
Possible que tu aies des dépassements de mémoire (surtout si tu es en 32 bits), mais le plus simple est d'essayer de charger ta dataframe.
Par contre je ne sais pas quel sera le temps de calcul des fonctions que tu sites, le mieux étant que tu essayes avec des subset de ta dataframe pour voir combien de temps ça prend.