Bonjour,
J'aimerais faire un Regroupement Hiérarchique sur les résultats d'une ACM, mais j'ai un problème de RAM.
Je pense que je m'y prends mal, voici ma procédure sur un dataset de 100000 observation et de 30 variables (un email et 29 variables qualitatives, chaque variable qualitative a 4 classes : 0,1,2 et 3)
Premièrement, je charge ma librairie et mes datas :
1 2
| library(FactoMineR)
mydata = read.csv("/home/tom/Desktop/ACM/acm.csv") |
Je précise que mes variables sont qualitatives (à l'exception de email) :
for(n in 1:length(mydata)){mydata[[n]] <- factor(mydata[[n]])}
Je supprime la variable email :
Je lance mon ACM sur ce dataset :
Je fais mes clusters sur les résultats de l'ACM :
res.hcpc <- HCPC(mca.res)
Mais j'obtiens le message d'erreur suivant :
Error: cannot allocate vector of size 38.6 Gb
Est-ce que vous pensez que je m'y prends bien et que simplement le dataframe est trop gros ? (ce qui me semble assez bizarre)
Merci pour votre aide et vos réponses
Partager