Bonjour,

J'aimerais faire un Regroupement Hiérarchique sur les résultats d'une ACM, mais j'ai un problème de RAM.
Je pense que je m'y prends mal, voici ma procédure sur un dataset de 100000 observation et de 30 variables (un email et 29 variables qualitatives, chaque variable qualitative a 4 classes : 0,1,2 et 3)

Premièrement, je charge ma librairie et mes datas :

Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
library(FactoMineR) 
mydata = read.csv("/home/tom/Desktop/ACM/acm.csv")
Je précise que mes variables sont qualitatives (à l'exception de email) :

Code : Sélectionner tout - Visualiser dans une fenêtre à part
for(n in 1:length(mydata)){mydata[[n]] <- factor(mydata[[n]])}
Je supprime la variable email :

Je lance mon ACM sur ce dataset :

Code : Sélectionner tout - Visualiser dans une fenêtre à part
mca.res <- MCA(mydata2)
Je fais mes clusters sur les résultats de l'ACM :

Code : Sélectionner tout - Visualiser dans une fenêtre à part
res.hcpc <- HCPC(mca.res)
Mais j'obtiens le message d'erreur suivant :

Code : Sélectionner tout - Visualiser dans une fenêtre à part
Error: cannot allocate vector of size 38.6 Gb
Est-ce que vous pensez que je m'y prends bien et que simplement le dataframe est trop gros ? (ce qui me semble assez bizarre)

Merci pour votre aide et vos réponses