Bonsoir,
Je suis nouveau dans R, j'ai un jeu de données auquel je voudrais appliquer l'algorithme de clustering. Quelqu'un a t-il l'algorithme à appliquer sous R ?
Merci, bonne soirée.
Bonsoir,
Je suis nouveau dans R, j'ai un jeu de données auquel je voudrais appliquer l'algorithme de clustering. Quelqu'un a t-il l'algorithme à appliquer sous R ?
Merci, bonne soirée.
Bonsoir Arniisto,
Il y a différentes méthodes pour réaliser un cluster, cela dépend de ta variable "quantitative" ou "qualitative", et puis certains domaines réalisent des classifications sur la base de calculs bien déterminés comme en génétique (maximum liklelihood, Bayesian inference...) ou en écologie et en sociologie (Analyse factorielle des correspondances AFC, ou Analyse en composante principale ACP) par exemple. Cependant la méthode la plus connue est la classification hiérarchique ascendante (CHA) mais pour le faire tu dois nous dire la nature de ta variable pour choisir de réaliser au préalable une ACP ou une AFC...
Cependant il existe plusieurs packages pour réaliser des clusters, "ade4", "vegan", ou encore "FactoMineR". Voici quelques lignes de commande pour "FactoMineR" :
Télécharger et charger le package "FactoMiner".
Si variable quantitative,
réaliser une ACP comme suit :
objet contenant tes données,
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2 res <- PCA(objet[,K1:Kj]) summary(res)
K1:Kj le nombre de colonnes sur lesquelles porte l'ACP.
puis réaliser la CHA sur la base des calculs de l'ACP comme suit :
si variable qualitative, il faut réaliser une AFC comme suit :
Code : Sélectionner tout - Visualiser dans une fenêtre à part res.HCPC<-HCPC(res)
puis réaliser une CHA avec la commande HCPC sur l'objet res.ca .
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2 res.ca <- CA(objet) summary(res.ca)
Partager