Bonjour,
J'ai généré une distance de similarité entre texte grâce à la fonction "pairwise similarity" qui me fournit un data.frame sur 3 colonnes:
item1 item2 similarity Benoît François 0,0418411724 Benoît Marine 0,0418253988 Benoît Jean-Luc 0,0410565534 Benoît Emmanuel 0,0393344223 Benoît Nicolas 0,0368840665 Benoît Jacques 0,0239595689 Benoît François 0,0225942804 Benoît Jean 0,021960521 Benoît Philippe 0,0182790387 Benoît Nathalie 0,0172037347 ...
J'aimerais faire une Classfication Hierarchique Ascendante dessus.
Seulement en général la fonction hclust (qui fait cela) nécessite une matrice de distance de ce type pour intégrer les données.
Y a t'il un moyen par une fonction R de générer cette matrice ? (j'ai commencé une routine de parcours de mes enregs mais ça ne fonctionne pas)
Merci de vos idées.
Partager