1 pièce(s) jointe(s)
Basculement d'un tableau de distance en matrice pour faire une représentation en dendrogramme via hclust
Bonjour,
J'ai généré une distance de similarité entre texte grâce à la fonction "pairwise similarity" qui me fournit un data.frame sur 3 colonnes:
item1 |
item2 |
similarity |
Benoît |
François |
0,0418411724 |
Benoît |
Marine |
0,0418253988 |
Benoît |
Jean-Luc |
0,0410565534 |
Benoît |
Emmanuel |
0,0393344223 |
Benoît |
Nicolas |
0,0368840665 |
Benoît |
Jacques |
0,0239595689 |
Benoît |
François |
0,0225942804 |
Benoît |
Jean |
0,021960521 |
Benoît |
Philippe |
0,0182790387 |
Benoît |
Nathalie |
0,0172037347 |
... |
|
|
J'aimerais faire une Classfication Hierarchique Ascendante dessus.
Seulement en général la fonction hclust (qui fait cela) nécessite une matrice de distance de ce type pour intégrer les données.
Pièce jointe 573506
Y a t'il un moyen par une fonction R de générer cette matrice ? (j'ai commencé une routine de parcours de mes enregs mais ça ne fonctionne pas)
Merci de vos idées.