Bonjour à tous,

Débutant en programmation, je développe une application sous visual studio, qui analyse des grandes quantités d'articles scientifiques, en extrait les mots les plus fréquents et construit des "clusters" avec les données générées.

Je vous explique rapidement l'algorithme :

- je possède un tableau où mes lignes sont des paires de mots. Chaque paires de mots possèdent un indice de similarité compris entre 0 et 1 (indice de Jaccard http://fr.wikipedia.org/wiki/Indice_...nce_de_Jaccard).
J'ai choisie une valeur minimale pour l'indice de similarité pour que la liste ne dépasse pas 50 paires de mots.

- Pass 1, les mots qui forment la paire avec l'indice de similarité le plus élevé deviennent les 2 premiers noeuds du cluster (exemple, les mots A et B).

- Puis parmis les mots de la liste (hors A et B), viens se greffer à cette première pairs une autre paire qui contient au moins A ou B, avec l'indice de similarité le plus élevé. Jusqu'a obtenir un sous-cluster de 10 mots.

- Re-belote au début du Pass 1 avec la paire de mots possédant le 2ème indice de similarité de plus élevé. Jusqu'a obtenir 10 sous-clusters

- Le Pass-2 consiste à lier les sous-cluster entre eux, expliquer la méthode est inutile ici.

De plus, l'épaisseur des liens entre deux mots peut varier selon la valeur de leur indice de similarité.
Le résultat final est de la forme : http://www.google.fr/imgres?start=10...=0CAsQrQMwAjhk

Ma question est la suivante, étant débutant en programmation, je ne connais aucun outils-graphique me permettant de représenter ces clusters. Si quelqu'un à l'habitude de coder ce genre d'algorithme, pourrait-il me dire ce qu'il utilise pour le représenter graphiquement?

Merci d'avance pour votre temps et votre patience!