Bonjour,
je m'amuse en ce moment en python et en text mining.
J'ai un dataframe comme suit :
col1 col2 col3 col4 A B C D B C A C B A D
Je cherche un moyen de créer un graphe indiquant les liens entre par exemple "A" et les autres entités, dans ce cas un 2nd cluster construit avec BC serait produit et un lien serait fait entre la ligne "B-C" et l'autre.
L'objectif serait d'identifier quels sont les items le plus souvent associés.
Il ne s'agit que d'un amusement, ni un travail universitaire, ni professionnel mais comme je suis curieux...
Je suis allé cherché du côté de google bien sur, je soupçonne que les mots clés serait classification, multi-labels, network, clustering mais je n'arrive pas à trouver un "point d'entrée" pour résoudre mon problème (à part bien sûr retourner à l'école)
Si vous avez des liens à partager, des tutos à recommander, des exemples à travailler... N'hésitez pas, je ne tiens pas tant à avoir le code pour résoudre ce problème que de créer le code moi-même.
Merci de m'avoir lu (et honnêtement si mon énoncé est incompréhensible n'hésitez pas non plus, ca pourrait l'origine de mon blocage :-)
Christophe
Partager