DataFrame : Trier un fichier pour networkx
Bonjour,
Je cherche à tier un fichier csv pour le rendre lisible par networkx. Networkx est une bibliothèque permettant de tracer des liens entre des noeuds (pour ceux qui sont intéressé : https://networkx.github.io/)
En gros, j'ai un fichier du type :
Velo |
Sport |
vetement |
|
jean |
vetement |
|
|
robe |
soiree |
|
|
dessin |
art |
crayon |
feuille |
nature |
|
|
|
et je veux le transformer comme il suit :
Source |
Target |
Weight |
Velo |
Sport |
1 |
Velo |
Vetement |
1 |
Sport |
Velo |
1 |
Sport |
Vetement |
1 |
Vetement |
Velo |
1 |
Vetement |
Sport |
1 |
et ainsi de suite. En gros, pour chaque mot qui se trouve sur la même ligne, je dois avoir les liens qui existent entre eux. J'ai essayé la fonction groupby qui marche bien à un détail prés, je n'ai pas cette forme de dataframe et donc je ne peux pas la lire par networkx.
Ce que j'obtiens :
Source |
Target |
Weight |
Velo |
Sport |
1 |
|
Vetement |
1 |
Sport |
Velo |
1 |
|
Vetement |
1 |
Vetement |
Velo |
1 |
|
Sport |
1 |
Donc comment faire pour :
Soit transformer le résultat de groupby en complétant les valeurs vides ou comment réorganiser le tout pour le mettre sous cette forme ?
Merci d'avance,
Yderien