Bonjour,
Je cherche à tier un fichier csv pour le rendre lisible par networkx. Networkx est une bibliothèque permettant de tracer des liens entre des noeuds (pour ceux qui sont intéressé : https://networkx.github.io/)
En gros, j'ai un fichier du type :
Velo Sport vetement jean vetement robe soiree dessin art crayon feuille nature
et je veux le transformer comme il suit :
Source Target Weight Velo Sport 1 Velo Vetement 1 Sport Velo 1 Sport Vetement 1 Vetement Velo 1 Vetement Sport 1
et ainsi de suite. En gros, pour chaque mot qui se trouve sur la même ligne, je dois avoir les liens qui existent entre eux. J'ai essayé la fonction groupby qui marche bien à un détail prés, je n'ai pas cette forme de dataframe et donc je ne peux pas la lire par networkx.
Ce que j'obtiens :
Source Target Weight Velo Sport 1 Vetement 1 Sport Velo 1 Vetement 1 Vetement Velo 1 Sport 1
Donc comment faire pour :
Soit transformer le résultat de groupby en complétant les valeurs vides ou comment réorganiser le tout pour le mettre sous cette forme ?
Merci d'avance,
Yderien
Partager