Bonjour,
J'essaie de modifier un excel en utilisant Python, sur des fichiers importants (plusieurs centaines de lignes) , et plusieurs fois dans une journée (manuellement ce serait sans fin) :
1 : J'ai des lignes à supprimer en me basant sur le contenu de la cellule de la première colonne. Ces lignes ne se suivent pas, elles sont éparpillées dans le fichier
Le fichier "source" est comme cela :
Toto texte
tata texte
tata texte
tata texte
tata texte
titi texte
toto texte
toto texte
tata texte
tata texte
tata texte
titi texte
tata texte
=> je dois supprimer les lignes avec "titi" dans la première cellule , en sachant que je ne connais pas les numéros de lignes etc et le fichier fait des centaines de lignes, donc pas possible de les noter toutes
Cela donnera :
Toto texte
tata texte
tata texte
tata texte
tata texte
toto texte
toto texte
tata texte
tata texte
tata texte
tata texte
2 : Par la suite, je dois mettre les blocs de lignes qui commencent par tata et se finissent par tata dans des onglets séparés dans l'excel :
tata texte
tata texte
tata texte
tata texte
tata texte
tata texte
tata texte
tata texte
Pour la partie "1" : j'ai essayé avec "drop" mais sans succès, lorsque je convertis l'excel en dataframe, Pandas rajoute des numéros de lignes et donc je ne peux plus les sélectionner selon le contenu de la cellule
Pour la partie "2": je n'ai rien trouvé sur ce sujet
C'est assez "costaud" je pense, néanmoins si vous avez des idées et conseils pour me faire avancer merci beaucoup !
Nico
Partager