Bonjour à tous,
je souhaite supprimer les lignes en double dans un fichier y compris la ligne originale.

Exemple:

pommes
bananes
carottes
fraises
pommes
carottes
je veux en résultat:

bananes
fraises
J'ai ce bout de code qui élimine les doublons mais je n'arrive pas à éliminer chaque ligne qui existe 2 fois.

Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
 
seen = set() # holds lines already seen
outfile = open(outfilename, "w")
for line in open(infilename, "r"):
    if line not in lines_seen: # not a duplicate
        outfile.write(line)
        lines_seen.add(line)
outfile.close()
Ce bout de code me donne:
Pommes
bananes
carottes
fraises
Merci pour votre aide