Supprimer lignes en doubles
Bonjour à tous,
je souhaite supprimer les lignes en double dans un fichier y compris la ligne originale.
Exemple:
Citation:
pommes
bananes
carottes
fraises
pommes
carottes
je veux en résultat:
Citation:
bananes
fraises
J'ai ce bout de code qui élimine les doublons mais je n'arrive pas à éliminer chaque ligne qui existe 2 fois.
Code:
1 2 3 4 5 6 7 8
|
seen = set() # holds lines already seen
outfile = open(outfilename, "w")
for line in open(infilename, "r"):
if line not in lines_seen: # not a duplicate
outfile.write(line)
lines_seen.add(line)
outfile.close() |
Ce bout de code me donne:
Citation:
Pommes
bananes
carottes
fraises
Merci pour votre aide