Bonjour,
J'ai un fichier énoooorme (6 millions de lignes) qui vient d'une base de donnée, et chaque ligne se compose d'un mot.
Exemple:
bla
bla
blop
blip
toto
test
Je voudrais savoir quelle est la meilleure méthode pour parser ce fichier rapidement (je peux le trier en amont avec un "cat fichier | sort" sans problème)
afin d'obtenir le nombre d'occurences pour chaque mot.
(En gros j'aurai un output du style:
bla: 2
blop: 1
blip: 1
etc...)
Comme je suis débutant, je suis sûr que ça ne prend que quelques lignes de code Python mais j'aimerais que ce soit plutôt rapide si possible...
Merci de vos conseils/aide :-)
Partager