méthode de comptage de lignes dans un fichier
Bonjour,
J'ai un fichier énoooorme (6 millions de lignes) qui vient d'une base de donnée, et chaque ligne se compose d'un mot.
Exemple:
bla
bla
blop
blip
toto
test
Je voudrais savoir quelle est la meilleure méthode pour parser ce fichier rapidement (je peux le trier en amont avec un "cat fichier | sort" sans problème)
afin d'obtenir le nombre d'occurences pour chaque mot.
(En gros j'aurai un output du style:
bla: 2
blop: 1
blip: 1
etc...)
Comme je suis débutant, je suis sûr que ça ne prend que quelques lignes de code Python mais j'aimerais que ce soit plutôt rapide si possible...
Merci de vos conseils/aide :-)