Bonjour,
Dans mes différents essais de retraitement de mes données, je cherchais une méthode pour déterminer rapidement le nombre de lignes à traiter, (de façon "pythonic")
J'ai emprunté à Stackoverflow le programme suivant que j'ai complété des méthodes complémentaires proposées. Au final, j'aimerai afficher le nombre de lignes en face de chaque résultat des temps de traitements/fonction appelée.
Pour information, c'est la fonction mapcount qui semble la plus performante (chez moi).
Après différentes recherches, si j'arrive bien à afficher la fonction et le temps, ne n'arrive pas à afficher le nombre de lignes.
J'ai ajouté une ligne du type : counts[func].append(nbLines) qui n'est vraisemblablement pas à la bonne place.
Je suppose qu'il s’agit d'un dictionnaire ?
Est-il préférable de créer une structure de type tuple pour afficher quelque chose comme row.function,row.nb, min(row.time), max(row.time), avg(row.time)
Avez vous une idée qui puisse m'éclairer.
Le programme est proposé ci-après : Pièce jointe 198647.
J'ai fait un essai sur un fichier csv d'environ 70000 enregistrements
Sur 5000 enregistrements, j'obtiens les résultats suivants :
rawcount : 0.0015627145767211914
CountLines : 0.010935616493225098
simplecount : 0.007817888259887695
opcount : 0.00937337875366211
rawgencount : 0.003126716613769531
rawincount : 0.0015618085861206054
bufcount : 0.009373974800109864
mapcount : 0.0015609979629516602
Par avance merci
Partager