Bonjour tout le monde,
Je vais essayer de faire simple.
Je développe une application sous wx-Devcpp.
Objectif: rechercher des doublons de lignes dans un fichier de type csv.
Voilà à quoi ressemble le fichier de données:
Dans le cas actuel, le fichier en question est ouvert, lu et stocké intégralement dans un buffer alloué dynamiquement.NOM;PRENOM;N°SECU;n°RUE;nom RUE;VILLE
Someone;Jonathan;123456789012345;13;rue de l'étang;Ici
Somebody;Sébastien;123456789012344;1;avenue les bains;Là bas
Someone;Jonathan;123456789012345;13;rue de l'étang;Ici
Ensuite, pour l'instant, l'application parcourt linéairement le buffer caractère par caractère à la recherche du champ le plus long.
La taille du fichier à analyser semble être un obstacle:
Avec un petit fichier de test, tout se passe bien.
A partir d'environ 1Mo, l'application se met à fortement ralentir, et si par malheur la fenêtre perd le focus ou est déplacée, celle ci fige et ne répond
plus.
L'application fige également au bout d'un certain temps.
Pensez vous qu'il soit bien de stocker tout un fichier en mémoire pour travailler avec le contenu ?
(celui-ci pourra atteindre au maximum 50Mo) ?
Merci d'avance pour votre aide.
Partager