Bonjour à tous!
J'ai besoin de supprimer des doublons dans plusieurs fichiers texte.
Jusqu'à présent je m'en sortais bien avec le procédé suivant :
1°) Chargement du fichier dans une chaine
2°) Vidage de mon fichier Hyperfile
Code : Sélectionner tout - Visualiser dans une fenêtre à part sListeChaine= fChargeTexte(MonFichierTexte)
3°) Pour chaque ligne UneLigne de sListeChaine séparée par RC, je recherche dans mon Fichier MALISTE, si pas trouvé, Hajoute UneLigne dans le fichier MALISTE (j'en profite pour ajouter UneLigne dans la Chaine sListeChaineSansDoublon)
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5 HSupprimeTout(MALISTE) SI ErreurDétectée ALORS Erreur("File creation failed!") RETOUR FIN
En fin de traitement je récupère ainsi une liste sans doublon.
Tout fonctionne parfaitement jusqu'au moment ou j'ai eu des fichiers texte de1 Go à traiter.
Le résultat s'affiche au bout de plusieurs minutes (voir 5 à 6 mn)
Est ce la bonne manière? Existe t-il un moyen d'optimiser?
D'autres outils sur le net traitent ce type de fichier en une vingtaine de secondes
Merci d'avance pour toute aide...
Partager