Solution miracle anti-doublon
Bonjour,
Alors que j'explique un peu mon appli... Je parse un fichier XML pour pouvoir insérer en base de donnée les paramètres présent dans les balises. Par exemple :
Code:
1 2 3 4 5
| <balise mere>
<balise fille [attributs]>
parametres
</balise fille>
</balise mere> |
Bon, le parsing du fichier se passe très bien. Ensuite, ce qu'il faut savoir, c'est que je travaille sur des fichiers assez volumineux (de l'ordre de 500 000 lignes :aie:). J'utilise SAX pour parser le fichier (normal).
Donc, mon soucis serait de vérifier la présence de doublon dans les paramètres à insérer en base... Sans faire de SELECT, et sans utiliser trop de mémoire 8O
C'est pour ça que je mets "solution miracle".
Pour l'instant, ma méthode consiste à partir du postulat que les balises devraient être ordonnées et donc j'utilise un Set que je ré-initialise quand je change de groupe de balises. Puisque j'utilise un Set, il n'y a pas de doublon à l'ajout. Donc, je regarde si le groupe de paramètres a été ajouté ou pas.
J'espère avoir été clair. Sinon, n'hésitez pas à demander des précisions. :mrgreen:
Voilà, je suis réceptif à vos idées/conseils/propositions/canard laqué...
++
Gueritarish