bonjour à tous,
pour arriver à mes fins, j’utilise trois requêtes qui analysent 1 fichier de données de 20 000 lignes provenant de 20 000 fichiers excel.
ce fichier de donnée comporte une douzaine de rubrique de type texte essentiellement et d’une longueur de 26 caractères max.
la clé unique de la table est une rubrique automatique.
le but est de faire une analyse de ces données afin de les compter et les classer.
j’ai le résultat voulu, mais il me faut 5 bonnes minutes pour faire cette analyse.
Et c’est trop long !!!!
je vais essayer d’expliquer le procéder ... pas facile... :
j’utilise la requête 1 qui parcourt simplement le fichier de donnée pour ne ressortir que 20 d’enregistrments.
requête sans les doublons. (ça ça va c’est facile et rapide)
ensuite par code, je parcours 1 par 1 le résultat de la requête 1.
Avec la requête 2, dans le même fichier de données, je sors jusqu’à 10 000 enregistrements, selon une rubrique de la requête 1.
pour finir, avec la requête 3, je parcours cette dernière sélection (10 000) 1 par 1, pour trouver les doublons (max 10).
j’anayse un par un ces doublons pour y trouver une info spécifique.
En même temps, j’ai plusieurs compteurs qui s’incrémetent pour des stat.
Je mémorise l’enregistrement analysé dans une variable tableau pour ne pas l’analyser s’il revient.
c’est vraiment pas facile à expliquer, j’espère que qqun à compris mon histoire et peut m’aider à optimiser mon analyse !
merci d’avance !!!
Partager