Bonjour,
Je n'ai pas su où poster mon message alors j'ai posté ici.
J'ai un fichier de référence F1 ~4millions de lignes et un fichier de base F2 ~500 000 lignes de la forme : champ1,champ2,champ3...
Je voudrai extraire de F2 les lignes qui n'existent pas dans F1 et les mettre dans un autre fichier (n'existent pas ça veut dire que champ1 de F2 ne correspond à champ2 dans F1). Ceci implique que je dois, pour chaque ligne de F2, parcourir F1 et vérifier F2{champ1} == F1{champ2}
Voici mon problème : le script bouffe énormément de ressource CPU, RAM et temps !!! et je voudrai avoir une autre solution plus optimisée que le parcours imbriqué de deux fichiers volumineux (ligne par ligne ou chargés dans deux hashs...c'est toujours galère) .
Si quelqu'un aurait une autre idée elle est la bienvenue.
Merci.
Partager