Je ne sais pas si vous avez un minimum de connaissances en SQL mais je pense que cette tâche peut être effectuée d'une façon plus simple:
- créer une petite DB locale avec Sqlite
- créer des tables avec un schéma convenable pour importer vos fichiers CSV
- une fois que les données sont importées le reste c'est un truc de ce genre:
Code:
1
2
3 UPDATE table1 SET machin = table2.bidule FROM table2 WHERE table1.ean = table2.ean
Càd: mettre à jour certains champs dans une table au départ d'une autre table, en définissant le critère de correspondance entre les deux tables via la clause WHERE.
Vous vous rajoutez de la complication avec Pandas, et vous vous retrouvez dans des pièges, il interprète les données selon leur valeur du moment mais n'a aucune idée du contexte. Finalement vous avez des problèmes de typage et mélangez des pommes avec des poires.
Ce que je veux dire par là, c'est qu'il y a d'autres approches possibles que de faire des boucles. Ce qui est important c'est d'avoir des données propres, normalisée et une clé de correspondance claire et univoque. Pour tout vous dire, ça pourrait se faire sans Python, jusque du SQL et un peu de ligne de commande.