Bonjour,
Je cherche à recalculer des labels des produits dans la table 3 (qui contient plus de 5000 lignes) avec mes nouvelles data en table 2 (contient 100 000 lignes).
Pour celà, j'ai une table 1 (plus de 50000 lignes ) qui est une photo des statistiques datant d'il y a 1 an qui a été appliqué sur les produits de la Table 3
Cette Table1 inclus 2 clés:
- la clé bleu (concatenation de 6 columns) lie Table 1 et Table 2
- la clé jaune (concatenation de 3 columns) lie Table 1 et Table 3
Etant New comer dans python,
Je cherche à faire ce refresh dans python car avec Excel les macros vont me prendre trop de temps à compiler les 5000 lignes de produits.
Le problème est que je ne sais pas comment prendre le probleme tout en m'assurant que le code sera plus rapide que VBA.
A ce jour, VBA me prends 45sec par lignes de produits pour le calcul.
Dois je partir sur du Pandas ou les dictionnaires dans python seront suffisants?
Quelqu'un a un exemple de code pour faire des 'jointures'/'lien entre 3 tables
En VBA, j'aurais travaillé de la sorte:
1- Descendre ligne par ligne la Table 3
1.1 pour chaque ligne de Table3 , je prend la clé jaune et je cherche les clé jaune en Table1.
1.2 pour chaque ligne en Table1 avec la clé jaune:
1.2.1 je recupere la clé bleu
1.2.2 dans la Table 2 avec la clé bleu je récupere les nouvelles stat (label1, label 0, label 2) que j'additionne dans 3 variables
1.3 je met à jour en Table 3 les label1, 0, 2
Merci d'avance pour votre attention
Jerome
Partager