Bonjour à tous et à toutes,
Je suis actuellement étudiant, et je dois effectuer une analyse sous sas ou j'ai plusieurs fichiers à joindre ensemble afin de pouvoir effectuer cette analyse.
Ainsi, j'ai importer mes tables et fait une pré-selection des variables que je voulais.
J'ai effectué dans un premier temps le script suivant qui fonctionne très bien (cette table va nous servir pour après) :
Une fois cette table créé, j'ai réaliser le script suivant :
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6 proc sql; create table etustat.bddb as SELECT s0q1, s0q2, s14q2, s14q3 FROM etustat.bdd14; run;
Dans ma table bddessrind il y a 14 160 lignes, et dans les autres tables il y a 70 140 lignes.
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8 proc sql; create table etustat.bddglobal as SELECT b7.s0q1,b7.s0q2, bdd1.s02q4, bdd1.s02q10, bdd1.s02q13, bdd1.s11q114, b7.s07q1, b1413.s14q4, bddb.s14q2, bddb.s14q3 FROM etustat.bdd7 b7 LEFT JOIN etustat.bdd1413 b1413 ON (b7.s0q1=b1413.s0q1 AND b7.s0q2=b1413.s0q2) LEFT JOIN etustat.bddb bddb ON (b1413.s0q1=bddb.s0q1 AND b1413.s0q2=bddb.s0q2) LEFT JOIN etustat.bddessrind bdd1 ON (bddb.s0q1=bdd1.s0q1 AND bddb.s0q2=bdd1.s0q2); run;
En exécutant le second code (le code que j'ai pu effectué), j'ai 9 138 780 lignes (j'ai peur qu'il fasse un produit cartésien).
Je voulais donc savoir si c'est normal si je trouves autant de lignes ou pas ? Si non, avez vous une solution pour qu'il y ait un nombre de lignes correct ?
Partager