Précédent   Forum des professionnels en informatique > Logiciels > Solutions d'entreprise > Business Intelligence > SAS > SAS Base
SAS Base Forum d'entraide sur SAS base : étape data, procédures non statistiques, procédures non graphiques, SQL
Partagez cette discussion sur d'autres réseaux sociaux : Viadeo Twitter Google Facebook Digg Delicious MySpace Yahoo
Réponse Proposer ce sujet en actualité
 
Outils de la discussion
Publicité
'
Vieux 23/03/2011, 19h01   #1
Invité de passage
 
Inscription : juin 2010
Messages : 3
Détails du profil
Informations forums :
Inscription : juin 2010
Messages : 3
Points : 0
Points : 0
Par défaut Jointure multiple avec volumétrie importante

Bonjour à tous,

Je travaille avec SAS V8. J'essaie de rapprocher des informations de plusieurs bases de très petites tailles à une base d'une importante volumétrie ( nombre de lignes > 1 million et plus de 200 variables via PROC SQL ( avec plusieurs LEFT OUTER JOIN )).
Le traitement met au moins 1h à tourner sans créer la table souhaitée.
J'ai le message d'erreur suivant :

ERROR: An I/O error has occurred ON file WORK.#tf0038.n.DATA.

Ci-dessous le Code que j'ai utilisé.
Code :
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
 
rsubmit;
proc sql;
CREATE INDEX var1 ON malib.matable(var1);
CREATE INDEX var2 ON malib.matable(var2);
CREATE INDEX var3 ON malib.matable(var3);
CREATE INDEX var4 ON malib.matable(var4);
CREATE INDEX var5 ON malib.matable(var5);
CREATE INDEX var6 ON malib.matable(var6);
CREATE INDEX var7 ON malib.matable(var7);
CREATE INDEX var8 ON malib.matable(var8);
CREATE INDEX var9 ON malib.matable(var9);
quit;
endrsubmit;
 
 
rsubmit;
proc sql ;
 
CREATE TABLE malib.matable
AS SELECT a.*,
           b.var_a AS nomvar_a_1,
           c.var_a AS nomvar_a_2,
		   d.var_b AS nomvar_b,
           e.var_c AS nomvar_c_1,
           f.var_c AS nomvar_c_2,
           g.var_d AS nomvar_d_2,
		   h.var_e AS nomvar_e_2,
		   i.var_f AS nomvar_f_1,
           j.var_f AS nomvar_f_2
 
FROM malib.matable AS a 
 
 LEFT OUTER JOIN malib2.matable1  AS b  ON  a.var1=b.var1
 LEFT OUTER JOIN malib2.matable1  AS c  ON  a.var2=c.var1 
 LEFT OUTER JOIN malib2.matable2  AS d  ON  a.var3=d.var2
 LEFT OUTER JOIN malib2.matable3  AS e  ON  a.var4=e.var3 
 LEFT OUTER JOIN malib2.matable3  AS f  ON  a.var5=f.var3
 LEFT OUTER JOIN malib2.matable4  AS g  ON  a.var6=g.var4
 LEFT OUTER JOIN malib2.matable5  AS h  ON  a.var7=h.var5
 LEFT OUTER JOIN malib2.matable6  AS i  ON  a.var8=i.var6
 LEFT OUTER JOIN malib2.matable6  AS j  ON  a.var9=j.var6
   ;
  quit;
endrsubmit;
J'ai compressé ( option compress=yes) ça ne change pas grand chose.
J'ai nettoyé ma WORK (en local) ça ne change rien.
La vérification de la WORK sur le serveur montre qu'elle n'est pas "saturée". Le traitement est toujours long.

J'ai fais un test sur un échantillon de la grosse bas ( 10 000 lignes), je n'ai pas le message d'erreur concernant la WORK (!!!!) mais le traitement mais néanmoins plus de 35 mn.

J'ai besoin d'aide et je sais que je peux compter sur vous.

Merci d'avance.
dadou225 est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 23/03/2011, 20h45   #2
Membre Expert
 
Inscription : mars 2005
Messages : 1 010
Détails du profil
Informations forums :
Inscription : mars 2005
Messages : 1 010
Points : 1 258
Points : 1 258
Envoyer un message via Yahoo à bahraoui
http://support.sas.com/kb/12/135.html

Je pense que tu exploses l'espace de stockage.
Tu peux relancer ton programme et surveiller la work
si tu es sous unix tu peux lancer la commande sous le répertoire ou se trouve la work .
__________________
Consultez les FAQs et les anciens postes avant de poser vos questions. Merci
bahraoui est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 23/03/2011, 21h38   #3
Membre du Club
 
Homme Fabien
Inscription : novembre 2008
Messages : 59
Détails du profil
Informations personnelles :
Nom : Homme Fabien
Localisation : France

Informations forums :
Inscription : novembre 2008
Messages : 59
Points : 56
Points : 56
Salut,

As tu testé avec les HASH?

Regarde ce lien :

http://www.sas.com/offices/europe/fr...200703_a1.html


Suistrop
suistrop est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 24/03/2011, 09h00   #4
Membre Expert
 
Homme
Biostatisticien
Inscription : juin 2009
Messages : 1 143
Détails du profil
Informations personnelles :
Sexe : Homme
Localisation : Irlande

Informations professionnelles :
Activité : Biostatisticien
Secteur : Industrie Pharmaceutique

Informations forums :
Inscription : juin 2009
Messages : 1 143
Points : 1 760
Points : 1 760
bonjour,

tu fais deux submit au serveur. A quel moment rencontre tu le problème? A ce que je comprends tu travailles sur une librairie en mode serveur donc il est inutile de nettoyer ta work locale. Tu peux également essayer de limiter l'utilisation des variables de tes tables via un keep.

Après, sans être un grand connaisseur, la solution via des hash proposée par suistrop, peut démontrer des performances très intéréssantes...
Manoutz est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 24/03/2011, 12h22   #5
Membre habitué
 
Femme Géraldine CADE DESCHAMPS
Support Clients SAS (France et Europe)
Inscription : février 2010
Messages : 62
Détails du profil
Informations personnelles :
Nom : Femme Géraldine CADE DESCHAMPS
Localisation : France

Informations professionnelles :
Activité : Support Clients SAS (France et Europe)
Secteur : High Tech - Éditeur de logiciels

Informations forums :
Inscription : février 2010
Messages : 62
Points : 139
Points : 139
Bonjour,

Je suis sceptique pour le hash : les données seraient stockées uniquement en mémoire. Si la volumétrie est importante, ça suppose de la RAM ! De plus le code hash est une nouveauté SAS 9, or vous êtes en 8.2.

Je vous recommande
1. de découper l'unique PROC SQL en plusieurs
2. de tester avec un MERGE
3. de faire pointer la WORK vers disque ayant + d'espace libre
4. éventuellement d'utiliser cleanwork pour libérer de l'espace sur le disque hébergeant la WORK actuellement. Cet utilitaire supprime les dossiers WORK fantômes.

Géraldine Cade-Deschamps
Support Clients SAS
Géraldine_Cade_SAS est déconnecté   Envoyer un message privé Réponse avec citation 10
Vieux 24/03/2011, 16h30   #6
Invité de passage
 
Inscription : juin 2010
Messages : 3
Détails du profil
Informations forums :
Inscription : juin 2010
Messages : 3
Points : 0
Points : 0
Par défaut Remerciements

Merci à tous pour votre aide.

J'ai utilisé plusieurs "merge" comme l'a suggéré Géraldine_Cade_SAS.

Le traitement est très très rapide et se passe sans problème.

Par ailleurs il me semblait avoir lu quelque part qu'il "n y avait pas de différence" entre jointure avec sql et jointure avec merge.
Cela à l'air de ne pas être toujours vrai !!!!!!!

Merci à tous une fois encore.
dadou225 est déconnecté   Envoyer un message privé Réponse avec citation 00
Réponse Proposer ce sujet en actualité Cette discussion est résolue.
Outils de la discussion



Fuseau horaire GMT +2. Il est actuellement 21h47.


 
 
 
 
Partenaires

Hébergement Web