Précédent   Forum des professionnels en informatique > Logiciels > Solutions d'entreprise > Business Intelligence > SAS

SAS Forum d'entraide SAS (Informatique décisionnelle). Avant de poster --> FAQ SAS, Tutoriels SAS

Réponse
 
Outils de la discussion
Vieux 29/08/2008, 14h59   #1 (permalink)
Invité régulier
 
Date d'inscription: août 2008
Messages: 10
Par défaut [Macro] Ajout valeur manquantes date (trimestre)

Bonjour,

J'ai un léger souci.
J'ai une table de résultats SAS sous cette forme-là :

A B C
22007 456 451.123
32007 468 466.456
42007 480 474.563
12008 486 484.756
22008 486 486.359
. . 482.865
. . 474.123
. . 496.263

J'aimerais ajouter à la colonne A, les valeurs manquantes automatiquement grace à une boucle (ou autre), en sachant que la colonne A représente les trimestres.
En espérant que vous pourrez m'aider, je vous remercie par avance.
uekoner est déconnecté   Envoyer un message privé Réponse avec citation
Vieux 29/08/2008, 15h01   #2 (permalink)
Rédacteur/Modérateur
 
Date d'inscription: septembre 2006
Messages: 801
Par défaut

Bonjour,
Je n'ai pas bien cerné ton problème! Tu veux ajouter des valeurs manquantes à ta colonne A???
fafabzh6 est déconnecté   Envoyer un message privé Réponse avec citation
Vieux 29/08/2008, 15h03   #3 (permalink)
Invité régulier
 
Date d'inscription: août 2008
Messages: 10
Par défaut

Désolé, je me suis mal exprimé.

En fait je veux simplement ajouter dans la colonne A, les trimestres correspondant manquant.
uekoner est déconnecté   Envoyer un message privé Réponse avec citation
Vieux 29/08/2008, 15h05   #4 (permalink)
Invité régulier
 
Date d'inscription: août 2008
Messages: 10
Par défaut

Je vous redonne la forme de la table :

22007 456 89 451.61497628
32007 468 90 466.72620758
42007 480 91 474.67348936
12008 486 92 484.11794168
22008 486 93 486.38391315
. . . 482.11226535
. . . 474.49172019
. . . 463.58011042
. . . 449.85770595
uekoner est déconnecté   Envoyer un message privé Réponse avec citation
Vieux 29/08/2008, 15h08   #5 (permalink)
Rédacteur/Modérateur
 
Date d'inscription: septembre 2006
Messages: 801
Par défaut

Juste une question : tes données sont donc forcément triées, c'est-à-dire que :
32008 482.11226535
42008 474.49172019
Si oui avec un lag et des macro-variables tu peux surement bidouiller quelque chose. En lui demandant d'ajouter +1 si le premier chiffre est inférieur à 4, 0 si égale à 4 et dans ce cas dernier chiffre +1.
fafabzh6 est déconnecté   Envoyer un message privé Réponse avec citation
Vieux 29/08/2008, 15h13   #6 (permalink)
Invité régulier
 
Date d'inscription: août 2008
Messages: 10
Par défaut

Les données sont bien triées par trimestre.
Par contre je ne vois pas trop comment faire avec la méthode que tu proposes. La programmation pure n'est pas trop mon domaine, aurais-tu un exemple concret que je puisse mettre en application à mes données ?
uekoner est déconnecté   Envoyer un message privé Réponse avec citation
Vieux 29/08/2008, 15h18   #7 (permalink)
Rédacteur/Modérateur
 
Date d'inscription: septembre 2006
Messages: 801
Par défaut

Tu peux consulter la FAQ SAS du site et/ou rechercher dans les anciens topics du forum pour t'aider.
Les mots clés : étape DATA, LAG(), SUBSTR(), MACRO VARIABLE.
fafabzh6 est déconnecté   Envoyer un message privé Réponse avec citation
Vieux 02/09/2008, 19h10   #8 (permalink)
Invité régulier
 
Date d'inscription: mars 2008
Messages: 13
Par défaut

Bonjour,

Je pense qu'il faut passer par un compteur. Je propose une approche en quatre étapes :
  1. Sauvegarder le numéro de trimestre et l'année dans deux variables différentes
  2. Remplacer les valeurs manquantes pour le trimestre
  3. Remplacer les valeurs manquantes pour l'année
  4. Remettre les informations dans une seule variable.

Dans un premier temps, je te propose des détails sur l'approche. Dans un second temps, tu trouveras le code.

Véronique

_____________________________
Véronique Bourcier
veronique.bourcier@sasreference.fr
www.sasreference.fr
Blog pour se former au logiciel SAS

1. Variables trimestre et année

J'ai assumé que la variable A était numérique puisque les valeurs manquantes sont symbolisées par des points. Si ce n'est pas le cas, il faudra faire appel aux fonctions caractères de SAS pour extraire le trimestre et l'année.

Pour créer la variable TRIMESTRE, je divise le nombre par 10 000 pour n'avoir que le chiffre correspondant au trimestre dans la partie entière et je garde la partie entière avec la fonction FLOOR.

Pour créer la variable ANNEE, j'enlève le numéro du trimestre multiplié par 10 000.

Je n'opère l'opération que pour les valeurs non manquantes de A en utilisant la fonction MISSING.

2. Un compteur pour le semestre.

Si la valeur A est manquante j'ajoute 1 à la dernière valeur lue par SAS.

Si la valeur actualisée est égale à 5 alors, le numéro du trimestre est réinitialisé.

3. Un compteur pour l'année

A chaque fois que A est manquant et que le trimestre est 1, j'ajoute 1 à l'année. Sinon, j'utilise la dernière valeur allouée à la variable ANNEE.

4. Recréer la variable A

La variable A est actualisée : trimestre * 10 000 + annee.
Les variables TRIMESTRE et ANNEE sont supprimées n'étant plus nécessaires.



a. Créer le data set pour l'exemple

Code :
DATA orig;
   input A B C;
   datalines;
22007 456 451.123
32007 468 466.456
42007 480 474.563
12008 486 484.756
22008 486 486.359
. . 482.865
. . 474.123
. . 496.263
;
run;
b. Les 4 étapes

Code :
DATA final (DROP=trimestre annee);
   SET orig;
   *Etape 1;
   IF NOT missing(a) then 
      do;
         trimestre=floor(a/10000);
         annee=a-trimestre*10000;
      end;
   *Etape 2;
   IF missing(a) then trimestre+1;
   IF trimestre=5 then trimestre=1;
   *Etape 3;
   IF missing(a) AND trimestre=1 then annee+1;
   *Etape 4;
   a=trimestre*10000+annee;
run;
c. Visualiser le résultat

Code :
proc print DATA=final;
run;
v_bourcier est déconnecté   Envoyer un message privé Réponse avec citation
Vieux 03/09/2008, 08h24   #9 (permalink)
Rédacteur/Modérateur
 
Avatar de Bruno2r
 
Date d'inscription: décembre 2006
Localisation: CANNES
Âge: 54
Messages: 1 985
Par défaut

Limpide ! Comme d'habitude. Merci v_bourcier.

Juste une question à uekoner :

Citation:
Envoyé par uekoner Voir le message
Je vous redonne la forme de la table :

22007 456 89 451.61497628
32007 468 90 466.72620758
42007 480 91 474.67348936
12008 486 92 484.11794168
22008 486 93 486.38391315
. . . 482.11226535
. . . 474.49172019
. . . 463.58011042
. . . 449.85770595
On est donc passé à 4 colonnes :
A = TrimestreAn
B = ?
C = N° d'ordre
D = Valeur

C'est quoi cette colonne B ?
__________________
Précisez la VERSION ! Règles du forum Business Objects et FAQ BO
"A vouloir repousser ses limites ... On risque d'en prendre connaissance !!!"
~~~~~~~-= Bruno2r =-~ "Team - BAB Spécialistes BO"~~~~~~~~~~~
Bruno2r est déconnecté   Envoyer un message privé Réponse avec citation
Vieux 03/09/2008, 10h42   #10 (permalink)
Invité régulier
 
Date d'inscription: août 2008
Messages: 10
Par défaut

Merci pour toutes vos réponses !!

La colonne B correspond à la valeur réelle du loyer.
La colonne D correspond à la valeur estimée du loyer (que j'obtiens avec la Proc Forecast d'où le problème des trimestres manquants.)
Ce que je veux faire ensuite, c'est de tracer ces deux séries sur un même graphique avec la Proc Gplot.
Par contre, j'ai essayé de transformer la variable des trimestres en une variable SAS DATE de ce format : YYQ6. afin de tracer plus facilement les graphiques et ne pas avoir un problème de légende.
Donc peut-être qu'en utilisant ce format de date, il serait plus facile d'ajouter les trimestres qui manquent ?
uekoner est déconnecté   Envoyer un message privé Réponse avec citation
Vieux 03/09/2008, 11h39   #11 (permalink)
Membre Confirmé
 
Date d'inscription: avril 2008
Localisation: Fontenay-aux-Roses
Âge: 33
Messages: 227
Par défaut

Moi, je fais un peu différemment de v_bourcier. Au lieu de vérifier si une clé obtenue dans la boucle présente dans ma table (si oui - passer à la suivante, si non - l'insérer), j'insère toutes les clés avec des zéros. Et à la fin je fais la somme en regroupant par cette même clé. Si la clé était présente, on y ajoute un zéro, sinon - il n'y a que le zéro inséré par la boucle.
green_fr est déconnecté   Envoyer un message privé Réponse avec citation
Vieux 03/09/2008, 15h06   #12 (permalink)
Invité régulier
 
Date d'inscription: août 2008
Messages: 10
Par défaut

En fait, je me suis rendu compte qu'en procédant avec la méthode de Valérie, je n'arrive pas à obtenir les bons graphiques (avec la Proc GPLOT) car sous cette forme, les trimestres ne sont pas considérés par SAS comme triés.

Il faut je pense trouver un bon format pour les trimestres de manière à ce qu'on puisses automatiser l'ajout des trimestres manquant et de manière à obtenir les bons graphiques pour que SAS puisse lire correctement les données en abscisse.
uekoner est déconnecté   Envoyer un message privé Réponse avec citation
Vieux 03/09/2008, 16h24   #13 (permalink)
Membre expérimenté
 
Date d'inscription: avril 2008
Localisation: Malakoff
Messages: 508
Par défaut

Côté GPLOT, je militerais pour l'utilisation d'un format sur une date. L'utilisation d'un picture défini dans la proc Format doit permettre de faire à peu près exactement ce qu'on veut, à condition de partir d'une date SAS en nombre de jours depuis 1960.
olivier.decourt est déconnecté   Envoyer un message privé Réponse avec citation
Vieux 03/09/2008, 17h59   #14 (permalink)
Invité régulier
 
Date d'inscription: août 2008
Messages: 10
Par défaut

Sinon autre question,

Comment faire pour transformer la série d'observations _N_ en trimestres du type Q1-2008 Q2-2008 en sachant que j'ai une centaine de tables et que pour chaque table, les trimestres ne commencent pas toujours à la même date.
Ceux-ci afin de dessiner des graphiques convenablement.
Merci d'avance..
uekoner est déconnecté   Envoyer un message privé Réponse avec citation
Vieux 03/09/2008, 18h03   #15 (permalink)
Membre expérimenté
 
Date d'inscription: avril 2008
Localisation: Malakoff
Messages: 508
Par défaut

Avec la fonction INTNX("QUARTER", dateDebut, _N_-1) tu devrais avoir des résultats corrects. Si tu as la date de début à la première obs de chaque table, tu la mets dans une nouvelle variable protégée par un Retain :
Code :
 
DATA ... ;
  SET ... ;
  RETAIN dateDebut ;
  IF _N_=1 THEN dateDebut = date ;
  trimestre = INTNX("QUARTER", dateDebut, _N_-1) ;
RUN ;
 
Est-ce que ça correspond à ton besoin ?
Olivier
olivier.decourt est déconnecté   Envoyer un message privé Réponse avec citation
NEWS BUSINESS INTELLIGENCETUTORIELS BILIVRES BIFAQs BIBLOG BIGLOSSAIRE BI

Réponse

Précédent   Forum des professionnels en informatique > Logiciels > Solutions d'entreprise > Business Intelligence > SAS



Outils de la discussion

Règles de messages
Vous ne pouvez pas créer de nouvelles discussions
Vous ne pouvez pas envoyer des réponses
Vous ne pouvez pas envoyer des pièces jointes
Vous ne pouvez pas modifier vos messages

Les balises BB sont activées : oui
Les smileys sont activés : oui
La balise [IMG] est activée : oui
Le code HTML peut être employé : non
Trackbacks are non
Pingbacks are non
Refbacks are non

Navigation rapide


Fuseau horaire GMT +2. Il est actuellement 14h12.


Vos questions techniques : forum d'entraide Business Intelligence - Publiez vos articles, tutoriels et cours
et rejoignez-nous dans l'équipe de rédaction du club d'entraide des développeurs francophones
Nous contacter - Hébergement - Participez - Copyright © 2000-2009 www.developpez.com - Legal informations.