IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

SAS STAT Discussion :

Discretisation d'une variable continue


Sujet :

SAS STAT

  1. #1
    Membre régulier Avatar de Clairant
    Homme Profil pro
    Doctorant en économie (UdeM), Ingénieur Statisticien Economiste
    Inscrit en
    Mars 2015
    Messages
    79
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Canada

    Informations professionnelles :
    Activité : Doctorant en économie (UdeM), Ingénieur Statisticien Economiste

    Informations forums :
    Inscription : Mars 2015
    Messages : 79
    Points : 71
    Points
    71
    Par défaut Discretisation d'une variable continue
    Bonsoir cher expert,
    en fait, je souhaiterais discrétiser certaines variables continues (numériques) en trois classes comportant respectivement 25% (Q1), 50% (Q2) et 25% (Q3) des observations.
    Voici le code que j'ai soumis :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    proc rank data=local.ise group=3 out=outrank;
    var _numeric_;
    run;
    Malheureusement, avec ce code, j'ai des classes d'effectif presque égal. Alors pourriez vous m'aider?
    **************************************************************************************************************************************************************
    L'avenir est dans le numérique.

    **********************************************************

  2. #2
    Membre averti

    Homme Profil pro
    Technical Account Manager
    Inscrit en
    Avril 2015
    Messages
    224
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 29
    Localisation : France, Moselle (Lorraine)

    Informations professionnelles :
    Activité : Technical Account Manager

    Informations forums :
    Inscription : Avril 2015
    Messages : 224
    Points : 318
    Points
    318
    Billets dans le blog
    1
    Par défaut
    Je te conseille de le faire manuellement à partir d'une proc means

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
     
    proc means data = local.ise out = work.res;
    var _numeric_ / mean q1 q2 q3;
    run;
    Regarde ensuite les valeurs de q1 q2 q3 et fait une étape data pour modifier tes valeurs :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
     
    data local.ise;
    set local.ise;
    keep var1 var2 ... newvar1 newvar2;
    if var1>q1 then
    newvar1 = q1;
    run;
    Cordialement
    xela57

  3. #3
    Membre régulier Avatar de Clairant
    Homme Profil pro
    Doctorant en économie (UdeM), Ingénieur Statisticien Economiste
    Inscrit en
    Mars 2015
    Messages
    79
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Canada

    Informations professionnelles :
    Activité : Doctorant en économie (UdeM), Ingénieur Statisticien Economiste

    Informations forums :
    Inscription : Mars 2015
    Messages : 79
    Points : 71
    Points
    71
    Par défaut
    Salut Xela57,
    Merci d'avoir répondu à la préoccupation !
    en fait, j'avais pensé à cette approche mais le véritable soucis cette dernière ne tiendra pas compte de l'homogénéité des individus. En effet, en utilisant cet algorithme deux individus semblables peuvent être affectés à des groupes différents. Ainsi, je me disais avec la méthode de discrétisation de Jenks je pourrais palier à ce défaut. Ainsi, est il possible d'insérer d'autres options dans la procédure rank afin de faire un regroupement des individus en trois classes même si les 25% et 50% ne sont pas strictement respectés?

    Cordialement !
    **************************************************************************************************************************************************************
    L'avenir est dans le numérique.

    **********************************************************

  4. #4
    Membre du Club
    Femme Profil pro
    Étudiant
    Inscrit en
    Juillet 2013
    Messages
    55
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Étudiant
    Secteur : Finance

    Informations forums :
    Inscription : Juillet 2013
    Messages : 55
    Points : 65
    Points
    65
    Par défaut
    Bonjour,

    Alors pour la discrétisation de variables quantitatives il est d'usage de commencer par un découpage en décile et puis de faire un croisement avec la variable cible (Je ne sais pas si vous en avez une). Cela permet de voir le comportement des groupes vis à vis de la cible et donc d'avoir une idée précise du meilleur nombre de classes ...
    Vous pouvez peut être donner plus de détails sur votre problématique, on pourra certainement proposer des choses

    Bon courage

  5. #5
    Membre régulier Avatar de Clairant
    Homme Profil pro
    Doctorant en économie (UdeM), Ingénieur Statisticien Economiste
    Inscrit en
    Mars 2015
    Messages
    79
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Canada

    Informations professionnelles :
    Activité : Doctorant en économie (UdeM), Ingénieur Statisticien Economiste

    Informations forums :
    Inscription : Mars 2015
    Messages : 79
    Points : 71
    Points
    71
    Par défaut
    Bonjour Joan,
    Merci d'avoir répondu à ma préoccupation. En effet, prenons l'exemple du chiffre d'affaire en Milliards d'une entreprise avec la série suivante :
    25 26 26 35 83 41 25 32 63 95 25 14 25 85 27 32 12 36 39 30 20 14 50 20 10 42 26 35 34 16 15 12 13 16 4 5 78 9 6 25 36 85 45 46 43 41 40 42 47 48
    1 2 40 42 75 45 24 54 46 58 56 65 64 62 60 61 63 25 35 4 63 89 77 475 850 475 896 452 123 456 789.
    La préoccupation est de regrouper cette série en trois classes ou groupes?
    Il y a une approche de Jenks qui est très utilisée mais ce n'est pas implémentée sous Sas je pense.
    Cordialement !
    **************************************************************************************************************************************************************
    L'avenir est dans le numérique.

    **********************************************************

Discussions similaires

  1. Réponses: 2
    Dernier message: 14/11/2014, 18h39
  2. séquençage d'une variable continue
    Par Anna2013 dans le forum R
    Réponses: 7
    Dernier message: 22/05/2013, 15h11
  3. Réponses: 4
    Dernier message: 07/08/2012, 20h51
  4. Réponses: 0
    Dernier message: 11/07/2012, 11h39
  5. Fonction pour catégoriser une variable continue
    Par joyeux_lapin13 dans le forum R
    Réponses: 8
    Dernier message: 12/04/2011, 14h34

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo