IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

SAS STAT Discussion :

Classification variable quali et quanti sous sas


Sujet :

SAS STAT

  1. #1
    Candidat au Club
    Inscrit en
    Juin 2012
    Messages
    4
    Détails du profil
    Informations forums :
    Inscription : Juin 2012
    Messages : 4
    Points : 2
    Points
    2
    Par défaut Classification variable quali et quanti sous sas
    Bonjour,

    Je suis actuellement en stage et je dois effectuer une classification des clients sous SAS. Pour cela, j'ai une base contenant des variables qualitatives et une variable quantitative.
    Je n'ai jamais fait de classification, mais je m'y intéresse depuis quelques semaines.
    Malgré tout ce que j'ai pu lire, je n'ai pas compris comment faire une classification avec une base contenant à la fois des variable quanti et quali.
    Est-ce qu'avec une proc cluster ça le fait ? Ou est-ce qu'il faut faire autre chose avant ?

    Merci de vos réponses.

  2. #2
    Membre éprouvé
    Homme Profil pro
    Ingénieur Pilotage
    Inscrit en
    Avril 2009
    Messages
    405
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Nord (Nord Pas de Calais)

    Informations professionnelles :
    Activité : Ingénieur Pilotage
    Secteur : Conseil

    Informations forums :
    Inscription : Avril 2009
    Messages : 405
    Points : 1 063
    Points
    1 063
    Par défaut
    Bonjour,

    Durant mes études ( cette année ) j'ai fait 2 études de cas sur la classification voici en gros la démarche :

    1 - Statistiques descriptives pour avoir une première idée des variables à placer dans notre modèle ( quelles sont les variables les plus influentes , celles qui influencent positivement , négativement , quelle modèle ? )

    -- Variables quantitatives : on crée des classes , en général , j'utilise la méthode des déciles , je regroupe les variables dont les moyennes sont proches. ( par rapport à la variable étudiée).
    -- Variables qualitatives : Des variables dummy suffisent , 0 pour la modalité de référence. Dans le cas de variables qualitatives à plusieurs modalités , regrouper des classes ( selon la logique des choses , un bon statisticien doit combiner théorie et pratique )

    2 - Réaliser des tests de discrimination de variables ( Khi Deux , V de Cramer ... )
    3 - Vérifier la colinéarité entre les variables ( Pearson Beauvais )
    4 - Lancer le modèle.
    5 - Analyse du modèle (voir si les classes sont pertinentes , si l'inertie totale est ok ,

    Un livre à vous conseiller
    Les macros de l'INSEE m'ont beaucoup aidé ,
    le site officiel de SAS ...

    Bon courage , c'est pas simple , on apprend avec de l'expérience mais c'est très intéressant

    Rom
    I always thought that the person who specialized in using just SAS PROCS should
    be known as the SAS Proctologist.

  3. #3
    Candidat au Club
    Inscrit en
    Juin 2012
    Messages
    4
    Détails du profil
    Informations forums :
    Inscription : Juin 2012
    Messages : 4
    Points : 2
    Points
    2
    Par défaut
    Merci pour cette réponse.
    A force de recherche, je comprends les choses petit à petit.
    J'aimerais un avis sur ce que je m'apprête à faire.

    D'abord, ma base de donnée a 3528 individus et 64 variables.
    Elle contient une variable quantitative continue et toutes les autres sont des variables qualitative. J'ai 2 variables qualitatives de type O/N, j'en ai d'autres dont les modalités sont des lettres (qui ont chacune une signification, le nombre de modalités par variable est aux alentours de 10), et j'ai beaucoup de variables avec 0 ou 1 (ce qui explique que j'ai beaucoup de variables dans ma base, puisque les variables avec les 0 et 1 sont des codes familles de produit ...).
    Voilà, ça c'était pour une idée rapide de ma base.

    Je vais d'abord commencer par faire des classes pour la variable continue.
    D'après ce que j'ai vu dans différents projets trouvé sur internet, beaucoup remplace leur variable qualitative par des chiffres. Par exemple, au lieu d'avoir des codes avec des lettres du type "CHGR" "CHUV" ... Ils vont remplacer "CHGR par 1, "CHUV" par 2, ... Est-ce que cette étape est nécessaire ?

    Ensuite, je pense créer un tableau disjonctif complet (à l'aide de la proc transreg) qui me permettra de faire une ACM (proc corresp). Puis je pourrais faire une CAH (proc cluster) sur les coordonnées factorielles continues issus de l'ACM.

    Est-ce que tous ce que j'ai dit est correct? Est-ce qu'il me manque quelque chose ? Des conseils ?

  4. #4
    Expert confirmé
    Avatar de olivier.decourt
    Homme Profil pro
    Formateur R/SAS/statistiques
    Inscrit en
    Avril 2008
    Messages
    2 064
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 46
    Localisation : France

    Informations professionnelles :
    Activité : Formateur R/SAS/statistiques
    Secteur : Conseil

    Informations forums :
    Inscription : Avril 2008
    Messages : 2 064
    Points : 4 478
    Points
    4 478
    Par défaut
    Bonjour Audrey.
    J'arrive un peu en retard (je rentre de vacances) mais la partie
    au lieu d'avoir des codes avec des lettres du type "CHGR" "CHUV" ... Ils vont remplacer "CHGR par 1, "CHUV" par 2,
    ne me semble pas utile.
    La séquence type est :
    1. Mise en tranches des variables quanti (en quartiles avec la proc Rank)
    2. Transreg
    3. Corresp (attention à l'option DIMENS si tu veux récupérer plus que les deux premiers axes factoriels !)
    4. Cluster
    5. Tree (pour le dendrogramme et l'affectation aux classes)
    6. des stats descriptives pour caractériser les classes (tu peux utiliser ma macro %caracParQuali en libre téléchargement sur le net pour ça par exemple).

    Bon courage.
    Olivier
    Bon courage.
    Olivier

  5. #5
    Nouveau Candidat au Club
    Homme Profil pro
    Étudiant
    Inscrit en
    Janvier 2017
    Messages
    1
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Janvier 2017
    Messages : 1
    Points : 1
    Points
    1
    Par défaut Classification variable qualit & quanti sous SAS
    Bonjour,

    je dois faire une classification. J'ai répertorié 2 types de variables:
    - Lot 1: variables concernant les individus que je veux classer (age, revenu, csp...)
    - Lot 2:variables concernant le produit (durée, taux...).

    Je souhaite donc identifier des types de clients homogènes et voir ensuite quel type de produit ils choisissent, sur quelle durée..

    Je réalise donc ma classification que sur les variables du lot 1 et je regarde comment se répartissent les variables du lot 2 sur les segments créés ou je dois également prendre celles du lot 2?

    Merci pour votre aide

Discussions similaires

  1. Macros variables sous SAS
    Par amabou dans le forum Macro
    Réponses: 7
    Dernier message: 10/03/2015, 09h19
  2. [DATA] Comment convertir une variable Character en Numeric sous SAS?
    Par Maria_75 dans le forum SAS Base
    Réponses: 1
    Dernier message: 20/08/2012, 17h58
  3. Réponses: 2
    Dernier message: 09/01/2006, 14h52
  4. Exporter une variable via un script sous KSH
    Par Snivel dans le forum Linux
    Réponses: 4
    Dernier message: 09/12/2005, 16h44
  5. Réponses: 5
    Dernier message: 08/09/2005, 20h33

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo