IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

SAS STAT Discussion :

Classification mixte (k-means et CAH) : Interprétation des classes


Sujet :

SAS STAT

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Membre actif
    Homme Profil pro
    Étudiant
    Inscrit en
    Juin 2011
    Messages
    51
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Étudiant
    Secteur : Industrie

    Informations forums :
    Inscription : Juin 2011
    Messages : 51
    Par défaut Classification mixte (k-means et CAH) : Interprétation des classes
    Bonjour,
    Pour faire segementation d'une clientèle, j ai fait une classification mixte en combianant : la methode de k-means et la CAH.
    La classification est faite sur les axes factoriels issus d'une ACM.
    D'après l'indicateur de choix des classes , j'ai opté pour 5 classes.
    Je souhaiterais interpreter mes differentes classes en fonction des mes variables (variables qualitatives et quantitatives discrétisées).
    Quelqu'un peut m'aider svp.
    Je travaille sous SAS
    Bien à vous.

  2. #2
    Expert confirmé
    Avatar de olivier.decourt
    Homme Profil pro
    Formateur R/SAS/statistiques
    Inscrit en
    Avril 2008
    Messages
    2 064
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 48
    Localisation : France

    Informations professionnelles :
    Activité : Formateur R/SAS/statistiques
    Secteur : Conseil

    Informations forums :
    Inscription : Avril 2008
    Messages : 2 064
    Par défaut
    Bonjour.
    La solution brute consiste à faire toutes les proc Freq croisant le n° de classe avec chacune des autres caractéristiques. Mais on n'y voit pas souvent grand chose, noyé sous l'information.
    Une solution plus élégante est de faire une ACM avec le n° de classe en variable supplémentaire. On peut voir sa proximité avec les modalités des différentes caractéristiques.
    Une solution à base de tests univariés est proposée dans Spad (méthode DEMOD). Il s’agit du test de proportions appariées décrit dans le livre de Lebart, Morineau et Piron, Statistique exploratoire multidimensionnelle, 3e édition, éd. Dunod, 2000, p 181. Pour faire ça dans SAS, j'ai mis en ligne une macro %caracParQuali qui est ici, avec sa doc en PDF.
    Bon courage.
    Olivier

  3. #3
    Membre actif
    Homme Profil pro
    Étudiant
    Inscrit en
    Juin 2011
    Messages
    51
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Étudiant
    Secteur : Industrie

    Informations forums :
    Inscription : Juin 2011
    Messages : 51
    Par défaut
    merci olivier , je vais essayer votre macro

  4. #4
    Membre actif
    Homme Profil pro
    Étudiant
    Inscrit en
    Juin 2011
    Messages
    51
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Étudiant
    Secteur : Industrie

    Informations forums :
    Inscription : Juin 2011
    Messages : 51
    Par défaut
    Bonjour Olivier ,

    Je suis entrain d 'utiliser votre macro "caracParQuali" pour l'interprétation mes classes, mais j'ai du mal à interpréter le résultat.

    J'aimerais savoir qu'elle est la différence entre une valeur de "% of this value in this group " 92% avec V Test positif ( |**** )
    et 95% avec V Test négatif (****|)?
    Comment je peux caractériser ma classe en fonction de ces 2 valeurs?

  5. #5
    Expert confirmé
    Avatar de olivier.decourt
    Homme Profil pro
    Formateur R/SAS/statistiques
    Inscrit en
    Avril 2008
    Messages
    2 064
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 48
    Localisation : France

    Informations professionnelles :
    Activité : Formateur R/SAS/statistiques
    Secteur : Conseil

    Informations forums :
    Inscription : Avril 2008
    Messages : 2 064
    Par défaut
    Les valeurs tests négatives correspondent à une sous-représentation. Mais si le % d'individus avec cette valeur dans le groupe est de 95%, c'est que la valeur est extrêmement présente en population générale.
    On caractérise une classe par la prépondérance des modalités avec les valeurs-tests les plus fortes (positives) et par l'absence (relative) des modalités avec les valeurs-tests les plus négatives.

  6. #6
    Membre actif
    Homme Profil pro
    Étudiant
    Inscrit en
    Juin 2011
    Messages
    51
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Étudiant
    Secteur : Industrie

    Informations forums :
    Inscription : Juin 2011
    Messages : 51
    Par défaut
    Merci

  7. #7
    Futur Membre du Club
    Profil pro
    Inscrit en
    Novembre 2012
    Messages
    4
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Novembre 2012
    Messages : 4
    Par défaut
    Citation Envoyé par olivier.decourt Voir le message
    Les valeurs tests négatives correspondent à une sous-représentation. Mais si le % d'individus avec cette valeur dans le groupe est de 95%, c'est que la valeur est extrêmement présente en population générale.
    On caractérise une classe par la prépondérance des modalités avec les valeurs-tests les plus fortes (positives) et par l'absence (relative) des modalités avec les valeurs-tests les plus négatives.

    Bonjour,

    Si je comprends bien : si un groupe a une modalité à 95% pour variable X avec une valeur test en négatif et une autre modalité à 90% d'une autre variable Y avec une valeur test en positif alors ce groupe est caractérisé par la modalité à 90% et une sous-représentation de la modalité à 95%. Est-ce bien cela?

    Merci d'avance.

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Interprétation des résultats du Possibilitic Fuzzy C Means
    Par wildthing dans le forum Traitement d'images
    Réponses: 2
    Dernier message: 18/07/2012, 21h05
  2. interprétation des classes
    Par debutsas dans le forum SAS STAT
    Réponses: 6
    Dernier message: 23/06/2011, 18h00
  3. Réponses: 2
    Dernier message: 19/10/2004, 09h55
  4. DBCC SQLPERF ( LOGSPACE ) Interprétation des résultats
    Par Labienus dans le forum MS SQL Server
    Réponses: 4
    Dernier message: 20/07/2004, 15h50

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo