1. #1
    Futur Membre du Club
    Femme Profil pro
    Étudiant
    Inscrit en
    juillet 2017
    Messages
    7
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Localisation : France, Gard (Languedoc Roussillon)

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : juillet 2017
    Messages : 7
    Points : 7
    Points
    7

    Par défaut Classification grand nombre de variables, résultats obtenus douteux

    Bonjour,

    Je réalise actuellement une classification sur un tranche d'âge, mon but est d'obtenir diverses classes au sein de cette tranche d'âge.
    Je possède 113 variables quantitatives de 2 à 7 modalités. Une fois ces dernières transformées en données qualitatives binaires (via procédure transreg) j'obtient donc 227 variables.
    Suite à mon ACP mes deux premiers axes retenus représentent uniquement 24% d'inertie expliquée.
    Grand nombre de variable d'accord mais résultats aussi "bas" normal ?
    Beaucoup de mes variables sont proches de 0 (surtout mes variables d’intérêt (l'âge), de quoi cela peut-il provenir et surtout dois-je les laisser ?

    merci d'avance !

  2. #2
    Membre expérimenté
    Homme Profil pro
    Développeur en SAS/ Statisticien
    Inscrit en
    janvier 2013
    Messages
    395
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Hauts de Seine (Île de France)

    Informations professionnelles :
    Activité : Développeur en SAS/ Statisticien
    Secteur : Enseignement

    Informations forums :
    Inscription : janvier 2013
    Messages : 395
    Points : 1 362
    Points
    1 362

    Par défaut

    Bonjour,
    A près la découpage en classe de la variable Age en utilisant la Proc TRANSREG, c’est la proc CORRESP qu’il faudrait utiliser afin de réaliser une analyse factorielle des correspondance pas la ACP avec la proc PRINCOMP.

    Bon Courage
    Ward

  3. #3
    Futur Membre du Club
    Femme Profil pro
    Étudiant
    Inscrit en
    juillet 2017
    Messages
    7
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Localisation : France, Gard (Languedoc Roussillon)

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : juillet 2017
    Messages : 7
    Points : 7
    Points
    7

    Par défaut rectifications

    Je m'excuse je me trompée, je part en fait de données QUALITATIVES pour obtenir des données QUANTITATIVES.
    Tous semble fonctionner du coté de cette conversion.
    Seulement j'aimerais savoir si je dois supprimer de mon analyses les données mal représentés sur mes axes sectionnés ou si au contraire ceux-ci ont leur importance.
    D'autre part j'utilise en fin de classification le test de Kruskal-Wallis me permettant de comprendre ce que contient chaque cluster (l'analyse visuelle d'un graphique étant impossible dû au grand nombre de données) ma segmentation concerne uniquement l'âge.
    Mes variables âge sont mal représentées sur mes axes choisis ( valeur proche de 0 ) et aussi lors des résultats du test de Kruskal-Wallis ma segmentation semble étrange je n'obtient que de 2 classes alors que je devrais en avoir minimum 3 .....

Discussions similaires

  1. Classification grand nombre de variable qualitative
    Par JG6984 dans le forum Autres Logiciels
    Réponses: 0
    Dernier message: 12/07/2017, 19h13
  2. Générer un grand nombre de variables aléatoires
    Par hazaki dans le forum Débuter
    Réponses: 3
    Dernier message: 31/01/2011, 10h35
  3. Réponses: 4
    Dernier message: 05/07/2009, 16h38
  4. Réponses: 2
    Dernier message: 18/08/2008, 18h53
  5. Réponses: 4
    Dernier message: 03/02/2007, 21h27

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo