IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

SAS STAT Discussion :

nombre de composantes principales (ACP)


Sujet :

SAS STAT

  1. #1
    Membre à l'essai
    Femme Profil pro
    Étudiant
    Inscrit en
    Mars 2016
    Messages
    16
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 35
    Localisation : France, Somme (Picardie)

    Informations professionnelles :
    Activité : Étudiant
    Secteur : Santé

    Informations forums :
    Inscription : Mars 2016
    Messages : 16
    Points : 13
    Points
    13
    Par défaut nombre de composantes principales (ACP)
    bonjour, j'ai réalisé une ACP pour minimiser mon nombre de pesticides, j'ai donc pris les composantes selon l'éboulis et j'ai pris les variables avant le coude. j'ai donc trouvé 2 valeurs, par contre, la proportion cumulée de ces deux valeurs ne me donnent que 26% de la variance d'expliquée par ces deux variables. Dois-je considérer mon ACP comme interprétable ?
    merci

  2. #2
    Membre éprouvé
    Avatar de Haache
    Homme Profil pro
    Doctorant & Ingénieur Statiaticien Economiste
    Inscrit en
    Mars 2014
    Messages
    349
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 31
    Localisation : Canada

    Informations professionnelles :
    Activité : Doctorant & Ingénieur Statiaticien Economiste

    Informations forums :
    Inscription : Mars 2014
    Messages : 349
    Points : 1 009
    Points
    1 009
    Billets dans le blog
    8
    Par défaut
    Bonjour
    26% c'est faible. Il faut avoir de doute.
    Vous avez combien de variables dans la base? Sûrement que les variables ne sont pas vraiment corrélées.
    Moi personnellement, je vous conseille de pousser l'analyse un peu plus loin. Utiliser d'autres axes aussi.
    Aussi j'aimerais savoir la finalité de votre étude.
    • Faites un tour sur mon siteweb professionnel www.aristideelysee.16mb.com Des codes dans la section "media et code" pouvant vous aider que vous pouvez aussi partager sur les réseaux sociaux.
    • Visiter mon blog en cliquant ici! Des techniques, astuces et macros pour l'analyse quantitative.

  3. #3
    Membre régulier Avatar de Clairant
    Homme Profil pro
    Doctorant en économie (UdeM), Ingénieur Statisticien Economiste
    Inscrit en
    Mars 2015
    Messages
    79
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Canada

    Informations professionnelles :
    Activité : Doctorant en économie (UdeM), Ingénieur Statisticien Economiste

    Informations forums :
    Inscription : Mars 2015
    Messages : 79
    Points : 71
    Points
    71
    Par défaut
    Bonjour,
    Haache l'a bien souligné. En fait, la part d'inertie apportée par ces axes est très négligeable. Au delà de la vérification de la corrélation entre ces variables, il faut appliquer la méthode de "Rotation des Axes". Cette méthode est beaucoup robuste et permet d'identifier le facteur le plus corrélé à chacune des variables d'intérêt.
    Vous pouvez télécharger ce fichier pour mieux comprendre l'intuition qui a derrière : eric.univ-lyon2.fr/~ricco/tanagra/fichiers/fr_Tanagra_Pca_Varimax.pdf
    Bon courage.
    **************************************************************************************************************************************************************
    L'avenir est dans le numérique.

    **********************************************************

  4. #4
    Membre éprouvé
    Avatar de Haache
    Homme Profil pro
    Doctorant & Ingénieur Statiaticien Economiste
    Inscrit en
    Mars 2014
    Messages
    349
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 31
    Localisation : Canada

    Informations professionnelles :
    Activité : Doctorant & Ingénieur Statiaticien Economiste

    Informations forums :
    Inscription : Mars 2014
    Messages : 349
    Points : 1 009
    Points
    1 009
    Billets dans le blog
    8
    Par défaut
    Oui la rotation d'axes. Mais cette méthode ne résout pas le problème. Parce qu'on ne peut jamais représenter plus de 20% de l'inertie de manière simultanée. C'est pourquoi je demande le nombre de variables. Peut être qu'une ACP n'est pas vraiment adaptée à l'analyse (je pense à une AFM ou une sélection de variables d'abord). Donc il est important de connaitre la finalité de l'étude.
    • Faites un tour sur mon siteweb professionnel www.aristideelysee.16mb.com Des codes dans la section "media et code" pouvant vous aider que vous pouvez aussi partager sur les réseaux sociaux.
    • Visiter mon blog en cliquant ici! Des techniques, astuces et macros pour l'analyse quantitative.

  5. #5
    Membre à l'essai
    Femme Profil pro
    Étudiant
    Inscrit en
    Mars 2016
    Messages
    16
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 35
    Localisation : France, Somme (Picardie)

    Informations professionnelles :
    Activité : Étudiant
    Secteur : Santé

    Informations forums :
    Inscription : Mars 2016
    Messages : 16
    Points : 13
    Points
    13
    Par défaut
    Bonjour,
    j'ai 11 variables qui correspondent à des concentrations de pesticides exposés chez mes sujets.
    le but est donc de regrouper certains pesticides ensembles à l'aide d'une ACP.

  6. #6
    Membre éprouvé
    Avatar de Haache
    Homme Profil pro
    Doctorant & Ingénieur Statiaticien Economiste
    Inscrit en
    Mars 2014
    Messages
    349
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 31
    Localisation : Canada

    Informations professionnelles :
    Activité : Doctorant & Ingénieur Statiaticien Economiste

    Informations forums :
    Inscription : Mars 2014
    Messages : 349
    Points : 1 009
    Points
    1 009
    Billets dans le blog
    8
    Par défaut
    Dans ce cas je proposerais ceci :

    Il faut d'abord retenir un nombre d'axes suffisant pour l'analyse de manière à avoir au moins 65% sinon 60% de l'inertie totale.
    Pour chaque variable, détecter l'axe auquel elle a une forte contribution. Si vous retenez par exemple 4 axes, vous pouvez affecter un axe à chacune des variables (en se basant sur la contribution). Ceci vous permettra d'avoir 4 groupes de variables. Au sein de chaque groupe on peut dire qu'il y a une homogénéité en ce sens que chaque variable du groupe contribue fortement à la formation d'un même axe. Ce axe décrit donc les caractéristiques de vos individus selon ce groupe de variables. Par ailleurs, entre deux groupes, il y a une hétérogénéité par ce que deux groupes contribuent à la formation de deux axes différents (les axes sont orthogonaux donc indépendants).
    C'est cette méthode qui est utilisée pour classer les variables lorsqu'on veut construire un indicateur synthétique.

    Pour raffiner le résultat, je suggère de compléter votre analyse par une proc varclus. Cette procédure permet de faire une classification des variables.
    • Faites un tour sur mon siteweb professionnel www.aristideelysee.16mb.com Des codes dans la section "media et code" pouvant vous aider que vous pouvez aussi partager sur les réseaux sociaux.
    • Visiter mon blog en cliquant ici! Des techniques, astuces et macros pour l'analyse quantitative.

  7. #7
    Membre à l'essai
    Femme Profil pro
    Étudiant
    Inscrit en
    Mars 2016
    Messages
    16
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 35
    Localisation : France, Somme (Picardie)

    Informations professionnelles :
    Activité : Étudiant
    Secteur : Santé

    Informations forums :
    Inscription : Mars 2016
    Messages : 16
    Points : 13
    Points
    13
    Par défaut
    merci de votre réponse, le problème est que pour avoir 60% d'inertie totale, je dois prendre minimum 6 axes sur 10 variables (une variable n'est plus rentrée dedans car constante valeurs 0).

  8. #8
    Membre éprouvé
    Avatar de Haache
    Homme Profil pro
    Doctorant & Ingénieur Statiaticien Economiste
    Inscrit en
    Mars 2014
    Messages
    349
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 31
    Localisation : Canada

    Informations professionnelles :
    Activité : Doctorant & Ingénieur Statiaticien Economiste

    Informations forums :
    Inscription : Mars 2014
    Messages : 349
    Points : 1 009
    Points
    1 009
    Billets dans le blog
    8
    Par défaut
    Si pour 10 variables il faut au moins 6 avant d'avoir 60% de l'inertie totale c'est qu'il y a un problème. Il n'y a pas une liaison entre vos variables. La plupart des variables sont indépendantes et ce serait difficile de construire des groupes homogènes de variables. Qu'en est - il de votre matrice de corrélation ?
    • Faites un tour sur mon siteweb professionnel www.aristideelysee.16mb.com Des codes dans la section "media et code" pouvant vous aider que vous pouvez aussi partager sur les réseaux sociaux.
    • Visiter mon blog en cliquant ici! Des techniques, astuces et macros pour l'analyse quantitative.

  9. #9
    Membre à l'essai
    Femme Profil pro
    Étudiant
    Inscrit en
    Mars 2016
    Messages
    16
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 35
    Localisation : France, Somme (Picardie)

    Informations professionnelles :
    Activité : Étudiant
    Secteur : Santé

    Informations forums :
    Inscription : Mars 2016
    Messages : 16
    Points : 13
    Points
    13
    Par défaut
    Sur la matrice de corrélation, les variables ne sont pas du tout corrélées, la corrélation la plus forte est de 0.34, autrement les valeurs tournent autour de 0.

  10. #10
    Membre éprouvé
    Avatar de Haache
    Homme Profil pro
    Doctorant & Ingénieur Statiaticien Economiste
    Inscrit en
    Mars 2014
    Messages
    349
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 31
    Localisation : Canada

    Informations professionnelles :
    Activité : Doctorant & Ingénieur Statiaticien Economiste

    Informations forums :
    Inscription : Mars 2014
    Messages : 349
    Points : 1 009
    Points
    1 009
    Billets dans le blog
    8
    Par défaut
    Oui c'est la problème. La plus forte corrélation est de 0,34. Les variables sont plus ou moins indépendantes donc les regrouper ensembles pose un problème.
    Il y a trois situations. On doit choisir une

    1- Soit vous utilisez 2 à 3 axes (ça dépend du nombre de groupes a priori que vous voulez, peut - être qu'il y a une théorie derrière). Donc l'inertie sera faible. Vous faites votre regroupement mais en étant sûr qu'il n'est pas trop bon. En effet le regroupement voudrais que dans chaque groupe les variables soient semblables. Ce que vous n'aurez pas vraiment (parce qu'il n'y a pas de liaison entre vos variables).
    2- La deuxième est donc de construire plusieurs groupes (Peut - être avec les 6 axes). Vous aurez même des groupes avec une variable
    3- La dernière situation est de trouver des variables corrélées pour faire correctement votre analyse.

    De toutes les façons on ne peut pas faire une ACP avec des variables indépendantes et prétendre avoir une inertie élevée avec peu d'axes. Impossible, deux événements incompatibles.

    Même si vous utilisez la proc varclus, vous aurez un problème au niveau du dendrogramme. L'inertie sera faible.
    • Faites un tour sur mon siteweb professionnel www.aristideelysee.16mb.com Des codes dans la section "media et code" pouvant vous aider que vous pouvez aussi partager sur les réseaux sociaux.
    • Visiter mon blog en cliquant ici! Des techniques, astuces et macros pour l'analyse quantitative.

  11. #11
    Membre à l'essai
    Femme Profil pro
    Étudiant
    Inscrit en
    Mars 2016
    Messages
    16
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 35
    Localisation : France, Somme (Picardie)

    Informations professionnelles :
    Activité : Étudiant
    Secteur : Santé

    Informations forums :
    Inscription : Mars 2016
    Messages : 16
    Points : 13
    Points
    13
    Par défaut
    d'accord, j'ai déja regroupé les variables par catégories de pesticides ex: organochlorés etc. je vais donc supprimer cette ACP.
    Merci de votre réponse

  12. #12
    Membre régulier Avatar de Clairant
    Homme Profil pro
    Doctorant en économie (UdeM), Ingénieur Statisticien Economiste
    Inscrit en
    Mars 2015
    Messages
    79
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Canada

    Informations professionnelles :
    Activité : Doctorant en économie (UdeM), Ingénieur Statisticien Economiste

    Informations forums :
    Inscription : Mars 2015
    Messages : 79
    Points : 71
    Points
    71
    Par défaut
    Oui l'idée de l'ACP, est de retenir des composantes principales qui ne sont que la combinaison des variables du tableau initial afin d'identifier principalement la ressemblance et/ou la dissemblance entre les individus. Ainsi, vu que les coefficients de corrélation entre les variables sont très faibles, nous pouvons vraiment soupçonner une indépendance entre vos variables d'intérêt, du coups ce serait même difficile d'avoir des composantes principales qui synthétiseront les variables de départ. Généralement, dans ce cas, chaque variable risque de déterminer son axe. En effet, une ACP sur de telles variables n'a pas vraiment un intérêt en soi. Par ailleurs, vous pouvez utiliser un nombre de groupe généralement utilisée dans la théorie pour regrouper vos variables. Avec la proc varclus, vous risquez d'avoir des groupes avec une seule variable d’intérêt.
    Bon courage.
    **************************************************************************************************************************************************************
    L'avenir est dans le numérique.

    **********************************************************

  13. #13
    Membre à l'essai
    Femme Profil pro
    Étudiant
    Inscrit en
    Mars 2016
    Messages
    16
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 35
    Localisation : France, Somme (Picardie)

    Informations professionnelles :
    Activité : Étudiant
    Secteur : Santé

    Informations forums :
    Inscription : Mars 2016
    Messages : 16
    Points : 13
    Points
    13
    Par défaut
    merci pour vos réponses,
    pourquoi une proc varclus ne serait-elle pas possible ?

  14. #14
    Membre régulier Avatar de Clairant
    Homme Profil pro
    Doctorant en économie (UdeM), Ingénieur Statisticien Economiste
    Inscrit en
    Mars 2015
    Messages
    79
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Canada

    Informations professionnelles :
    Activité : Doctorant en économie (UdeM), Ingénieur Statisticien Economiste

    Informations forums :
    Inscription : Mars 2015
    Messages : 79
    Points : 71
    Points
    71
    Par défaut
    La proc varclus conduit à une partition d'un ensemble de variables numériques (quantitative) en classes disjointes, à partir de la matrice des corrélations ou de la matrice des variances covariances. Ainsi, varclus peut être utilisée pour réduire le nombre de variable mais l'algorithme repose sur l'analyse en composantes principales obliques. En effet, à partir d'un tableau initial à K variables on construit sous condition de corrélation entre les variables, p nouvelles variables (p inférieur K). Ces p nouvelles variables constituent les composantes principales qui ne sont rien d'autres que la combinaison linéaire des variables initiales. Comme tes coefficients de corrélation entre les variables sont très faibles, tu risques de trouver une variable par classe obtenu. Ainsi, on y gagne donc pas en terme d'information.
    **************************************************************************************************************************************************************
    L'avenir est dans le numérique.

    **********************************************************

  15. #15
    Nouveau Candidat au Club
    Femme Profil pro
    Enseignant
    Inscrit en
    Juillet 2016
    Messages
    1
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 34
    Localisation : Maroc

    Informations professionnelles :
    Activité : Enseignant

    Informations forums :
    Inscription : Juillet 2016
    Messages : 1
    Points : 1
    Points
    1
    Par défaut nombre de composantes principales
    bonjours
    svp, j'ai 11 variable et quand je réalise l'acp je trouve 5 axes principales et le graphique se dessine par 3 axes principales je voudrai savoir comment avoir 2 axes principales seulement
    merci

  16. #16
    Membre régulier Avatar de Clairant
    Homme Profil pro
    Doctorant en économie (UdeM), Ingénieur Statisticien Economiste
    Inscrit en
    Mars 2015
    Messages
    79
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Canada

    Informations professionnelles :
    Activité : Doctorant en économie (UdeM), Ingénieur Statisticien Economiste

    Informations forums :
    Inscription : Mars 2015
    Messages : 79
    Points : 71
    Points
    71
    Par défaut
    Bonjour dreams ahlam,
    C'est plus préférable de créer une nouvelle discussion pour votre préoccupation. Ainsi, les réponses des membres seront donc bien orientées.
    **************************************************************************************************************************************************************
    L'avenir est dans le numérique.

    **********************************************************

Discussions similaires

  1. l'analyse en composante principale ACP OU CPA
    Par imagerie médicale dans le forum Traitement d'images
    Réponses: 2
    Dernier message: 04/08/2011, 23h34
  2. Complexité temporelle de l'analyse en composantes principales (ACP)
    Par abidineb dans le forum Algorithmes et structures de données
    Réponses: 6
    Dernier message: 08/07/2011, 23h59
  3. L'analyse en composantes principales"ACP"
    Par rosa20 dans le forum Méthodes exploratoires
    Réponses: 0
    Dernier message: 17/05/2010, 14h26
  4. Analyse en composante principale (ACP ou PCA)
    Par rajaja dans le forum Méthodes exploratoires
    Réponses: 8
    Dernier message: 20/07/2009, 00h23
  5. ACP Analyse Composantes Principales
    Par Grodada dans le forum Méthodes exploratoires
    Réponses: 2
    Dernier message: 25/03/2008, 14h52

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo