IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Méthodes prédictives Discussion :

Sélection de variables


Sujet :

Méthodes prédictives

  1. #1
    Membre du Club
    Femme Profil pro
    Étudiant
    Inscrit en
    Avril 2016
    Messages
    185
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 33
    Localisation : Suisse

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Avril 2016
    Messages : 185
    Points : 51
    Points
    51
    Par défaut Sélection de variables
    Bonjour,
    j'ai un ensemble de données quand j'ai appliqué acp j'ai obtenus des variables qui sont mals représentées
    alors quand j'ai fait mon modèle GLM y(quali) en fonction des autres variables les variables mals représentées en acp sont significatives dans le modèle?
    et le taux de bon classement est de 99,75%
    puis j'ai éliminé ces variables et j'ai refait le glm et j'ai trouvé un taux de bon classement de 99.71 % ? cela veut dire que ces variables n'ont pas une bonne contribution dans le modèle donc je dois les éliminer malgrés significatives ?
    Il est à noter que lorsque j'ai appliqué les algo de sélection forward backward et stepwise ces varibles ont resté dans le modèle final?
    En fait je ne peux pas conclure sur tous ces résultats
    Merci infiniment d'avance pour toute réponse

  2. #2
    Membre éprouvé

    Homme Profil pro
    Cyber Security & AI
    Inscrit en
    Février 2009
    Messages
    506
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Oise (Picardie)

    Informations professionnelles :
    Activité : Cyber Security & AI

    Informations forums :
    Inscription : Février 2009
    Messages : 506
    Points : 1 189
    Points
    1 189
    Billets dans le blog
    2
    Par défaut
    Bonjour,

    Tu peux avoir des composantes de ton Analyse en Composante Principale comportant peu d'information, mais très significative dans ta régression. Les composantes principales ne sont pas systématiquement les composantes les plus pertinentes pour représenter les données en fonction d'une variable cible.

    L'ACP est un élément de représentation de ton espace alors que la régression est un élément de liaison. Ton espace peut être très large et un recoin peut être très important comme élément pour un paramètre particulier.

    Au plaisir de te lire.

  3. #3
    Membre du Club
    Femme Profil pro
    Étudiant
    Inscrit en
    Avril 2016
    Messages
    185
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 33
    Localisation : Suisse

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Avril 2016
    Messages : 185
    Points : 51
    Points
    51
    Par défaut
    Donc je garde les variables a1, a2, a3, p1,p2,p3 dans la régression s'achant que quand je les ai éliminés le taux de bon classement n'a diminué que de 0.04% en plus les algos de sélections ne les ont pas éliminés ?

    et comment puisse je commenter l'ACP suivante
    Nom : fo.png
Affichages : 210
Taille : 63,1 Ko
    merci infiniment d'avance pour toute réponse

  4. #4
    Rédacteur/Modérateur

    Homme Profil pro
    Ingénieur qualité méthodes
    Inscrit en
    Décembre 2013
    Messages
    4 054
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Ingénieur qualité méthodes
    Secteur : Conseil

    Informations forums :
    Inscription : Décembre 2013
    Messages : 4 054
    Points : 9 394
    Points
    9 394
    Par défaut
    En statistiques, on aime bien les variables 'normales', et les courbes en forme de cloches.
    Ici, tu as des données qui ne suivent pas du tout une loi normale.
    Ma boule de cristal me dit qu'une transformation logarithmique permettrait de nettement améliorer ton analyse, mais ma boule de cristal manque d'informations pour te renseigner plus.
    N'oubliez pas le bouton Résolu si vous avez obtenu une réponse à votre question.

  5. #5
    Membre du Club
    Femme Profil pro
    Étudiant
    Inscrit en
    Avril 2016
    Messages
    185
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 33
    Localisation : Suisse

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Avril 2016
    Messages : 185
    Points : 51
    Points
    51
    Par défaut
    Bonjour, appliquer le logarithme sur des nombres,distances ,moyennes, énergies et écart types a t-il un sens ?
    si non que puis je dire à propos de l'image ci-dessus
    en effet, je dois traiter le côté descriptif et prédictif de mes données
    donc j'ai eu recours à l'ACP en premier temps (donc je vais dire que le groupe malade et non malade sont dissociés)
    puis je vais appliquer (glm, ALD, réseaux de neurones ) pour voir la relation entre la variable(malade/non malades) et les autres variables (quantitatives)
    ce que je voulais savoir c que l'ACP n'intervient que dans le fait de dire qu'on a deux groupes dissociés (ou elle intervient encore dans la sélection de variable)
    En effet, j'ai cherché sur internet une étude complète de données de l'etude descriptive à l'éude prédictive mais j'ai pas trouvé
    Merci infiniment d'avance pour toute réponse

  6. #6
    Rédacteur/Modérateur

    Homme Profil pro
    Ingénieur qualité méthodes
    Inscrit en
    Décembre 2013
    Messages
    4 054
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Ingénieur qualité méthodes
    Secteur : Conseil

    Informations forums :
    Inscription : Décembre 2013
    Messages : 4 054
    Points : 9 394
    Points
    9 394
    Par défaut
    Citation Envoyé par jeuneprincesse Voir le message
    Bonjour, appliquer le logarithme sur des nombres,distances ,moyennes, énergies et écart types a t-il un sens ?
    Cette question a-t-elle un sens ? Je ne crois pas.

    Mais comme tu tiens à cultiver le mystère, plutôt qu'à avoir des réponses, notre collaboration va s'arrêter là.
    N'oubliez pas le bouton Résolu si vous avez obtenu une réponse à votre question.

  7. #7
    Membre du Club
    Femme Profil pro
    Étudiant
    Inscrit en
    Avril 2016
    Messages
    185
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 33
    Localisation : Suisse

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Avril 2016
    Messages : 185
    Points : 51
    Points
    51
    Par défaut
    Bonjour, je ne crois pas qu'avoir des connaissances limités en statistiques est considéré comme une culture de mystère !
    bon j'ai posé la question parce que les variables que j'ai sont des descripteurs d'image tel que énergie, écart type, moyenne après l'application du log ça donne quoi ?

    merci

  8. #8
    Membre éprouvé

    Homme Profil pro
    Cyber Security & AI
    Inscrit en
    Février 2009
    Messages
    506
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Oise (Picardie)

    Informations professionnelles :
    Activité : Cyber Security & AI

    Informations forums :
    Inscription : Février 2009
    Messages : 506
    Points : 1 189
    Points
    1 189
    Billets dans le blog
    2
    Par défaut
    Bonjour JeunePrincesse,

    Pour l'ACP elle intervient essentiellement dans la représentation des données et l'analyse descriptive.

    L'impliquer dans un modèle prédictif pose le risque que tu as soulevé, cela permet de simplifier les calculs et donc le temps de traitement mais tu ne peux rien conclure sur la qualité des résultats.

    Les deux groupes sont bien séparés sur les deux dimensions, tu peux regarder s’ils continuent à l'être dans les autres dimensions, mais tu ne pourras toujours rien conclure sur le modèle prédictif.

    Au plaisir de te lire.

  9. #9
    Membre du Club
    Femme Profil pro
    Étudiant
    Inscrit en
    Avril 2016
    Messages
    185
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 33
    Localisation : Suisse

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Avril 2016
    Messages : 185
    Points : 51
    Points
    51
    Par défaut
    Merci beaucoup pour la réponse,
    je sais que je ne peux rien conclure sur le modèle prédictif en utiisant ACP mais je ne sais pas comment interpréter le fait que lorsque j'ai éliminé des variables j'ai eu un taux de bon classement un peu moins de ceui contenant ttes les variables ? cela veut dire ces variables sont inutiles car dans le modèle prédictif on a besoin de le plus petit nombre de variables ? ce qui m'étonne encore plus est que ces variables là ne sont pas négligés par es algos de sélection tel que forward et backward ! merci d'avance pour toute aide
    s'il vous plait ya t il des sites contenant des études de cas complètes (analyse descriptive et analyse prédictive) merci infiniment d'avance pour toute réponse

Discussions similaires

  1. Sélection plage variable
    Par Yoooo dans le forum Macros et VBA Excel
    Réponses: 5
    Dernier message: 16/05/2018, 12h09
  2. Merge avec sélection de variables ?
    Par Froggy007 dans le forum R
    Réponses: 2
    Dernier message: 26/09/2011, 19h21
  3. Sélection de variables finissant par le même mot
    Par Maggy dans le forum SAS Base
    Réponses: 13
    Dernier message: 28/01/2011, 15h23
  4. Régression logistique : sélection de variables
    Par Najua dans le forum SAS STAT
    Réponses: 3
    Dernier message: 22/05/2010, 12h07
  5. [MySQL] probleme de sélection de variable
    Par Larffas dans le forum PHP & Base de données
    Réponses: 9
    Dernier message: 19/10/2007, 10h17

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo