IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

R Discussion :

Suppression des valeurs aberrantes


Sujet :

R

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Futur Membre du Club
    Femme Profil pro
    Étudiant
    Inscrit en
    Juin 2016
    Messages
    3
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 33
    Localisation : Maroc

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Juin 2016
    Messages : 3
    Par défaut Suppression des valeurs aberrantes
    Bonjour,
    Je realise une regression logistique avec le logiciel R. J'ai reussi à detecter mais je ne sais pas comment les supprimer. Pouvez vous m'indiquer comment faire svp merci d'avance

  2. #2
    Membre émérite

    Homme Profil pro
    Cyber Security & AI
    Inscrit en
    Février 2009
    Messages
    506
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Oise (Picardie)

    Informations professionnelles :
    Activité : Cyber Security & AI

    Informations forums :
    Inscription : Février 2009
    Messages : 506
    Billets dans le blog
    2
    Par défaut
    Il faut que tu sois un peut plus explicite sur ta démarche, tes résultats et toutes informations qui nous permettrons de comprendre et comment te répondre.

    Un peu de code serait le bien venu par exemple et une explication sur les données sur lesquelles tu travailles et comme tu détectes les valeurs aberrantes

    Au plaisir de te lire.

  3. #3
    Futur Membre du Club
    Femme Profil pro
    Étudiant
    Inscrit en
    Juin 2016
    Messages
    3
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 33
    Localisation : Maroc

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Juin 2016
    Messages : 3
    Par défaut Plus de précision
    Merci dey_ggy,
    En fait je fais une régression logistique où ma variable dépendante c'est le travail des femmes et beaucoup de variables explicatives. J'ai fait la régression avec R, j'ai détecté les valeurs aberrantes avec la distance de cook et la méthode des résidus de Pearson. Maintenant je veux supprimer ces valeurs aberrantes pour reprendre la régression sans elles. Voici le morceau de code utilisé pour afficher les observations aberrantes:

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    library(rms)
    reg2 = lrm(Y ~ QTYPE + Q122 + âgepremiermariage + plushautniveauf + grpeâge + nbretotalviv + nbretotal5viv + Q225 + Q410 + Désirnaissfuture + ideal2 + Q707 + participe + plushautniveaum)
    reg2
     
    e = rstandard(reg, type = "pearson")
    plot(e)
    e[abs(e) > 2]
    plot(reg, 4)
    cooks.distance(reg)[cooks.distance(reg) > 1]

  4. #4
    Membre émérite
    Homme Profil pro
    Chercheur
    Inscrit en
    Décembre 2015
    Messages
    327
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Haute Garonne (Midi Pyrénées)

    Informations professionnelles :
    Activité : Chercheur
    Secteur : Enseignement

    Informations forums :
    Inscription : Décembre 2015
    Messages : 327
    Par défaut
    Lignes 2 et 3, tu appelles le résultat de l'analyse reg2 et ensuite tu utilises reg. Quel est le lien entre ces deux variables ?

    Es-tu sur d'avoir besoin de toutes ces variables car plusieurs écueils dont trop de variables à estimer pour le nombre de sujets, colinéarités des prédicteurs... à vérifier

    Supprimer des lignes à partir de rstandard ou cooks.distance :
    Soit donnees les données analyses et res.ana, le résultat de l'analyse et donnees.moins.aberrants, les données 'nettoyées' des points aberrants :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    donnees.moins.aberrants <- donnees[rstandard( reg.ana) <= 2,]
    # ou
    donnees.moins.aberrants <- donnees[cooks.distance( reg.ana) <= valeur.seuil,]

  5. #5
    Futur Membre du Club
    Femme Profil pro
    Étudiant
    Inscrit en
    Juin 2016
    Messages
    3
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 33
    Localisation : Maroc

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Juin 2016
    Messages : 3
    Par défaut
    Merci Faubry la première méthode que vous avez proposée marche parfaitement !!

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Suppression des valeurs non numériques
    Par sniper75 dans le forum SAS Base
    Réponses: 10
    Dernier message: 28/01/2013, 16h10
  2. Suppression des valeurs orphelines
    Par Patrice Henrio dans le forum Langage SQL
    Réponses: 1
    Dernier message: 06/10/2012, 01h55
  3. Réponses: 4
    Dernier message: 14/05/2009, 15h15
  4. Détection des valeurs aberrantes
    Par Boolbola dans le forum R
    Réponses: 3
    Dernier message: 15/01/2009, 10h36
  5. Suppression des valeurs selon la date
    Par nefertari dans le forum Requêtes et SQL.
    Réponses: 3
    Dernier message: 08/01/2008, 11h26

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo