IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Calcul scientifique Python Discussion :

Variables qualitatives et quantitatives + imputation des données manquantes


Sujet :

Calcul scientifique Python

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Membre régulier
    Femme Profil pro
    Étudiant
    Inscrit en
    Février 2019
    Messages
    6
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Localisation : France, Ille et Vilaine (Bretagne)

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Février 2019
    Messages : 6
    Par défaut Variables qualitatives et quantitatives + imputation des données manquantes
    Bonjour,

    Je possède un jeu de données composé de variables qualitatives ainsi que de variables quantitatives. Cependant il possède des données manquantes.

    J'ai alors décidé de commencer par mettre les variables qualitatives en plusieurs variables binaires à l'aide de la fonction pandas.get_dummies pour ensuite appliquer une méthode d'imputation sklearn.impute.IterativeImputer. Cependant je remarque que, dès la transformation en dummies, pour les individus présentant une donnée manquante à une certaine variable qualitative "C", les variables binaires associées "C1", "C2" et "C3" ont toutes pris la valeur 0 et non une valeur Nan.

    De plus, même si le problème précédent finit par être réglé, je ne sais pas si la méthode d'imputation va permettre une bonne imputation de ces variables qualitatives (ie du groupe de variables binaires correspondant).

    C'est la première fois que je dois régler la présence de données manquantes, et consciente que c'est une étape importante, j'ai besoin de votre aide. Je vous remercie d'avance pour vos réponses

  2. #2
    Membre éprouvé
    Homme Profil pro
    Vagabong étudiant en annalyse du signal.
    Inscrit en
    Avril 2019
    Messages
    130
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 26
    Localisation : France, Isère (Rhône Alpes)

    Informations professionnelles :
    Activité : Vagabong étudiant en annalyse du signal.
    Secteur : High Tech - Multimédia et Internet

    Informations forums :
    Inscription : Avril 2019
    Messages : 130
    Par défaut c'est difficile de t'aider
    Bonjour,
    Je ne suis pas certain de comprendre le problème, et au vu du nombre de réponses, je dois pas être le seul
    De ce que j'ai cru comprendre, tu connais certains éléments d'une suite mais pas tous. Le but serai de trouver une valeur numérique aux éléments inconnus?
    Si je suis à côté de la plaque, tente une autre formulation, peut être en insérant du code et en expliquant le but de la manœuvre, cela devrai nous aider à comprendre. En tous cas en ce qui me concerne...

Discussions similaires

  1. Réponses: 3
    Dernier message: 11/08/2016, 16h36
  2. Réponses: 7
    Dernier message: 10/08/2015, 12h11
  3. Imputation des données manquantes
    Par oumanova dans le forum SAS STAT
    Réponses: 0
    Dernier message: 09/05/2015, 16h10
  4. Réponses: 3
    Dernier message: 16/04/2014, 10h40
  5. [MySQL] Introduire une variable dans requête SQL, insérer des données à la volée
    Par Ronan.f dans le forum PHP & Base de données
    Réponses: 18
    Dernier message: 29/04/2006, 22h10

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo