IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Statistiques, Data Mining et Data Science Discussion :

Traitement des valeurs manquantes


Sujet :

Statistiques, Data Mining et Data Science

  1. #1
    Membre à l'essai
    Homme Profil pro
    Inscrit en
    Octobre 2011
    Messages
    47
    Détails du profil
    Informations personnelles :
    Sexe : Homme

    Informations forums :
    Inscription : Octobre 2011
    Messages : 47
    Points : 24
    Points
    24
    Par défaut Traitement des valeurs manquantes
    bonjour à tous
    comment traiter les valeurs manquante de ce qui suit on dispose de 140 cas ayant eu covid dont 20 sont des cas suspect et les autres confirmés on dispose de 40 cas dont le nombre de jours d'arret de travail est connu et les 100 autres non
    comment alors faire pour les données manquantes est ce qu'on met la moyenne des valeurs existante ?
    Merci infiniment d'avance pour toute réponse

  2. #2
    Rédacteur/Modérateur

    Homme Profil pro
    Ingénieur qualité méthodes
    Inscrit en
    Décembre 2013
    Messages
    4 057
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Ingénieur qualité méthodes
    Secteur : Conseil

    Informations forums :
    Inscription : Décembre 2013
    Messages : 4 057
    Points : 9 396
    Points
    9 396
    Par défaut
    Commençons par un cas plus simple :
    on dispose de 140 cas ayant eu covid ; on dispose de 40 cas dont le nombre de jours d'arret de travail est connu et les 100 autres non
    J'enlève donc ce qui concerne les cas 'suspects'.
    Une première étape est de faire un test de normalité. Si les 40 cas suivent une loi normale, la moyenne de ces 40 cas a un sens, et c'est ça qu'on va appliquer.
    Si les 40 cas connus ne suivent pas une loi normale (en gros, on a 30 cas qui ont été arrêtés 3 ou 4 jours, et les 10 autres ont été arrêtés beaucoup plus longtemps, jusqu'à 2 mois par exemple).
    Dans ce cas, c'est plus problématique.
    Selon ce que tu vas faire avec les données ensuite, tu peux utiliser la moyenne, ou la médiane. Ou peut-être autre chose encore.
    Tu peux aussi utiliser des statistiques 'nationales', si tu trouves des sources fiables. Ok, sur les 40 cas de ton entreprise pour lesquels tu as les chiffres, ça s'est passé comme ça, mais 40 cas, ce n'est pas forcément représentatif, et tu décides (comme un chef) de prendre des chiffres officiels, plus fiables.

    Ce que tu ajoutes avec les cas suspects, je ne sais pas ce que tu attends comme réponse à ce sujet.
    N'oubliez pas le bouton Résolu si vous avez obtenu une réponse à votre question.

  3. #3
    Membre à l'essai
    Homme Profil pro
    Inscrit en
    Octobre 2011
    Messages
    47
    Détails du profil
    Informations personnelles :
    Sexe : Homme

    Informations forums :
    Inscription : Octobre 2011
    Messages : 47
    Points : 24
    Points
    24
    Par défaut
    Citation Envoyé par tbc92 Voir le message
    Commençons par un cas plus simple :
    [I]

    Ce que tu ajoutes avec les cas suspects, je ne sais pas ce que tu attends comme réponse à ce sujet.
    bonjour merci pour la réponse pour les cas suspects se ne sont pas des cas covid mais des gens qui ont contacté des cas covid et ont par la suite eu des congés pur cette cause

    en ce qui concerne l'estimation des valeurs manquantes j'ai réfléchis à la méthode k-moyenne (k-means) mais mon problème ce qu'il y a une autre variable explicative qui est les maladies chroniques qui influence les données
    comment puisse je faire svp
    merci infiniment d'avance pour toute réponse

Discussions similaires

  1. Traitement des valeurs manquantes
    Par thms92 dans le forum SAS STAT
    Réponses: 2
    Dernier message: 22/04/2013, 15h28
  2. Interpolation linéraire des valeurs manquantes
    Par j_ere_my dans le forum MATLAB
    Réponses: 17
    Dernier message: 27/11/2008, 17h15
  3. Changement des valeurs manquantes NA par 0
    Par fafabzh6 dans le forum R
    Réponses: 3
    Dernier message: 01/04/2008, 17h24
  4. renseigner des valeurs manquantes
    Par mouche dans le forum Requêtes et SQL.
    Réponses: 8
    Dernier message: 25/05/2007, 12h00
  5. [Tableaux] Traitement des valeurs d'une CheckBox
    Par Alex70 dans le forum Langage
    Réponses: 12
    Dernier message: 18/04/2007, 16h38

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo