IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

R Discussion :

Données manquantes et blancs


Sujet :

R

  1. #1
    Membre du Club
    Profil pro
    Inscrit en
    Août 2009
    Messages
    51
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Août 2009
    Messages : 51
    Points : 49
    Points
    49
    Par défaut Données manquantes et blancs
    J'ai un réel problème avec les données manquantes.
    Je pars d'un fichier csv que j'importe dans R.

    Une fois le fichier csv importé dans R, pour certaines variables les données manquantes apparaissent bien en "NA" et pour d'autres variables les données manquantes apparaissent comme ça : ""

    D'autres part, quand je transforme une variables de 'numeric' à 'as.factor', une donnée manquante en "NA" se transforme en "".

    Est-ce que vous pouvez m'éclairer? et comment changer ces "" en "NA"

    Merci bien.

  2. #2
    Membre expert
    Avatar de pitipoisson
    Homme Profil pro
    Chercheur
    Inscrit en
    Septembre 2006
    Messages
    1 942
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 44
    Localisation : France, Finistère (Bretagne)

    Informations professionnelles :
    Activité : Chercheur
    Secteur : Agroalimentaire - Agriculture

    Informations forums :
    Inscription : Septembre 2006
    Messages : 1 942
    Points : 3 378
    Points
    3 378
    Par défaut
    Bonjour,

    Comme toujours, quelques lignes incriminées du csv + les lignes de code pour l'importer sont nécessaire pour répondre à ta question.
    Forum LaTeX : pour des réponses rapides et appropriées, pensez à poster un
    ECM = Exemple (reproduit le problème) Complet (document compilable) Minimal (ne postez pas votre thèse !)

    Une solution vous convient ? N'oubliez pas le tag


    )><))))°>

  3. #3
    Membre du Club
    Profil pro
    Inscrit en
    Août 2009
    Messages
    51
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Août 2009
    Messages : 51
    Points : 49
    Points
    49
    Par défaut
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    n	jour_pl	pcpn	nbheure	scanner	pcr	entourage
    25	2	5	0	0	0	0
    26	2		0	0		1
    31	5	34		1	1	
    32		20	0		0	0
    23	6	15		0	0	0
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    mening <-  read.csv2("C:/Documents and Settings/stagiaire/Bureau/Meningite3.csv",header=TRUE)
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    mening$jour_pl <- factor(mening$jour_pl, exclude = NULL)
    mening$pcpn <- as.numeric(mening$pcpn)
    mening$nbheure <- as.numeric(as.character(mening$nbheure))
    mening$scanner <- factor(mening$scanner, exclude = NULL)
    mening$pcr<- factor(mening$pcr, exclude = NULL)
    mening$entourage <- factor(mening$entourage, exclude = NULL)
    Avec ces codes j'arrive à m'en sortir un peu.
    les données manquantes ne sont pas affichées en "NA" dans la table mais en "".
    Cependant elles sont bien considérées comme des données manquantes, même si elles sont comptabilisées en suite dans mes graphiques ou elles apparaissent comme une entité.

    comment faire en sorte qu'elles soient bien considérées complétement manquantes y compris quand j'affiche la table et qu'elles apparaissent bien en "NA"?

  4. #4
    Membre habitué
    Inscrit en
    Mai 2010
    Messages
    74
    Détails du profil
    Informations forums :
    Inscription : Mai 2010
    Messages : 74
    Points : 164
    Points
    164
    Par défaut
    L'idéal c'est de savoir comment sont codées les valeurs manquantes dans le fichier de base avant d'importer...le plus important sera dans ton cas l'option
    "na.string". Pour être plus claire : si par exemple elles sont codées ".."
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
     
    meninge <- read.csv2("...../meningite.csv",header=TRUE,na.strings="..")
    donc regarde dans ton fichier et tu pourra remplacer ".." par ce qu'il y'a

    autre option interessante lors de l'importation : c'est colClasses. Je te conseille de de faire un ?read.table

Discussions similaires

  1. Remplacer toutes les données manquantes
    Par PhYx dans le forum SAS Base
    Réponses: 6
    Dernier message: 04/07/2013, 12h09
  2. Fournisseur de données ou paquets de données manquants
    Par muadhib dans le forum Bases de données
    Réponses: 2
    Dernier message: 10/10/2007, 16h56
  3. [Oracle][Delphi]Données manquantes apre sun select
    Par LAPLACE dans le forum Oracle
    Réponses: 3
    Dernier message: 24/09/2007, 13h40
  4. mauvais controlfile créé - données manquantes
    Par saptech dans le forum Administration
    Réponses: 6
    Dernier message: 01/07/2007, 13h06
  5. Remplacement données manquantes
    Par HurtMarley dans le forum MS SQL Server
    Réponses: 4
    Dernier message: 11/07/2006, 11h36

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo