IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

R Discussion :

[RStudio] Plus de Levels que d'observations ?


Sujet :

R

  1. #1
    Membre du Club
    Homme Profil pro
    Etudiant - Toulouse
    Inscrit en
    Avril 2017
    Messages
    57
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 26
    Localisation : France, Seine Maritime (Haute Normandie)

    Informations professionnelles :
    Activité : Etudiant - Toulouse

    Informations forums :
    Inscription : Avril 2017
    Messages : 57
    Points : 42
    Points
    42
    Par défaut [RStudio] Plus de Levels que d'observations ?
    Salut,

    J'ai fais un échantillon de ma population grâce à :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
     
    data_ech <- data[sample(1:nrow(data),100,replace = TRUE),]
    Je donc bien une table avec 100 observations sauf que quand je fais des tests dessus par exemples :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
     
    unique(data_ech$var)
    j'obtiens :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
     
    > unique(data_ech$var)
     [1]........
    [13] .......
    [25] ........
    [37]..........
    [49].........
    1085 Levels: ...............................
    Il y a bien 1085 levels dans la table de base mais pourquoi je le retrouve dans l'échantillon ? une idée ?

    Mano

  2. #2
    Membre actif Avatar de Alpacky
    Homme Profil pro
    .
    Inscrit en
    Mars 2014
    Messages
    99
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 34
    Localisation : France

    Informations professionnelles :
    Activité : .

    Informations forums :
    Inscription : Mars 2014
    Messages : 99
    Points : 200
    Points
    200
    Par défaut
    Bonjour,

    Vous conservez l'ensemble des niveaux des facteurs même en échantillonnant, rien d'anormal.
    Les niveaux peuvent être inutilisés dans votre échantillonnage.
    Vous pouvez les exclure avec la fonction factor, voir l'help de la fonction : https://stat.ethz.ch/R-manual/R-deve...ml/factor.html .

    en espérant que cela soit utile,
    cdt,

  3. #3
    Membre du Club
    Homme Profil pro
    Etudiant - Toulouse
    Inscrit en
    Avril 2017
    Messages
    57
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 26
    Localisation : France, Seine Maritime (Haute Normandie)

    Informations professionnelles :
    Activité : Etudiant - Toulouse

    Informations forums :
    Inscription : Avril 2017
    Messages : 57
    Points : 42
    Points
    42
    Par défaut
    Oui merci ca va m'être bien utile avec l'argument exclude.
    Mais je ne comprend toujours pas pourquoi je conserve tout les niveaux alors que dans ma nouvelle table il n'y a justement plus tout ces niveaux...

    Mano

  4. #4
    Membre éclairé
    Homme Profil pro
    Ingénieur de recherche
    Inscrit en
    Janvier 2012
    Messages
    325
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Ingénieur de recherche
    Secteur : Agroalimentaire - Agriculture

    Informations forums :
    Inscription : Janvier 2012
    Messages : 325
    Points : 888
    Points
    888
    Par défaut
    Les niveaux sont à comprendre comme étant la liste des valeurs possibles, pas des valeurs effectivement présentes.

    Si tu as un facteur sexe, tes niveaux seront male/femelle, peu importe que ce soit dans un groupe mixte ou dans un groupe ne contenant que l'un des deux sexes.

  5. #5
    Membre éclairé
    Homme Profil pro
    Chercheur
    Inscrit en
    Décembre 2015
    Messages
    327
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Haute Garonne (Midi Pyrénées)

    Informations professionnelles :
    Activité : Chercheur
    Secteur : Enseignement

    Informations forums :
    Inscription : Décembre 2015
    Messages : 327
    Points : 793
    Points
    793
    Par défaut
    Pour nettoyer ta nouvelle table des niveaux inutilisés au moment de la créer, tu peux utiliser la fonction droplevels.

  6. #6
    Membre du Club
    Homme Profil pro
    Etudiant - Toulouse
    Inscrit en
    Avril 2017
    Messages
    57
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 26
    Localisation : France, Seine Maritime (Haute Normandie)

    Informations professionnelles :
    Activité : Etudiant - Toulouse

    Informations forums :
    Inscription : Avril 2017
    Messages : 57
    Points : 42
    Points
    42
    Par défaut
    D'accord merci à vous j'ai lu pas mal de doc ce matin en plus de vos commentaires, cela m'a bien éclairé sur le fonctionnement des niveaux. Parfait !
    Mano

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. \parpic crée plus de boîtes que je ne lui demande
    Par Symonski dans le forum Programmation (La)TeX avancée
    Réponses: 0
    Dernier message: 16/08/2007, 10h28
  2. pourquoi mes champs INPUT prennent plus de place que la normal ?
    Par Ekimasu dans le forum Balisage (X)HTML et validation W3C
    Réponses: 12
    Dernier message: 21/05/2007, 11h50
  3. Réponses: 3
    Dernier message: 15/02/2006, 12h27
  4. [ORACLE 8.1.7.3] Plus de parse que d'execute ?
    Par had69 dans le forum Oracle
    Réponses: 8
    Dernier message: 24/10/2005, 13h54

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo