IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

R Discussion :

Appliquer "as.factor" à toutes les colonnes d'un data.frame


Sujet :

R

  1. #1
    Modératrice

    Femme Profil pro
    Statisticienne, Fondatrice de la société DACTA
    Inscrit en
    Juin 2010
    Messages
    893
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 35
    Localisation : France, Loire Atlantique (Pays de la Loire)

    Informations professionnelles :
    Activité : Statisticienne, Fondatrice de la société DACTA

    Informations forums :
    Inscription : Juin 2010
    Messages : 893
    Points : 2 673
    Points
    2 673
    Par défaut Appliquer "as.factor" à toutes les colonnes d'un data.frame
    Bonjour à tous,

    En fait je ne pose pas vraiment un problème ici mais plutôt quelque chose d'étrange que j'ai remarqué.
    Ci-dessous le code :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
    37
    38
    39
    40
    41
    42
    43
    44
    45
    46
    47
    48
    49
    50
    51
    52
    53
    54
    A<-sample(1:5,10,replace=TRUE)
    B<-sample(1:3,10,replace=TRUE)
    C<-sample(1:6,10,replace=TRUE)
     
    M<-data.frame(A,B,C)
     
    is.factor(M[,1])
    [1] FALSE
     
    summary(M)
           A              B              C      
     Min.   :1.00   Min.   :1.00   Min.   :1.0  
     1st Qu.:2.25   1st Qu.:1.25   1st Qu.:2.0  
     Median :4.50   Median :2.00   Median :5.0  
     Mean   :3.70   Mean   :2.10   Mean   :4.1  
     3rd Qu.:5.00   3rd Qu.:3.00   3rd Qu.:6.0  
     Max.   :5.00   Max.   :3.00   Max.   :6.0  
     
     
    ## test 1 ##
     
    M<-apply(M,2,as.factor)
     
    is.factor(M[,1])
    [1] FALSE
     
    summary(M)
     A     B     C    
     1:1   1:3   1:1  
     2:2   2:3   2:3  
     3:1   3:4   5:2  
     4:1         6:4  
     5:5   
     
     
    ## test 2 ##
     
    M<-data.frame(A,B,C)
     
    for(k in 1:ncol(M))
    {
    	M[,k]<-as.factor(M[,k])
    }
     
    is.factor(M[,1])
    [1] TRUE
     
    summary(M)
     A     B     C    
     1:1   1:3   1:1  
     2:2   2:3   2:3  
     3:1   3:4   5:2  
     4:1         6:4  
     5:5
    A quoi pensez-vous que cette différence puisse être dûe? Peut-être que c'est tout bête mais je ne vois pas trop...

    Bonne journée


    Cordialement,

    A.D.

    Forum R
    Fournir le code utilisé (pensez aux balises code !), les packages nécessaires, ainsi qu'un court mais représentatif extrait du jeu de données et les éventuels messages d'erreur.
    Recherche d'informations concernant R : RSiteSearch / tutoriels : http://r.developpez.com/cours/ .

    Pensez également au bouton "Résolu" et à voter (en bas à droite des messages) lorsque vous avez obtenu une réponse satisfaisante.

  2. #2
    Membre expert
    Avatar de pitipoisson
    Homme Profil pro
    Chercheur
    Inscrit en
    Septembre 2006
    Messages
    1 942
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 44
    Localisation : France, Finistère (Bretagne)

    Informations professionnelles :
    Activité : Chercheur
    Secteur : Agroalimentaire - Agriculture

    Informations forums :
    Inscription : Septembre 2006
    Messages : 1 942
    Points : 3 378
    Points
    3 378
    Par défaut
    Salut,

    C'est parce que la fonction apply simplifie le résultat en une matrice, et que tu ne peux avoir une matrice de facteur.

    Même un sapply tout seul te fera cette simplification.

    Pour arriver à tes fins, tu dois faire :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    > M2 <- as.data.frame(lapply(M, as.factor))
     
    > class(M2)
    [1] "data.frame"
     
    > class(M2[,1])
    [1] "factor"
    Ça tient au fait que lapply retourne une liste, sans faire la-dite simplification.
    Ça devrait d'ailleurs également marcher avec
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    M2 <- as.data.frame(sapply(M, as.factor, simplify=FALSE))
    Forum LaTeX : pour des réponses rapides et appropriées, pensez à poster un
    ECM = Exemple (reproduit le problème) Complet (document compilable) Minimal (ne postez pas votre thèse !)

    Une solution vous convient ? N'oubliez pas le tag


    )><))))°>

  3. #3
    Modératrice

    Femme Profil pro
    Statisticienne, Fondatrice de la société DACTA
    Inscrit en
    Juin 2010
    Messages
    893
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 35
    Localisation : France, Loire Atlantique (Pays de la Loire)

    Informations professionnelles :
    Activité : Statisticienne, Fondatrice de la société DACTA

    Informations forums :
    Inscription : Juin 2010
    Messages : 893
    Points : 2 673
    Points
    2 673
    Par défaut
    Merci pour cet éclaircissement pitipoisson !


    Cordialement,

    A.D.

    Forum R
    Fournir le code utilisé (pensez aux balises code !), les packages nécessaires, ainsi qu'un court mais représentatif extrait du jeu de données et les éventuels messages d'erreur.
    Recherche d'informations concernant R : RSiteSearch / tutoriels : http://r.developpez.com/cours/ .

    Pensez également au bouton "Résolu" et à voter (en bas à droite des messages) lorsque vous avez obtenu une réponse satisfaisante.

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Tri qui ne s'applique pas sur toutes les colonnes
    Par mercure07 dans le forum Qt
    Réponses: 2
    Dernier message: 20/02/2012, 12h03
  2. parcourir toutes les colonnes de toutes les tables???
    Par cha_cha dans le forum Langage SQL
    Réponses: 4
    Dernier message: 27/01/2006, 12h31
  3. Réponses: 11
    Dernier message: 14/12/2005, 13h45
  4. Toutes les colonnes d'une BDD
    Par mohamed dans le forum MS SQL Server
    Réponses: 3
    Dernier message: 16/09/2004, 14h12

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo