IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

R Discussion :

Utilisation de count via tapply


Sujet :

R

  1. #1
    Membre actif Avatar de habasque
    Homme Profil pro
    Ingénieur d'études
    Inscrit en
    Septembre 2006
    Messages
    530
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 42
    Localisation : France, Finistère (Bretagne)

    Informations professionnelles :
    Activité : Ingénieur d'études
    Secteur : Agroalimentaire - Agriculture

    Informations forums :
    Inscription : Septembre 2006
    Messages : 530
    Points : 296
    Points
    296
    Par défaut Utilisation de count via tapply
    Bonjour,

    Je cherche comment utiliser une fonction de comptage via la fonction tapply.
    Un exemple, à partir du jeu de données suivant:

    annee | mois | identifiant
    1998 | 02 | 1234
    1998 | 02 | 1234
    1998 | 02 | 1234
    1998 | 02 | 1235
    1998 | 02 | 1235

    je souhaiterais obtenir :

    annee | mois | nombre_identifiant
    1998 | 02 | 2

    est-ce que quelqu'un pourrait m'aider là dessus ?

    merci d'avance,

  2. #2
    Futur Membre du Club
    Profil pro
    Inscrit en
    Août 2009
    Messages
    7
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Août 2009
    Messages : 7
    Points : 9
    Points
    9
    Par défaut Une solution..
    L'idée est de créer un tableau, extrait du premier, mais dont toutes les lignes sont différentes (par concaténation des données avec le formatage adhoc et suppression des doublons).
    J'ai ajouté quelques données et un tri de ces données...(voir sM0)
    Cette solution devrait être "lente" avec un très grand tableau (fonction duplicated()).


    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    sM0<-c("1998","02","1234","1998","02","1234","1998","02","1234","1998","02","1235","1998","03","1000","1998","03","1001","1998","03","1234")
    sM0<-matrix(sM0,ncol=3,nrow=7,byrow=TRUE)
    sM0
    #
    #
    sM1<-paste(sM0[,1],sM0[,2],sM0[,3],sep="-")
    sAnmois<-paste(sM0[,1],sM0[,2],sep="|")
    #tri des lignes
    M1trie<-sort(sM1,method="shell",index.return=TRUE)
    #
    #suppression des doublons
    indx<-M1trie$ix[!duplicated(sM1[M1trie$ix])]
    #
    nombre_id<-tapply(sM1[indx],factor(sAnmois[indx]),length)
    out<-paste(names(nombre_id),"|",nombre_id)
    cat(out,sep="\n")

  3. #3
    Membre expert
    Avatar de pitipoisson
    Homme Profil pro
    Chercheur
    Inscrit en
    Septembre 2006
    Messages
    1 942
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 44
    Localisation : France, Finistère (Bretagne)

    Informations professionnelles :
    Activité : Chercheur
    Secteur : Agroalimentaire - Agriculture

    Informations forums :
    Inscription : Septembre 2006
    Messages : 1 942
    Points : 3 378
    Points
    3 378
    Par défaut
    Bonjour,

    Houlà, je viens juste de comprendre ce que tu cherches à faire !

    Bon, ma petite contribution avec tapply :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    > data <- data.frame(annee=rep(1998:1999, each=5),
    +                    mois=rep(c(rep(2, 4), 3), 2),
    +                    identifiant=rep(c(rep(1234, 3), rep(1235, 2)), 2))
    > 
    > data
       annee mois identifiant
    1   1998    2        1234
    2   1998    2        1234
    3   1998    2        1234
    4   1998    2        1235
    5   1998    3        1235
    6   1999    2        1234
    7   1999    2        1234
    8   1999    2        1234
    9   1999    2        1235
    10  1999    3        1235
    > 
    > count <- as.data.frame(tapply(data$identifiant,
    +                               list(data$annee, data$mois),
    +                               function(x) length(unique(x))))
    > 
    > reshape(count,
    +         ids=row.names(count), idvar="annee",
    +         times=colnames(count), timevar="mois",
    +         varying=list(colnames(count)), v.names="nombre_identifiant",
    +         direction="long")
           mois nombre_identifiant annee
    1998.2    2                  2  1998
    1999.2    2                  2  1999
    1998.3    3                  1  1998
    1999.3    3                  1  1999
    >
    Forum LaTeX : pour des réponses rapides et appropriées, pensez à poster un
    ECM = Exemple (reproduit le problème) Complet (document compilable) Minimal (ne postez pas votre thèse !)

    Une solution vous convient ? N'oubliez pas le tag


    )><))))°>

  4. #4
    Membre actif Avatar de habasque
    Homme Profil pro
    Ingénieur d'études
    Inscrit en
    Septembre 2006
    Messages
    530
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 42
    Localisation : France, Finistère (Bretagne)

    Informations professionnelles :
    Activité : Ingénieur d'études
    Secteur : Agroalimentaire - Agriculture

    Informations forums :
    Inscription : Septembre 2006
    Messages : 530
    Points : 296
    Points
    296
    Par défaut
    Et moi je viens juste de voir la réponse...
    Merci à vous 2, je retiens la méthode de pitipoisson que je trouve + courte.

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. utilisation de count(*) en condition
    Par clemsouz dans le forum Requêtes
    Réponses: 3
    Dernier message: 26/09/2005, 14h32
  2. utilisation de count(*) en condition
    Par clemsouz dans le forum Langage SQL
    Réponses: 12
    Dernier message: 26/09/2005, 14h29
  3. []Controle pendant l'utilisation de Outlook via VB
    Par Delphi-ne dans le forum VB 6 et antérieur
    Réponses: 6
    Dernier message: 23/09/2005, 11h11
  4. [MFC] Faible utilisation des sockets via les MFC ?
    Par Yellowmat dans le forum MFC
    Réponses: 1
    Dernier message: 25/08/2005, 17h15
  5. [xsl]utilisation du count
    Par Grimaud dans le forum XSL/XSLT/XPATH
    Réponses: 2
    Dernier message: 28/07/2005, 10h09

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo