IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

R Discussion :

Modification de données


Sujet :

R

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Membre averti
    Profil pro
    Inscrit en
    Juin 2009
    Messages
    14
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Juin 2009
    Messages : 14
    Par défaut Modification de données
    Bonjour,

    Je poste ce nouveau sujet car je cherche à modifier un tableau de données sous R.
    J'ai des données avec, en 1ère colonne, différents points d'échantillonnages (dans l'exemple en pièce-jointe on en a 2 : LA080015 et LA080018).
    Pour chacun de ces sites on a comptés le nombre de poissons (colonne "nb_ind") en notant l'espèce ("codeSp") et la classe de taille ("P" pour petit, "M" pour moyen et "G" pour grand).
    Le problème, c'est que je ne veux pas avoir, pour un même point d'échantillonnage, deux lignes avec la même espèce mais une seule par espèce avec le nombre maximal d'individus. Sauf dans le cas où les individus ne font pas partie de la même classe de taille.

    Par exemple :
    A partir de ça...

    LA080015 2 -999 Choegrap NA -999 P -999 1 -999 -999
    LA080015 2 -999 Choegrap NA -999 G -999 1 -999 -999
    LA080015 2 -999 Scarrivu NA -999 P -999 1 -999 -999
    LA080015 3 -999 Scarrivu NA -999 P -999 1 -999 -999
    LA080015 1 -999 Acannigri NA -999 M -999 6 -999 -999
    LA080015 2 -999 Acannigri NA -999 M -999 4 -999 -999

    Je souhaite obtenir ceci :

    LA080015 2 -999 Choegrap NA -999 P -999 1 -999 -999
    LA080015 2 -999 Choegrap NA -999 G -999 1 -999 -999
    LA080015 3 -999 Scarrivu NA -999 P -999 1 -999 -999
    LA080015 1 -999 Acannigri NA -999 M -999 6 -999 -999


    Dans cet exemple ci-dessus, on a deux fois Choegraph. Cependant, ne faisant pas partie de la même classe de taille, je souhaite conserver les données concernant ces deux individus.
    Pour les Acannigri, on a deux lignes dont une avec 6 individus et l'autre avec 4 individus. Là, je souhaite donc ne conserver que la ligne avec le maximum d'individus soit la ligne avec les 6 individus.
    Enfin dans le cas des Scarrivu, on a deux lignes avec 1. Je ne souhaite garder également qu'une ligne avec le maximum d'individus (1). Peu importe laquelle.

    Je cherche une fonction me permettant de faire ceci automatiquement pour chaque site.
    Je ne sais pas si mes explications étaient assez claires, ce n'est pas évident à expliquer.
    J'ai mis un fichier xls en pièce-jointe au cas où.
    Si quelqu'un avait une solution à mon problème cela m'aiderait énormément.
    Merci d'avance,

    Jérémy
    Fichiers attachés Fichiers attachés

  2. #2
    Modératrice

    Femme Profil pro
    Statisticienne, Fondatrice de la société DACTA
    Inscrit en
    Juin 2010
    Messages
    893
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 37
    Localisation : France, Loire Atlantique (Pays de la Loire)

    Informations professionnelles :
    Activité : Statisticienne, Fondatrice de la société DACTA

    Informations forums :
    Inscription : Juin 2010
    Messages : 893
    Par défaut
    Bonjour,

    Alors, je ne suis pas bien sûre d'avoir compris ton exemple, mais voici une idée qui m'est venue comme ça (je ne l'ai pas testée donc il y a peut-être quelques éléments à adapter) :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
     
    X<-read.csv("Exemple.xls",header=TRUE)
     
    S<-NULL
     
    X1<-X[which(X[,1]==LA080015),]
    X2<-X[which(X[,1]==LA080018),]
     
    f1<-unique(factor(X1[,4]))
    nf1<-length(f1)
     
    for(i in 1:nf1)
    {
    	u<-X1[which(X1[,4]==f1[i]),]
    	v<-u[which.max(u[,9]),]
    	S<-rbind(S,v)
    }
     
    f2<-unique(factor(X2[,4]))
    nf2<-length(f2)
     
    for(i in 1:nf2)
    {
    	u<-X2[which(X2[,4]==f2[i]),]
    	v<-u[which.max(u[,9]),]
    	S<-rbind(S,v)
    }

    Cordialement,

    A.D.

    Forum R
    Fournir le code utilisé (pensez aux balises code !), les packages nécessaires, ainsi qu'un court mais représentatif extrait du jeu de données et les éventuels messages d'erreur.
    Recherche d'informations concernant R : RSiteSearch / tutoriels : http://r.developpez.com/cours/ .

    Pensez également au bouton "Résolu" et à voter (en bas à droite des messages) lorsque vous avez obtenu une réponse satisfaisante.

  3. #3
    Membre averti
    Profil pro
    Inscrit en
    Juin 2009
    Messages
    14
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Juin 2009
    Messages : 14
    Par défaut
    Merci pour cette réponse.
    Je vais tester et l'adapter s'il le faut.

  4. #4
    ced
    ced est déconnecté
    Rédacteur/Modérateur

    Avatar de ced
    Homme Profil pro
    Gestion de bases de données techniques
    Inscrit en
    Avril 2002
    Messages
    6 059
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 50
    Localisation : France, Loiret (Centre)

    Informations professionnelles :
    Activité : Gestion de bases de données techniques
    Secteur : Agroalimentaire - Agriculture

    Informations forums :
    Inscription : Avril 2002
    Messages : 6 059
    Par défaut
    Bonjour,

    Un autre code peut-être un peu plus synthétique et qui devrait faire la même chose :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    x <- read.csv2("exemple.csv", as.is = T)
    y <- aggregate(nb_ind ~ UnitObs + codeSp + classe_taille, data = test, max)
    z <- merge(x, y, by = c("UnitObs", "codeSp", "classe_taille", "nb_ind"))
    ced
    Rédacteur / Modérateur SGBD et R
    Mes tutoriels et la FAQ MySQL

    ----------------------------------------------------
    Pensez aux balises code et au tag
    Une réponse vous a plu ? N'hésitez pas à y mettre un
    Je ne réponds pas aux questions techniques par message privé, les forums sont là pour ça

  5. #5
    Membre averti
    Profil pro
    Inscrit en
    Juin 2009
    Messages
    14
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Juin 2009
    Messages : 14
    Par défaut
    Merci pour cette solution!
    J'ai réussi à obtenir les données que je souhaitais avoir.
    Voici également une solution donnée par une collègue :

    donneesMax<-aggregate(donneesStaviro$nb_ind,list(donneesStaviro$UnitObs,donneesStaviro$codeSp,donneesStaviro$classe_taille),max,na.rm=T)

    Merci encore!

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. [JTable] Interdire la modification des données ?
    Par Cyborg289 dans le forum Composants
    Réponses: 7
    Dernier message: 25/02/2013, 10h40
  2. Réponses: 2
    Dernier message: 21/03/2006, 15h22
  3. Modification des données impossible
    Par Virgile59 dans le forum Access
    Réponses: 8
    Dernier message: 03/03/2006, 14h41
  4. Réponses: 6
    Dernier message: 15/02/2006, 14h02
  5. [MySQL] Modification de données utilisateurs
    Par Paniez dans le forum PHP & Base de données
    Réponses: 10
    Dernier message: 05/02/2006, 22h58

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo