IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

R Discussion :

Test par groupe


Sujet :

R

  1. #1
    Futur Membre du Club
    Homme Profil pro
    étudiant en bioinformatique
    Inscrit en
    Mai 2017
    Messages
    13
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 33
    Localisation : Belgique

    Informations professionnelles :
    Activité : étudiant en bioinformatique
    Secteur : Santé

    Informations forums :
    Inscription : Mai 2017
    Messages : 13
    Points : 5
    Points
    5
    Par défaut Test par groupe
    Bonsoir à toutes et à tous !!
    Je dois faire des tests sur un dataset.
    Voici une partie de mon dataset (appelé df_tumor) :
    Nom : Capture.PNG
Affichages : 254
Taille : 22,1 Ko

    Je voudrais tester par exemple la normalité en utilisant shapiro.test de RNAage selon le statut vital (dont les valeurs sont 0 et 1), donc faire deux groupes, un groupe RNAAGE avec ceux qui ont une statut vital 0 et un groupe avec ceux qui ont un statut vital 1.

    Je pensais faire quelque chose genre :
    Error in shapiro.test(RNAAGE ~ vital_status, df_tumor) :
    unused argument (df_tumor)
    ou
    shapiro.test(df_tumor$RNAAGE ~ vital_status)
    Error: is.numeric(x) n'est pas TRUE
    Mais chaque fois j'ai une erreur, donc je me demandais si c'était possible ou pas !

    Merci beaucoup pour votre aide !!!

  2. #2
    Membre expérimenté
    Inscrit en
    Novembre 2009
    Messages
    703
    Détails du profil
    Informations forums :
    Inscription : Novembre 2009
    Messages : 703
    Points : 1 311
    Points
    1 311
    Par défaut Test par groupe
    Bonjour,

    Vous pouvez utiliser une fonction d'agrégation comme by() ou tapply() :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    > df_tumor <- read.csv("D:temp/test.txt")
    > by(df_tumor$RNAAGE, df_tumor$vital_status, shapiro.test)
    df_tumor$vital_status: 0
     
            Shapiro-Wilk normality test
     
    data:  dd[x, ]
    W = 0.98405, p-value = 0.7582
     
    ------------------------------------------------------------ 
    df_tumor$vital_status: 1
     
            Shapiro-Wilk normality test
     
    data:  dd[x, ]
    W = 0.91852, p-value = 0.3065
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    > tapply(df_tumor$RNAAGE, df_tumor$vital_status, shapiro.test)
    $`0`
     
            Shapiro-Wilk normality test
     
    data:  X[[i]]
    W = 0.98405, p-value = 0.7582
     
     
    $`1`
     
            Shapiro-Wilk normality test
     
    data:  X[[i]]
    W = 0.91852, p-value = 0.3065
    Cordialement,
    Fichiers attachés Fichiers attachés

Discussions similaires

  1. Compter nombre lignes générées par GROUP BY
    Par Trunks dans le forum Langage SQL
    Réponses: 2
    Dernier message: 26/03/2006, 16h52
  2. Nombre de pages par groupe dans un état
    Par loutsky dans le forum Access
    Réponses: 5
    Dernier message: 15/03/2006, 14h04
  3. Réponses: 7
    Dernier message: 23/09/2005, 20h58
  4. Trier les fichiers par type et les afficher par groupe ...
    Par KneXtasY dans le forum Autres Logiciels
    Réponses: 4
    Dernier message: 18/09/2005, 18h50
  5. concaténer par GROUP BY des champs text/varchar
    Par Fredobdx dans le forum Requêtes
    Réponses: 1
    Dernier message: 12/07/2005, 13h44

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo