Test par groupe

**Cracramon** · 01/06/2017, 23h24

Bonsoir à toutes et à tous !!
Je dois faire des tests sur un dataset.
Voici une partie de mon dataset (appelé df_tumor) :
Nom : Capture.PNG
Affichages : 254
Taille : 22,1 Ko

Nom : Capture.PNG
Affichages : 254
Taille : 22,1 Ko

Je voudrais tester par exemple la normalité en utilisant shapiro.test de RNAage selon le statut vital (dont les valeurs sont 0 et 1), donc faire deux groupes, un groupe RNAAGE avec ceux qui ont une statut vital 0 et un groupe avec ceux qui ont un statut vital 1.

Je pensais faire quelque chose genre :

Error in shapiro.test(RNAAGE ~ vital_status, df_tumor) :
unused argument (df_tumor)

ou

shapiro.test(df_tumor$RNAAGE ~ vital_status)
Error: is.numeric(x) n'est pas TRUE

Mais chaque fois j'ai une erreur, donc je me demandais si c'était possible ou pas !

Merci beaucoup pour votre aide !!!

**mgdondon** · 05/06/2017, 16h50

Bonjour,

Vous pouvez utiliser une fonction d'agrégation comme by() ou tapply() :

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
> df_tumor <- read.csv("D:temp/test.txt")
> by(df_tumor$RNAAGE, df_tumor$vital_status, shapiro.test)
df_tumor$vital_status: 0
 
        Shapiro-Wilk normality test
 
data:  dd[x, ]
W = 0.98405, p-value = 0.7582
 
------------------------------------------------------------ 
df_tumor$vital_status: 1
 
        Shapiro-Wilk normality test
 
data:  dd[x, ]
W = 0.91852, p-value = 0.3065

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
> tapply(df_tumor$RNAAGE, df_tumor$vital_status, shapiro.test)
$`0`
 
        Shapiro-Wilk normality test
 
data:  X[[i]]
W = 0.98405, p-value = 0.7582
 
 
$`1`
 
        Shapiro-Wilk normality test
 
data:  X[[i]]
W = 0.91852, p-value = 0.3065

Cordialement,

Test par groupe

R

Discussions similaires

Partager

Partager