Bonjour à toutes et à tous,
tout d'abord j'ignore si le forum est vraiment le bon lieu pour se renseigner sur les différents types de test, étant donné qu'il est plus axé programmation que statistiques, néanmoins je suis sûr que quelqu'un ici sera en mesure de me renseigner.
Je travaille avec des âges d'ADN issus du tumeur. Sans rentrer dans les détails, l'âge d'ADN correspond à l'âge "réel" biologique des personnes. Si l'on prend deux personnes de 50 ans (âge chronologique) par exemple et qu'une a une peau qui semble bien plus vieille que celle de l'autre, on peut déduire que l'âge de son ADN pour les cellules de sa peau est plus important que celui qui a une peau en meilleur état alors que leur âge chronologique est le même.
Je possède un fichier avec l'âge d'ADN pour les tumeurs cancéreuses de 50 personnes, ainsi que leur âge chronologique et différents types de variables qualtitatives : leurs origines (blanc, latino, noir, etc), le stade du cancer (t1,t2, etc),etc et quantitatives : Le nombre de jours depuis le dernier suivi médical, le nombre de jour depuis la mort si le patient est décédé, etc.
On me demande s'il y a une corrélation entre l'âge d'ADN et les différentes variables cliniques. Pour cela je dois utiliser les tests statistiques appropriés (on me dit que les variables continues & catégorielles doivent être traitées différement).
Cependant, je suis un peu novice en la matière et je ne suis pas bien sûr de quel test choisir.
Dans un premier temps, je me suis demandé si mes âges d'ADN avaient une distribution normale. Pour ce faire, j'ai utilisé le test de Shapiro :
shapiro.test(df_tumor$RNAAGE)Visiblement, ce n'est pas le cas, vu que j'ai une p-value inférieure à 0.05.data: df_tumor$RNAAGE
W = 0.94696, p-value = 0.02563
Dès lors, je me suis dit que je devais me tourner vers des tests non-paramétriques.
J'ai cependant l'impression quand dans ces tests non-paramétriques, on compare deux fois une même variable. Ce qui dans mon cas aurait pu être par ex : l'âge de l'ADN d'une tumeur sans traitement VS l'âge de l'ADN d'une tumeur avec traitement. Et pas l'âge de l'ADN avec les origines ou les jours qui ont suivi le décès...
Du coup j'ai l'impression que je dois maintenant me tourner non-pas vers des tests non-paramétriques mais vers une analyse multivariées... Tout cela devient un peu compliqué pour moi qui suis novice en la matière.
Si quelqu'un pouvait dès lors confirmer mes premières impressions et peut-être un peu me guider, ce serait vraiment très gentil de sa part.
D'avance : Un TOUT grand merci.
Partager