tests statistiques sur des données biologiques
Bonjour,
J'ai plusieurs fichiers de données de coverage d'une séquence d'ADN.
La séquence d'ADN est divisée en sous-segments de 100 bases.
Chaque fichier est donc composé d'une matrice du type :
Code:
1 2 3 4 5 6 7
|
segment1 segment2 segment3 segment4 .... ....
coverage base1 XXX XXX XXX XXX
b2 XXX XXX XXX XXX
b3 XXX XXX XXX XXX
b4 XXX XXX XXX XXX
... |
J'aimerais comparer les échantillons 2 à 2, segment par segment.
C'est-à-dire : echantillon1-segment1/echantillon2-segment1 , echantillon1-segment2/echantillon2-segment2 , ...
La comparaison se fait en comparant les écarts entre la moyenne et la médiane des deux échantillons.
Je voudrais savoir si l'on pouvait utiliser un test du chi-deux et si oui comment avec de telles valeurs.
Merci.