Bonjour à tous,
Je suis novice en analyse de données de RNA-seq (désolé pour les erreurs de terminologie...)
Mon objectif est d'identifier les transcrits différentiellement exprimés entre ma condition "maladie" versus "sain".
J'ai reçu de l'analyste les résultats issus de mes manips et pour chaque échantillon (personne malade ou en santé), j'ai un set de fichiers .bam, .bai, .bed . Il me dit que les données sont alignées point
En fouillant pour trouver des pipelines d'analyses afin d'aboutir aux gènes différentiellement exprimés, j'ai lut qu'on pouvait utiliser entre autres, la suite Cufflinks avec les .bam en input dans l'environnement Unix.
J'ai aussi lu qu'on pouvait utiliser le langage Perl.
J'ai quelques questions: A quoi servent les fichiers .bed ? et sont-ils a intégrer dans l'input?
J'ai lu qu'il fallait un .gtf pour l'analyse des données mais je n'en ai pas, est-ce qu'on peut analyser les .bam seuls comme input avec Cufflinks.
Toute information est la bienvenue
Merci d'avance pour votre aide
BioGen
Partager