Salut et bonjour a tous
Je m'adresse a vous pour partager ma deprime face aux données contenues dans dbSNP. Ca fait un moment que je bosse la dessus et je n'en vois toujours pas le bout. En quelques mots, je n'arrive pas à obtenir de maniere claire les informations SNP dont j'ai besoin en particulier la localisation sur l'ARNm. Les datas sont disponibles sur le sites ftp, mais que ce soit au format ASN1, flatfile ou XML il n'y a pas moyen d'obenir des informations cohérentes (je parle pour un grand ensemble de gène et non pour un seul). Pour ceux qui connaissent un peu dbSNP, lorsqu'on consulte la fiche pour un gène donné, les infos sont assez claires avec la localisation, la variation, la référence , la validation...Mais impossible de reconstruire en local ce genre d'informations à partir des datas téléchargeables.
J'ai donc essayé d'exploiter les fiches genbank avec les features variations mais alors c'est encore pire au niveau des données présentes, je crois d'ailleurs que la mise a jour dbSNP-Genbank n'est pas réellemnt assuré.
J'ai également tenté d'exploiter les modules BioPerl qui sont censés lire les fichiers XML de dbSNP mais les balises XML ayant changées, plus rien ne fonctionne...
Voilà si quelqu'un à déjà rencontrer ce genre de problème ou veut juste compatir....![]()
Partager