IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Bioinformatique Perl Discussion :

mapping entre les versions des genbank identifier


Sujet :

Bioinformatique Perl

  1. #1
    Membre confirmé Avatar de fripette
    Profil pro
    Inscrit en
    Octobre 2006
    Messages
    242
    Détails du profil
    Informations personnelles :
    Âge : 39
    Localisation : France

    Informations forums :
    Inscription : Octobre 2006
    Messages : 242
    Par défaut mapping entre les versions des genbank identifier
    Bonjour,

    J'essaye de mettre a jour mes donnees concernant les identifiants genbank.

    Pour savoir si mon identifiant est toujours up to date, j'ai genere un bout de script avec Ebot ( que je vous conseille vivement d'ailleurs faire tourner si vous avez des donnees a recuperer au NCBI ) pour aller recuperer le fichier gb qui est associe a l'identifiant que je passe en argument.

    Cependant lorsque l'identifiant est devenu obsolete (parce que remplacer par un nouveau) il n'y a plus de fichier qui m'est renvoye.

    Sur le ftp de gb (ftp://ftp.ncbi.nih.gov/genbank/) selon le readme.genbank il y a trois fichiers :
    gbnew.txt.gz(nouvelles entrees ), gbchg.txt.gz (entrees changees), and gbdel.txt.gz (entrees effacees).

    Et il y a juste les entrees : aucune info sur qui remplace qui ....
    Auriez vous deja eu a faire cette exercice s'il vous plait ? J'aurai besoin de votre aide.

  2. #2
    Membre confirmé Avatar de fripette
    Profil pro
    Inscrit en
    Octobre 2006
    Messages
    242
    Détails du profil
    Informations personnelles :
    Âge : 39
    Localisation : France

    Informations forums :
    Inscription : Octobre 2006
    Messages : 242
    Par défaut
    J'ajoute ma solution trouvee (une parmi d'autres sans doute):

    Je prends le locus_tag concernant le genbank identifier (qui n'est autre que sa position sur le chromosome )

    Je passe cette information en argument a l'Ebot qui va me renvoyer le fichier associe (et magique meme si le locus Tag est obsolete, il m'envoit le fichier associe au locus tag up to date correspondant)

    Je lis les informations up to date dans le fichier recu:deux cas de figures
    _ je cree de nouvelles lignes si je n'ai pas les identifiants genbank dans ma base
    _ j'actualise les informations pour les genbank deja dans la base.


    Et pour les identifiants genbank restant que je n'aurais pas rencontre durant la manip ci dessus.
    Je double check en essayant quand meme d'aller chercher le fichier associe a ce GB et s'il n'y a vraiment rien alors j'efface la ligne de ma base car l'identifiant a ete efface au NCBI.

    Qu'en pensez vous ?

Discussions similaires

  1. Réponses: 3
    Dernier message: 23/05/2013, 19h51
  2. Réponses: 1
    Dernier message: 27/02/2010, 10h15
  3. Réponses: 3
    Dernier message: 02/05/2006, 13h27
  4. Différences entre les versions 8 et 9 de Oracle??
    Par Stoppa dans le forum Oracle
    Réponses: 2
    Dernier message: 27/03/2006, 13h51
  5. [VS 2005 RTM][CF 2.0] Compatibilité entre les versions
    Par le-roy_a dans le forum Visual Studio
    Réponses: 3
    Dernier message: 09/11/2005, 16h48

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo