Bonjour,
J'aimerais prélever la séquence nucléotidique au format FASTA du gène de l'ARNr 16S d'un organisme donné. Je possède les numéros d'accession qui m'intéressent. Il est assez facile de prélever la séquence nucléotidique de ce gène avec un lien du type http://www.ncbi.nlm.nih.gov/nuccore/XX000000?report=fasta&log$=seqview&format=text (où XX000000 est le numéro d'accession. Par contre, si ce numéro d'accession est celui d'un génome complet, ce lien n'est pas utile étant donné qu'on a pas la position des gène des ARNr 16S. Cette information est disponible dans le format genbank (tags product="16S ribosomal RNA" et complement(xx..yy), où XX et YY sont les position de début et de fin). Le problème est que le fichier source ne fournit pas directement le format genbank. Quelqu'un à-t-il déjà résolut l'extraction d'une séquence nucléotidique au sein d'un génome complet ? Si je pouvais obtenir un lien type fournissant un fichier au format gbk en connaissant le numéro d'accession de la séquence, ce serait parfait.
Partager