Bonjour,
Je suis souvent venu sur ce forum pour trouver des solutions. Après quelques heures de recherche c'est mon tour de vous poser un problème (certainement tout bête) que je n'arrive pas à résoudre.
Je souhaite extraire les séquences nucléotidiques de tous les CDS d'un fichier Genbank afin de réaliser un fichier fasta. J'ai lu avec attention la notice écrite par Jasmine80 concernant le traitement de ces fichiers mais je ne trouve pas de solution. Il existe un tag permettant d'extraire les traductions protéiques des CDS mais je vois rien concernant les séquences nucléotidiques. Je vois bien la solution de récupérer la localisation de ces CDS et de se servir des coordonnées pour extraire la portion de séquence correspondante mais il doit bien y avoir plus simple (scrogneugneu!)?
Partager