Bonjour à tous,
je suis perdu face à une modification pas très triviale sur un fichier très connu dans le monde de la bioinforamtique (les fichiers fasta...).
Ces fichiers (texte) ont pour structure:
>"Des infos sur la séquence d'adn qui suit:"
actgatcgaatcggatcgatcgatggctagctagaagatcgatcgatccgatc
actgatcgaatcggatcgatcgatggctagctagaagatcgatcgatccgatc
actgatcgaatcggatcgatcgatggctagctagaagatcgatcgatccgatc
>"Des infos sur la séquence d'adn qui suit:"
actgatcgaatcggatcgatcgatggctagctagaagatcgatcgatccgatc
actgatcgaatcggatcgatcgatggctagctagaagatcgatcgatccgatc
actgatcgaatcggatcgatcgatggctagctagaagatcgatcgatccgatc
>"Des infos sur la séquence d'adn qui suit:"
actgatcgaatcggatcgatcgatggctagctagaagatcgatcgatccgatc
actgatcgaatcggatcgatcgatggctagctagaagatcgatcgatccgatc
actgatcgaatcggatcgatcgatggctagctagaagatcgatcgatccgatc
etc...
mon bute est de remplacer les lignes qui commencent par ">" par une seule 'string' qui s'y trouve.
En fait ces lignes ont pour structure:
>gi|45382714|ref|NM_204688.1| Gallus gallus Wpkci (WPKCI), mRNA (par exmple)
Je veux en fait remplacer cette ligne ci par:
>NM_204688.1
et ce pour tout le fichier entier.
Je me vois bien faire un truc genre
mais je capte pas comment dire: rempalce moi cette ligne par le 4eme champ quand je délimite par des "|" ( comme cut -f 4 -d "|" et écrire ce que ça retourne à la place de toute ma ligne??)
Code : Sélectionner tout - Visualiser dans une fenêtre à part awk '/>/ { } ' mon fichier fasta
Merci d'avance pour votre patience.
Partager