Bonjour à tous
Je suis entrain d'écrire un script dont le but est d'obtenir un tableur synthetique à partir de données importantes de blast
Je suis bloqué à une étape : comment associer un microorganisme (ligne gb) à plusieurs query tout en gardant la ligne entière de Query et en associant les scores (50 0.41) à la query
Je pars d'un fichier de type :
Query= query1 cov=46.92 len=3767 gc=25.96 nseq=1154
gb|JX025555.1| Human rhinovirus A strain HRV-A71_p1047_sR141_200... 44.6 7.0
gb|HQ647181.2| Cotia virus SPAn232, complete genome 50.0 0.41
>gb|KM595078.1| Cotia virus strain SPAn880, complete genome
Query= query 2 cov=54.67 len=1555 gc=28.17 nseq=549
gb|JX025555.1| Human rhinovirus A strain HRV-A71_p1047_sR141_200... 44.6 7.0
Query= query 3 cov=45.79 len=3087 gc=23.68 nseq=946
gb|JX025555.1| Human rhinovirus A strain HRV-A71_p1047_sR141_200... 44.6 7.0
gb|HQ647181.2| Cotia virus SPAn232, complete genome 50.0 0.41
et souhaite obtenir quelque chose comme ca :
gb|HQ647181.2| Cotia virus SPAn232, complete genome Query= query1 cov=46.92 len=3767 gc=25.96 nseq=1154 44.6 7.0 Query= query 2 cov=54.67 len=1555 gc=28.17 nseq=549 44.6 7.0 Query= query 3 cov=45.79 len=3087 gc=23.68 nseq=946 50.0 0.41
gb|JX025555.1| Human rhinovirus A strain HRV-A71_p1047_sR141_200... Query= query1 cov=46.92 len=3767 gc=25.96 nseq=1154 44.6 7.0 Query= query 2 cov=54.67 len=1555 gc=28.17 nseq=549 44.6 7.0
gb|KM595078.1| Cotia virus strain SPAn880, complete genome Query= query1 cov=46.92 len=3767 gc=25.96 nseq=1154 >
Merci pour votre aide
Partager