association de données de 2 fichiers
Bonjour à tous,
Je souhaiterai associer le chiffre des lignes paires du fichier 2 aux données du fichier 1. La difficulté est que les numéros ne sont pas dans l'ordre, le/les
derniers chiffres des lignes impaires du fichier 2 correpondent a/aux derniers chiffres des lignes paires du fichier 1.
Idealement je souhaiterai avoir un fichier type csv avec une colonne nom, une colonne sequence et une colonne match
Fichier 1
>Sequenc0
TGCCATTGTGATTGGGGGGGGGGGGGGGGG
>Sequenc1
gagcTGGCTTTTCTTGTGGGGTGAGGATGGACATTCTGCCATTGTGAT
>Sequenc2
TGGACATTCTGCCATTGTGAT
>Sequenc3
NgNNNGCTTTTTCTTGTGGGGTGAGGATGGACATTCTGCCATTGTGAT
>Sequenc4
GTGGGGTGAGGATGGACATTCTGCCATTGTGAT
>Sequenc5
CTTGTGGGTGAGGATGGACATTCTGCCATTGTGAT
>Sequenc6
GCGGTGTGTATTACTGTGCGAGAGAATTTCGCCCCCAGTATCAGCTGCTA
>Sequenc7
GGGATGGACATTCTGCCATTGTGAT
>Sequenc8
TGAGCTGGCTTTTCTTGTGGGTGAGGATGGACATTCTGCCATTGTGAT
>Sequenc9
CTGGACTTTTTCTTGTGGGGTGAGGATGGACATTCTGCCATTGTCGAT
>Sequenc10
TGGGTGGCTGGGTTTTGTGGGGTGAGGATGGACTTTCTGCCCATTGTGAT
>Sequenc11
TGGGTGGCTGGGTTTTGTGGGGTGAGGATGGACTTTCTGCCCATTGTGAT
Fichier 2
IonXpress_022_R_2016_09_01_14_18_35_dsde_Profit-166-ABC1234-DS-010916_Auto_user_Profit-166-ABC1234-DS-010916_166_prinseq_good_rf63.fastq.a60.bam.DS.txt.fasta0
1
IonXpress_022_R_2016_09_01_14_18_35_dsde_Profit-166-ABC1234-DS-010916_Auto_user_Profit-166-ABC1234-DS-010916_166_prinseq_good_rf63.fastq.a60.bam.DS.txt.fasta1
6
IonXpress_022_R_2016_09_01_14_18_35_dsde_Profit-166-ABC1234-DS-010916_Auto_user_Profit-166-ABC1234-DS-010916_166_prinseq_good_rf63.fastq.a60.bam.DS.txt.fasta10
1
IonXpress_022_R_2016_09_01_14_18_35_dsde_Profit-166-ABC1234-DS-010916_Auto_user_Profit-166-ABC1234-DS-010916_166_prinseq_good_rf63.fastq.a60.bam.DS.txt.fasta11
1
IonXpress_022_R_2016_09_01_14_18_35_dsde_Profit-166-ABC1234-DS-010916_Auto_user_Profit-166-ABC1234-DS-010916_166_prinseq_good_rf63.fastq.a60.bam.DS.txt.fasta2
35
IonXpress_022_R_2016_09_01_14_18_35_dsde_Profit-166-ABC1234-DS-010916_Auto_user_Profit-166-ABC1234-DS-010916_166_prinseq_good_rf63.fastq.a60.bam.DS.txt.fasta3
5
IonXpress_022_R_2016_09_01_14_18_35_dsde_Profit-166-ABC1234-DS-010916_Auto_user_Profit-166-ABC1234-DS-010916_166_prinseq_good_rf63.fastq.a60.bam.DS.txt.fasta4
24
IonXpress_022_R_2016_09_01_14_18_35_dsde_Profit-166-ABC1234-DS-010916_Auto_user_Profit-166-ABC1234-DS-010916_166_prinseq_good_rf63.fastq.a60.bam.DS.txt.fasta5
1
26
IonXpress_022_R_2016_09_01_14_18_35_dsde_Profit-166-ABC1234-DS-010916_Auto_user_Profit-166-ABC1234-DS-010916_166_prinseq_good_rf63.fastq.a60.bam.DS.txt.fasta6
54
IonXpress_022_R_2016_09_01_14_18_35_dsde_Profit-166-ABC1234-DS-010916_Auto_user_Profit-166-ABC1234-DS-010916_166_prinseq_good_rf63.fastq.a60.bam.DS.txt.fasta7
13
IonXpress_022_R_2016_09_01_14_18_35_dsde_Profit-166-ABC1234-DS-010916_Auto_user_Profit-166-ABC1234-DS-010916_166_prinseq_good_rf63.fastq.a60.bam.DS.txt.fasta8
5
IonXpress_022_R_2016_09_01_14_18_35_dsde_Profit-166-ABC1234-DS-010916_Auto_user_Profit-166-ABC1234-DS-010916_166_prinseq_good_rf63.fastq.a60.bam.DS.txt.fasta9
3
le rendu pour cet exemple serait quelque chose comme :
nom sequence match
Sequenc0 TGCCATTGTGATTGGGGGGGGGGGGGGGGG 1
Sequenc1 gagcTGGCTTTTCTTGTGGGGTGAGGATGGACATTCTGCCATTGTGAT 6
Sequenc2 TGGACATTCTGCCATTGTGAT 35
Sequenc3 NgNNNGCTTTTTCTTGTGGGGTGAGGATGGACATTCTGCCATTGTGAT 5
Sequenc4 GTGGGGTGAGGATGGACATTCTGCCATTGTGAT 24
et ainsi de suite
Je pensais à un script perl qui recupérait la fin des lignes du fichiers 2 et les data et qui les confronterai au fichier 1.
Mais j'ai du mal à voir comment mettre ca dans un script, ca n'est peut être pas la bonne démarche
Merci beaucoup pour votre aide!