Bonjour à tous,
A l'aide d'un parser, j'ai dois récupérer du texte. Cependant mon parser me ressort 2 textes au lieu d'un seul (dans une seule variable). En faite je n'arrive pas à trouver les bonnes délimitations dans mes balises avec des expressions régulières.
Voici une partie du Code Source.
Je voudrais récupérer seulement le texte : chr3 : 154025426 - 154041535 (le 2°)
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9 <th>GP mRNA Boundary<a href="#disclaimer" class="disclaimerLink">†</a>:</th> <td>chr4 : 160269425 - 164059535</td> </tr> <tr> <th>GP Gene Boundary<a href="#disclaimer" class="disclaimerLink">†</a>:</th> <td>chr3 : 154025426 - 154041535 </td>
L'autre texte qui apparaît est : chr4 : 160269425 - 164059535
J'ai remarqué qu'il y a des sauts de ligne. J'ai utilisé ça dans mes regex pour les différencier mais il m'affiche les 2 quand même !!
Bout de code se trouvant dans la subroutine text de mon parser.
Merci pour vos commentaires
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4 # Text for GP Gene Boundary if ($flag == 7 && ($text =~ /^(chr[0-9]+) : ([0-9]+) - ([0-9]+)(\s)*$/)){ print data_out "GP Gene Boundary : $1 : $2 - $3\n\n"; }
Partager