Voici mes données :
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
$TEM_ref   = 'TCTGTGCCGCCGTCATTACCATGAGCGATAACAGCGCCGCCAATCTGCTGCTGGCCACCG’;
$contig    = 'TCTGTGCCGCCGCCATTACCATGAGCGATAACATCGCCGCCAATCTGCTGCTGGCCACCG’;
$consensus = 'TCTGTGCCGCCGYCATTACCATGAGCGATAACAKCGCCGCCAATCTGCTGCTGGCCACCG’;
car dans le code génétique (connu par le programme) : Y = T ou C et K = G ou T. On peut donc travailler sur $consensus directement ($consensus est le consensus de $TEM_ref et $ contig) et ainsi connaitre les différences entre $TEM_ref et $contig.

Je dois comparer $contig à $TEM_ref et vérifier que l'AGC de $TEM_ref est bien présent dans $contig (ce qui n'est pas le cas ici, car $contig contient ATG donc dans $consensus, c'est un K car T ou G).
$contig est variable et peut être différent de $TEM_ref à d'autres positions que AGC, par exemple dans ce cas, il y a un C au lieu d'un T mais cela n'est pas important car seul l'AGC compte.


Est-ce clair? Comment procéderiez-vous?


Merci pour votre aide.

Nb : je dois utiliser une boucle car il y a plusieurs triplets à vérifier et pas seulement AGC, je compte faire un tableau comptenant les différents triplets à vérifier et leur position dans la TEM_ref mais peut-être y a-t-il plus simple.