recherche de sous séquences spécifiques

**Jasmine80** · 19/06/2007, 11h24

Bonjour,

J'aimerais faire des statistiques sur des séquences ADN. Je voudrais retrouver des sous-séquences (amorces) y étant les plus fréquentes tout en restant spécifiques. J'entrerais donc deux groupes de séquences celles d'intérêt et celles ne l'étant pas. Connaissez-vous des modules Perl pouvant m'être utiles? Je dois trouver énormément de sous-séquences et pas seulement deux (un peu comme une "random PCR" mais ciblée et favorisant un des groupes afin d'amplifier tout le génome).

Ca parait impossible mais vu que le pourcentage G-C varie très fort entre ces deux groupes y aurait-il moyen sans être 100% spécifique de favoriser l'amplification d'un de ces deux groupes?

L'idée: mélange de l'ADN d'un des organismes du groupe A faible en GC et d'un des organismes du groupe B riche en GC. Amplifier ces 2 génomes mais en favorisant celui du groupe B.

Voila donc pourquoi je recherche des fonctions Perl me permettant d'analyser la composition de séquences ADN afin d'y retrouver des sous-séquences spécifiques.

Peut être un HMM
http://search.cpan.org/~sendu/bioper...o/Tools/HMM.pm
ou une chaîne de Markov
http://search.cpan.org/~rclamp/Algor...MarkovChain.pm

Merci,

Jasmine,

**Leishmaniose** · 19/06/2007, 16h52

Salut,

Je dois dire que je n'ai pas bien compris ce que tu cherches à faire exactement ni de point de vu bio ni de point de vu perl...

A défaut de pouvoir aider sur ce plan sauf en ayant plus d'explications, je peux tout de même te proposer de l'aide quand à la synthèse de ces oligos... Je connais une bonne adresse qui propose des oligos de très bonne qualité (je les ai testé ici au labo.) et pour pas très cher en plus du fait que c'est rapidement livré. Une idée sur les prix : pour du 100 nmol (5 OD garantie) entre 0.35 et 0.4 € selon la quantité commandée. Alors, si ça t'intéresse je te donne le contact.

Bonne chance et @+.

**Jasmine80** · 20/06/2007, 09h36

Merci pour ton aide.

Je recherche à faire un peu comme une random PCR où je veux amplifier le génome complèt d'un organisme à l'aide de centaines d'amorces différentes s'appariant un peu partout dans le génome. Mais ici, je ne veux pas que ce soit totalement aléatoire, je veux qu'il y ai un biais allant vers une amplification préférentielle d'un organisme ayant un génome plus froid. Dans cette PCR contenant l'ADN de deux organismes (un riche en GC et l'autre pauvre), je sais qu'évidemment j'aurai une très mauvaise spécificité. Je cherche seulement à favoriser l'amplification de l'un des deux. Je dois donc étudier leur deux génomes et rechercher le type d'amorces qui me permettrait cela. Par exemple du genre ANNNTNNNNTTNNA, NNTNNATTNNNTTA ... qui s'apparieraient de façon privilégiée sur le génome plus riche en AT.

Est-ce plus clair? Je sais que ça parait tordu comme problème mais c'est ce que mon chef m'a demandé.

Donc voila l'idée que j'ai eu. Je crée deux automates HMM un pour chaque organisme. Ensuite je leur envoie aléatoirement des milliers de séquences d'amorces. Et je compare les probabilités que chaque amorce se retrouve dans chacun des deux organismes. En résultat je rechercherai les amorces ayant de grandes probabiltés de se retrouver chez l'organisme froid et de faibles probabilités de se retrouver chez l'organisme chaud.

Mais je me demande si cela ne sera t'il pas impossible point de vue calculs du processeur.

Merci,

Jasmine,

**Jasmine80** · 21/06/2007, 09h17

Je connais une bonne adresse qui propose des oligos de très bonne qualité (je les ai testé ici au labo.) et pour pas très cher en plus du fait que c'est rapidement livré. Une idée sur les prix : pour du 100 nmol (5 OD garantie) entre 0.35 et 0.4 € selon la quantité commandée. Alors, si ça t'intéresse je te donne le contact.

Oui, cela m'intéresse, merci, je veux bien le contact.
Quelle firme est-ce?
0.35-0.4 euro par nucléotide?
Est ce uniquement pour les amorces? et pour les sondes également?
Peut-on demander des modifications, des fonctions aux extrémités des sondes (MGB, NH2...)?

Merci,

Jasmine,

**Leishmaniose** · 22/06/2007, 13h32

Salut,

Envoyé par Jasmine80

Oui, cela m'intéresse, merci, je veux bien le contact.
Quelle firme est-ce?

C'est une nouvelle firme qui s'appelle : CarthaGenomics Advanced Technologies ==> (CGAT)

Envoyé par Jasmine80

0.35-0.4 euro par nucléotide?

Parfaitement

Envoyé par Jasmine80

Est ce uniquement pour les amorces? et pour les sondes également?
Peut-on demander des modifications, des fonctions aux extrémités des sondes (MGB, NH2...)?

Il existe tout une panopolie de modifications possibles. Si tu le veux bien, indiques moi comment je peux t'envoyer le catalogue complet ainsi que les coordonnées de cette entreprise.

@+

**Jasmine80** · 22/06/2007, 14h08

N'existe t'il pas un site internet? Veux-tu envoyer un catalogue papier?
Sinon, tu peux m'envoyer les références exactes par MP ou par mail.

Un grand merci,

Jasmine,

**Leishmaniose** · 22/06/2007, 14h53

Envoyé par Jasmine80

N'existe t'il pas un site internet?

Je crois bien que le site est en cours de construction vu que leur activité vient tout juste de commencer, de toute façon je vais vérifier...

Envoyé par Jasmine80

Veux-tu envoyer un catalogue papier?

Aucun problème pour t'envoyer une copie papier.

Envoyé par Jasmine80

Sinon, tu peux m'envoyer les références exactes par MP ou par mail.

Ok, je vais voir comment numériser le catalogue ensuite l'héberger quelque part sur le net et t'envoyer le lien par MP. Je crois que je peux faire ça d'ici le début de la semaine prochaine, mardi au plus tard.

ça marche !!

@+

**Jasmine80** · 22/06/2007, 14h57

Est-ce une firme française, exporte t'elle vers la Belgique? parce que je suis de Bruxelles... (je suppose que tu viens de France)
Si c'est trop difficile pour toi de numériser, je peux te donner l'adresse de mon boulot, mais ça va te couter en timbres.
Et pour le problème biologique et la manière de le résoudre, n'aurais-tu pas une idée? Est-ce plus claire la façon dont j'ai réexpliquer?

En tous cas merci.

Jasmine,

**Leishmaniose** · 26/06/2007, 16h35

Envoyé par Jasmine80

Est-ce une firme française, exporte t'elle vers la Belgique? parce que je suis de Bruxelles... (je suppose que tu viens de France)
Si c'est trop difficile pour toi de numériser, je peux te donner l'adresse de mon boulot, mais ça va te couter en timbres.

Voila comme promis, j'ai numérisé pour toi les 6 premières pages de la brochure de la CGAT, notes que tu trouveras comment contacter cette firme en bas de chaque page. En fait, la CarthaGenomics est une fillière d'une entreprise anglaise qui a choisie d'implémenter son activité en Tunisie (globalisation oblige !) et selon mon contact, il n'y a aucun problème pour la CGAT d'exporter vers la Belgique. Pour plus d'info. tu peux les contacter par mail ou par télephone...

Maintenant il me faut une adresse e-mail pour que je puisse t'envoyer le pdf !

J'attends ta réponse.

Envoyé par Jasmine80

Et pour le problème biologique et la manière de le résoudre, n'aurais-tu pas une idée? Est-ce plus claire la façon dont j'ai réexpliquer?

Pour ça j'ai pensé à une solution mais il est vrai que la capacité de calcul peux faire défaut... ché pas, j'ai pensé que tu pouvais générer des oligos au hasard dont la taille varrie entre 16 et 18 avec un %CG entre 30 et 50 pour plus de spécificité lors de l'appariement des oligos (voir article : PMID: 15980538 sur pubmed) puis utiliser la e-PCR du NCBI que tu peux automatiser via un perl afin de vérifier la spécificité de tes primers au génome que tu veux amplifier.

Bon , il est vrai que tout ceci n'est qu'un début d'idée n'empêche que je n'ai pas bien saisie le vrai sens de ta manip. autrement dis pourquoi chercher à amplifier ou plutot à favoriser (ce que je ne comprend pas aussi) l'amplification de la totalité d'un génome à partir d'un mélange de 2 génomes ?

@+

**Leishmaniose** · 26/06/2007, 23h16

Finalement tu trouveras la brochure.pdf sur ce lien :

http://demo21.ovh.com/e2ecaa699ee5bf...f49a7f14e1c1P/

@+

**Jasmine80** · 27/06/2007, 12h34

Merci beaaucoup, c'est super sympa de ta part.

Bonne journée,

Jasmine,

**Leishmaniose** · 28/06/2007, 18h05

Envoyé par Jasmine80

Merci beaaucoup, c'est super sympa de ta part.

Bonne journée,

Jasmine,

Y a pas de quoi...

A part ça, as tu trouvé une solution pour ce que tu cherches à faire ??? et pour ce qui est des oligo. est ce que cela répond à ce que tu demandes !!

allez salut et @+

**Jasmine80** · 02/07/2007, 09h00

J'ai choisi une solution plus longue mais plus simple, j'ai écrit moi même un programme. Je génère aléatoirement des amorces, et je regarde lesquelles s'apparient le plus spécifiquement au génome voulu en utilisant des probabilités.

Bonne semaine,

Jasmine,

recherche de sous séquences spécifiques

Bioinformatique Perl

Discussions similaires

Partager

Partager