IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Bioinformatique Perl Discussion :

recherche d'une sonde


Sujet :

Bioinformatique Perl

  1. #1
    Membre émérite
    Avatar de Jasmine80
    Femme Profil pro
    Bioinformaticienne
    Inscrit en
    Octobre 2006
    Messages
    3 157
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 44
    Localisation : Royaume-Uni

    Informations professionnelles :
    Activité : Bioinformaticienne
    Secteur : Santé

    Informations forums :
    Inscription : Octobre 2006
    Messages : 3 157
    Points : 2 673
    Points
    2 673
    Par défaut recherche d'une sonde
    Bonjour,


    J'ai dans une base MySQL, 50335 séquence dont la longueur moyenne est de 574 nucléotides et qui représentent 49241 organismes distincts.

    J'aimerais y trouver une sonde un maximum conservée de 20-25 nucléotides. Quelle serait la meilleure approche. Connaissez-vous un programme pouvant m'aider?

    J'ai pensé faire une DB blast de mes 50335 séquences, d'utiliser des morceaux de séquences de 20-25 nucléotides comme query et de rechercher les meilleures candidates. Dans un premier temps, je vais dégrossir le travail en utilisant des expreg afin de rechercher les motifs les plus conservés. Ensuite, je rechercherai via blast, les sondes qui ne s'appartient pas parfaitement mais suffisamment que pour espérer qu'elles se fixent et peut-être envisager de dégénérer quelques nucléotides de la sonde.


    Avez-vous des conseils à me donner?

    Merci beaucoup,
    -- Jasmine --

  2. #2
    Membre éclairé
    Profil pro
    Assistant recherche bioinformatique
    Inscrit en
    Novembre 2007
    Messages
    877
    Détails du profil
    Informations personnelles :
    Localisation : Canada

    Informations professionnelles :
    Activité : Assistant recherche bioinformatique

    Informations forums :
    Inscription : Novembre 2007
    Messages : 877
    Points : 835
    Points
    835
    Par défaut
    Rien ne vaut un soft qui fait le boulot a partir d'un fichier fasta.
    Je bosse aussi sur de la conception de sondes uniques ou generales.

    Mon approche a été la suivante : recherche de toutes les sondes possibles (YODA modifié). Aligmenent de chacune de ces sondes sur tous mes genomes, en tenant compte jusqu'a 4 missmatch (seqmap).
    Parsing des resultats et insertion dans une base de donnée, dans 2 tables :
    une table comprenant toutes les sondes uniques avec leurs infos (%gc, Tm, séquence de la sonde), et une autre table comportant les cibles de ces sondes (accession de la cible, id de la sonde, position, nombre de missmatch).

    Je me retrouve a inserer 800 000 sondes différentes dans ma bdd, pour plus de 20 000 000 cibles (donc jusqu'a 4 mismatchs).

    Maintenant, je ne fais que des requetes sql pour selectionner tout ce dont j'ai besoin : unique ou generale, avec ou sans missmatch, au Tm demandé

    Z.

  3. #3
    Membre émérite
    Avatar de Jasmine80
    Femme Profil pro
    Bioinformaticienne
    Inscrit en
    Octobre 2006
    Messages
    3 157
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 44
    Localisation : Royaume-Uni

    Informations professionnelles :
    Activité : Bioinformaticienne
    Secteur : Santé

    Informations forums :
    Inscription : Octobre 2006
    Messages : 3 157
    Points : 2 673
    Points
    2 673
    Par défaut
    Merci beaucoup pour le tuyau. Je ne connais pas le software YODA, je vais y regarder cela de plus près.
    -- Jasmine --

  4. #4
    Membre éclairé
    Profil pro
    Assistant recherche bioinformatique
    Inscrit en
    Novembre 2007
    Messages
    877
    Détails du profil
    Informations personnelles :
    Localisation : Canada

    Informations professionnelles :
    Activité : Assistant recherche bioinformatique

    Informations forums :
    Inscription : Novembre 2007
    Messages : 877
    Points : 835
    Points
    835
    Par défaut
    C'est en java, et c'est bien codé. Très agreable a modifier !
    Il est open source ET le code est dispo.
    C'est lourd ces gens qui developpent des trucs open source, mais ou il faut envoyer un mail pour demander les sources. Ils repondent jamais et on peut rien faire !!

    Z.
    PS : je vais essayer de venir regulierement ici. Ca serait cool un forum vivant de bioinfo

  5. #5
    Membre émérite
    Avatar de Jasmine80
    Femme Profil pro
    Bioinformaticienne
    Inscrit en
    Octobre 2006
    Messages
    3 157
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 44
    Localisation : Royaume-Uni

    Informations professionnelles :
    Activité : Bioinformaticienne
    Secteur : Santé

    Informations forums :
    Inscription : Octobre 2006
    Messages : 3 157
    Points : 2 673
    Points
    2 673
    Par défaut
    Citation Envoyé par Zwiter Voir le message
    C'est en java, et c'est bien codé. Très agreable a modifier !
    Il est open source ET le code est dispo.
    C'est lourd ces gens qui developpent des trucs open source, mais ou il faut envoyer un mail pour demander les sources. Ils repondent jamais et on peut rien faire !!
    Oui, mais ne connaissant pas JAVA, le code source ne me serait pas utile.

    Citation Envoyé par Zwiter Voir le message
    PS : je vais essayer de venir regulierement ici. Ca serait cool un forum vivant de bioinfo
    Génial, un membre de plus dans la bioinfo, ça serait très chouette.
    -- Jasmine --

  6. #6
    Membre éclairé
    Profil pro
    Assistant recherche bioinformatique
    Inscrit en
    Novembre 2007
    Messages
    877
    Détails du profil
    Informations personnelles :
    Localisation : Canada

    Informations professionnelles :
    Activité : Assistant recherche bioinformatique

    Informations forums :
    Inscription : Novembre 2007
    Messages : 877
    Points : 835
    Points
    835
    Par défaut
    je connaissais pas 'vraiment' JAVA avant de mettre la souris la dedans.
    Il faut uniquement te dire que c'est de la poo. Les objets sont bien choisis, les methodes avec des noms simples, et ces dernieres sont regroupé en plusieurs fichiers pour encore plus de clareté.
    Apres, il en existe d'autre. Mais pour obtenir le code source, bon courage !

    Pour ma part : je voulais une liste de sonde complete, pour realiser ma propre selection en fonction des criteres, qui varient sans cesse.
    A terme, nous devrions avoir une interface CGI pour specifier les critères et recuperer la ou les sondes demandées.

    Tu pourras me dire le soft que tu choisiras ? Je suis interessé de savoir ton choix, et pq

    Petit avis sans rapport avec ce fil de discution :
    Je trouve ca tres arbitraire que la section bioinfo se retrouve dans Perl. Bien heureusement, nous avons d'autres langages et outils
    Je trouve donc tout a fait normal de discuter de sql, Perl, java, linux, blast (sans perl, le prog brut)... dans cette section.

    Z.

  7. #7
    Membre émérite
    Avatar de Jasmine80
    Femme Profil pro
    Bioinformaticienne
    Inscrit en
    Octobre 2006
    Messages
    3 157
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 44
    Localisation : Royaume-Uni

    Informations professionnelles :
    Activité : Bioinformaticienne
    Secteur : Santé

    Informations forums :
    Inscription : Octobre 2006
    Messages : 3 157
    Points : 2 673
    Points
    2 673
    Par défaut
    Citation Envoyé par Zwiter Voir le message
    Tu pourras me dire le soft que tu choisiras ? Je suis interessé de savoir ton choix, et pq
    Oui, bien sûr, je te tiens au courant de l'évolution. Il faut d'abord que je définisse 2 amorces pour une PCR classique. Ne connaitrais-tu pas, par hasard, un programme similaire à YODA mais pour les amorces?
    Ensuite, quand cette PCR sera mise au point, je reprendrai le projet des sondes Taqman.

    Citation Envoyé par Zwiter Voir le message
    Petit avis sans rapport avec ce fil de discution :
    Je trouve ca tres arbitraire que la section bioinfo se retrouve dans Perl. Bien heureusement, nous avons d'autres langages et outils
    Je trouve donc tout a fait normal de discuter de sql, Perl, java, linux, blast (sans perl, le prog brut)... dans cette section.
    Oui, je ferais comme toi, étant donné qu'il n'y a que ce sous-forum pour en discuter. Je suppose que si le sujet 'Bioinformatique' est dans le forum Perl, c'est que seuls ses administrateur ont pensé à un crée un, libre aux autres d'en faire autant ^^.

    PS : peut-être pourrais-tu décrire ce que tu fais dans le sujet http://www.developpez.net/forums/d55...oinformatique/
    -- Jasmine --

  8. #8
    Membre éclairé
    Profil pro
    Assistant recherche bioinformatique
    Inscrit en
    Novembre 2007
    Messages
    877
    Détails du profil
    Informations personnelles :
    Localisation : Canada

    Informations professionnelles :
    Activité : Assistant recherche bioinformatique

    Informations forums :
    Inscription : Novembre 2007
    Messages : 877
    Points : 835
    Points
    835
    Par défaut
    Je n'ai jamais eut a designer des sondes de PCR, mais pour moi, ce ne sont que des sondes qui doivent se fixer a une position précise d'une séquence. Donc YODA pourrait le faire, mais ce n'est pas la voie la plus rapide et la plus facile pour obtenir un couple d'amorce.
    Après, faut voir quel type d'amorce :
    veux tu tout selectionner ?
    uniquement une branche de la classification de tes organismes ?
    Il existe un prog qui s'appelle ARB qui permet de rentrer dans une base de donnée des alignements d'organismes. Ca dessine un arbre, puis en selectionnant des branches, ca te sort des primers pour n'obtenir que ces branches avec ta PCR.

    Z.

  9. #9
    Membre émérite
    Avatar de Jasmine80
    Femme Profil pro
    Bioinformaticienne
    Inscrit en
    Octobre 2006
    Messages
    3 157
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 44
    Localisation : Royaume-Uni

    Informations professionnelles :
    Activité : Bioinformaticienne
    Secteur : Santé

    Informations forums :
    Inscription : Octobre 2006
    Messages : 3 157
    Points : 2 673
    Points
    2 673
    Par défaut
    J'ai aligné le 5 génomes des virus pour lesquels on voudrait une simplex mais à première vue, c'est très différents et ça sera difficile à mettre au point. Nous voulons une PCR classique sur gel, donc pas de sonde. Je vais regarder à ARB, tu sembles une vraie mine d'informations. J'utilise Primer3 afin de mettre au point des PCR, l'ennui est qu'il ne prend qu'une entrée à la fois.


    Merci beaucoup pour ton aide.
    -- Jasmine --

  10. #10
    Membre émérite
    Avatar de Jasmine80
    Femme Profil pro
    Bioinformaticienne
    Inscrit en
    Octobre 2006
    Messages
    3 157
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 44
    Localisation : Royaume-Uni

    Informations professionnelles :
    Activité : Bioinformaticienne
    Secteur : Santé

    Informations forums :
    Inscription : Octobre 2006
    Messages : 3 157
    Points : 2 673
    Points
    2 673
    Par défaut
    J'ai essayé d'installer YODA. Le fichier de procédures XTENDPRC, celui des données XTENDDAT, je vais les garder par défaut. Il est indiqué dans l'aide que XTEND a besoin d'une série de paramètres 'Procedure Specifications Browse Mode' ce fichier renseigne les préfixes et noms des procédures ainsi que les variables globales ... je suppose que je ne dois y toucher que si je veux créer une nouvelle procédure, est-ce bien cela?

    Ensuite, quand je veux créer l'ODBC, je n'ai pas accès au pilote M204od32.dll, est-il fourni automatiquement? Dois-je l'installer? Dois-je le télécharger? Dans l'aide, il est indiqué qu'il faut utiliser 'CCA's Connect'.

    Une dernière question YODA est prévu pour Windows 95 et 98 mais j'ai XP, cela peut-il fonctionner malgré tout?


    Merci pour ton aide.
    -- Jasmine --

  11. #11
    Membre éclairé
    Profil pro
    Assistant recherche bioinformatique
    Inscrit en
    Novembre 2007
    Messages
    877
    Détails du profil
    Informations personnelles :
    Localisation : Canada

    Informations professionnelles :
    Activité : Assistant recherche bioinformatique

    Informations forums :
    Inscription : Novembre 2007
    Messages : 877
    Points : 835
    Points
    835
    Par défaut
    YODA est en java. Je ne comprends donc pas de quoi tu me parles car il n'y a rien a installer.
    Voici le site sur lequel on peut l'obtenir :
    http://pathport.vbi.vt.edu/YODA/

    Z.

  12. #12
    Membre émérite
    Avatar de Jasmine80
    Femme Profil pro
    Bioinformaticienne
    Inscrit en
    Octobre 2006
    Messages
    3 157
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 44
    Localisation : Royaume-Uni

    Informations professionnelles :
    Activité : Bioinformaticienne
    Secteur : Santé

    Informations forums :
    Inscription : Octobre 2006
    Messages : 3 157
    Points : 2 673
    Points
    2 673
    Par défaut
    Je viens de terminer l'article parlant de Yoda, ça parait vraiment bien.
    J'ai maintenant le fichier.jar, me suffit-il de l'extraire?


    Merci pour ton aide.
    -- Jasmine --

  13. #13
    Membre éclairé
    Profil pro
    Assistant recherche bioinformatique
    Inscrit en
    Novembre 2007
    Messages
    877
    Détails du profil
    Informations personnelles :
    Localisation : Canada

    Informations professionnelles :
    Activité : Assistant recherche bioinformatique

    Informations forums :
    Inscription : Novembre 2007
    Messages : 877
    Points : 835
    Points
    835
    Par défaut
    c'est du java, donc faut que tu aies java d'installer sur ton pc, puis que tu executes le fichier YODA.jar.
    Ton fichier est un jar donc faut ajouter l'argument -jar : java -jar YODA.jar -help

    Z.

  14. #14
    Membre émérite
    Avatar de Jasmine80
    Femme Profil pro
    Bioinformaticienne
    Inscrit en
    Octobre 2006
    Messages
    3 157
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 44
    Localisation : Royaume-Uni

    Informations professionnelles :
    Activité : Bioinformaticienne
    Secteur : Santé

    Informations forums :
    Inscription : Octobre 2006
    Messages : 3 157
    Points : 2 673
    Points
    2 673
    Par défaut
    Cela fonctionne merci pour ton aide. Fais-tu tout en ligne de commandes, sans interface graphique?
    -- Jasmine --

  15. #15
    Membre éclairé
    Profil pro
    Assistant recherche bioinformatique
    Inscrit en
    Novembre 2007
    Messages
    877
    Détails du profil
    Informations personnelles :
    Localisation : Canada

    Informations professionnelles :
    Activité : Assistant recherche bioinformatique

    Informations forums :
    Inscription : Novembre 2007
    Messages : 877
    Points : 835
    Points
    835
    Par défaut
    Oui, je fais tout en ligne de commande, et je te rappelle que j'ai bidouillé le soft. Je m'en sert uniquement pour produire la liste de sonde exhaustive pour une séquence, avec les valeurs de tm et de structure secondaire possible.

    Z.

  16. #16
    Membre émérite
    Avatar de Jasmine80
    Femme Profil pro
    Bioinformaticienne
    Inscrit en
    Octobre 2006
    Messages
    3 157
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 44
    Localisation : Royaume-Uni

    Informations professionnelles :
    Activité : Bioinformaticienne
    Secteur : Santé

    Informations forums :
    Inscription : Octobre 2006
    Messages : 3 157
    Points : 2 673
    Points
    2 673
    Par défaut
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    E:\>java -jar -dfile = test.txt -ofile = result.txt
    Quand j'entre un fichier fasta (qu'il ait l'extension .txt ou .fsa) ainsi que le fichier de sortie, voici l'erreur que j'obtiens
    Exception in thread "main" java.lang.OutOfMemoryError : Java heap space ....
    -- Jasmine --

  17. #17
    Membre éclairé
    Profil pro
    Assistant recherche bioinformatique
    Inscrit en
    Novembre 2007
    Messages
    877
    Détails du profil
    Informations personnelles :
    Localisation : Canada

    Informations professionnelles :
    Activité : Assistant recherche bioinformatique

    Informations forums :
    Inscription : Novembre 2007
    Messages : 877
    Points : 835
    Points
    835
    Par défaut
    je pense que ton java a une taille de memoire limite trop faible pour executé un script.
    J'ai eut aussi ce probleme quand je lancais en local le script.
    Utilise ces arguments :
    Par contre, je vois pas le jar que tu lances ? un oublie de ta part en copiant le soucis ici ?

    Z.

  18. #18
    Membre émérite
    Avatar de Jasmine80
    Femme Profil pro
    Bioinformaticienne
    Inscrit en
    Octobre 2006
    Messages
    3 157
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 44
    Localisation : Royaume-Uni

    Informations professionnelles :
    Activité : Bioinformaticienne
    Secteur : Santé

    Informations forums :
    Inscription : Octobre 2006
    Messages : 3 157
    Points : 2 673
    Points
    2 673
    Par défaut
    Citation Envoyé par Zwiter Voir le message
    je pense que ton java a une taille de memoire limite trop faible pour executé un script.
    J'ai eut aussi ce probleme quand je lancais en local le script.
    Utilise ces arguments :
    Par contre, je vois pas le jar que tu lances ? un oublie de ta part en copiant le soucis ici ?

    Z.
    Oui, c'est évidemment YODA.jar qui est appelé


    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    E:\>java -jar YODA.jar -Xms256m -Xmx512m -dfile = test.txt -ofile = result.txt
    Que je place les 2 nouveaux arguments en début où en fin de liste j'obtiens la même erreur 'unknown option -Xms256m '

    Quand je donne une valeur à une option, dois-je bien mettre un signe égal, est-ce facultatif?

    Merci beaucoup pour ton aide.
    -- Jasmine --

  19. #19
    Membre éclairé
    Profil pro
    Assistant recherche bioinformatique
    Inscrit en
    Novembre 2007
    Messages
    877
    Détails du profil
    Informations personnelles :
    Localisation : Canada

    Informations professionnelles :
    Activité : Assistant recherche bioinformatique

    Informations forums :
    Inscription : Novembre 2007
    Messages : 877
    Points : 835
    Points
    835
    Par défaut
    je ne mets pas de signe =
    J'execute le jar sous linux, sur un serveur multi proc avec plein de ram, et sans ces 2 dernieres options.
    Voici mes options, qui a la basent etaient le plus large possible. Maintenant, les options 'filtre' telles que gcrange, tmrange, maxpolyx... sont inutilent avec l'option -hpv que j'ai rajouté.
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    java -jar YODA_HPV.jar -dfile all.fasta -ofile all_oligo_25 -olength 25 -maxconsechits 99999 -maxpercentid  100 -tmrange 200 -gcrange 200 -maxpolyx 20 -dwindow 20 -hwindow 7  -hstringency 7 -cover -showparams -mpps 99999 -hpv -revcomph -dnaconc 1000 -saltconc 1000
    Z.

  20. #20
    Membre émérite
    Avatar de Jasmine80
    Femme Profil pro
    Bioinformaticienne
    Inscrit en
    Octobre 2006
    Messages
    3 157
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 44
    Localisation : Royaume-Uni

    Informations professionnelles :
    Activité : Bioinformaticienne
    Secteur : Santé

    Informations forums :
    Inscription : Octobre 2006
    Messages : 3 157
    Points : 2 673
    Points
    2 673
    Par défaut
    ... 50335 séquences, c'est quand même beaucoup.

    J'arrive à générer des sondes via l'interface de YODA mais des sondes spécifiques à une seule séquence ... le software ARB semble plus approprié pour ce qui est de trouver une sonde commune.

    Tu as donc généré toutes les sondes possibles avec ton YODA modifié, ensuite tu les a alignées sur toutes tes séquences en permettant 4 mismatches et pour terminer tu as stocké les informations relatives aux sondes dans 2 tables.
    ... c'est bien pour générer des sondes de microarray ... mais pour ne rechercher qu'une seule sonde, je me demande si il n'existe pas plus simple.


    Merci,
    -- Jasmine --

Discussions similaires

  1. Problème de recherche dans une BD
    Par ledevelopeur dans le forum Bases de données
    Réponses: 5
    Dernier message: 28/04/2004, 09h49
  2. [Delphi7 interbase] Rechercher si une table existe
    Par Ricardeau dans le forum Bases de données
    Réponses: 6
    Dernier message: 15/03/2004, 10h07
  3. Recherche d'une possibilite
    Par Alexnancy dans le forum Langage SQL
    Réponses: 8
    Dernier message: 29/01/2004, 23h46
  4. Clé matérielle - A la recherche d'une adresse ...
    Par B-Pascal dans le forum Ordinateurs
    Réponses: 6
    Dernier message: 09/11/2003, 15h03
  5. [BPW]Problème de recherche dans une boîte liste
    Par Alcatîz dans le forum Turbo Pascal
    Réponses: 14
    Dernier message: 05/07/2003, 15h10

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo