IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Bioinformatique Perl Discussion :

problème d'un mélange de séquences


Sujet :

Bioinformatique Perl

  1. #21
    Membre confirmé
    Avatar de MaliciaR
    Inscrit en
    Juillet 2008
    Messages
    513
    Détails du profil
    Informations personnelles :
    Âge : 42

    Informations forums :
    Inscription : Juillet 2008
    Messages : 513
    Points : 600
    Points
    600
    Par défaut
    Citation Envoyé par Jasmine80 Voir le message
    Mais, vu que tôt ou tard, je n'aurai plus de gènes complets et que j'aurai donc besoin de passer par le comptage des codons stop, et vu également que je suis toujours partante pour découvrir un nouveau module, je me suis intéressée de plus prêt à CodonTable dont à parler Malicia.
    Tu peux toujours utiliser les softs de prédiction de gènes, tu en as plein et de très efficaces. Je connais quelques trucs en annotation (vu que je suis un peu portée sur tout ce qui métagénomique et organismes non-modèle) donc si tu exposes clairement ton problème, je peux toujours te donner quelques indications utiles


    Citation Envoyé par Jasmine80 Voir le message
    Encore merci à tous les 2 pour votre aide, ce forum est vraiment composé de gens très sympas.
    Ca fait plaisir de filer un coup de main

  2. #22
    Membre émérite
    Avatar de Jasmine80
    Femme Profil pro
    Bioinformaticienne
    Inscrit en
    Octobre 2006
    Messages
    3 157
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 44
    Localisation : Royaume-Uni

    Informations professionnelles :
    Activité : Bioinformaticienne
    Secteur : Santé

    Informations forums :
    Inscription : Octobre 2006
    Messages : 3 157
    Points : 2 673
    Points
    2 673
    Par défaut
    Citation Envoyé par MaliciaR Voir le message
    Tu peux toujours utiliser les softs de prédiction de gènes, tu en as plein et de très efficaces.
    Je n'ai jamais dû prédire des gènes ... que peut donner ce genre de programme quand on a des séquences ne représentant même pas un gène complet? Je suppose qu'il se contente de faire les 6 traductions possibles.
    N'est-ce pas plus lourd que d'utiliser le petit programme perl?
    Je pourrais même le rendre encore plus performant pour mon problème, en comptant les codons stop des 6 cadres de lecture, par une simple regexp, sans passer par une traduction.

  3. #23
    Membre confirmé
    Avatar de MaliciaR
    Inscrit en
    Juillet 2008
    Messages
    513
    Détails du profil
    Informations personnelles :
    Âge : 42

    Informations forums :
    Inscription : Juillet 2008
    Messages : 513
    Points : 600
    Points
    600
    Par défaut
    Citation Envoyé par Jasmine80 Voir le message
    Je n'ai jamais dû prédire des gènes ... que peut donner ce genre de programme quand on a des séquences ne représentant même pas un gène complet? Je suppose qu'il se contente de faire les 6 traductions possibles.
    Non, non, en fait il utilise les modèles de Markov (cachés aussi, en général pour les Eucaryotes). La méthodologie est vraiment différente
    Ce genre de programme te donne un potentiel codant. Je te conseille de bien lire la doc, toutes les plateformes d'annotation travaillent avec ce genre d'outils


    Citation Envoyé par Jasmine80 Voir le message
    N'est-ce pas plus lourd que d'utiliser le petit programme perl?
    Je pourrais même le rendre encore plus performant pour mon problème, en comptant les codons stop des 6 cadres de lecture, par une simple regexp, sans passer par une traduction.
    Je n'ai pas compris le coup du "plus lourd"
    Tu peux toujours te contenter de compter des codons STOP. Mais ça ne saura être une prédiction de gène, pour de nombreuses raisons (j'ai évoqué certaines un peu plus haut ). Par ailleurs, si tu travailles sur des bactos, tu risques d'avoir un autre pitit souci : il y a 4 codons START utilisés par les bactéries (pas seulement AUG). Ton gène incomplet peut l'être autant entre le début et le milieu qu'entre le milieu et la fin. Les softs type GeneMark et Glimmer recherchent également des RBS ce qui est quand même un indicateur de début

    Franchement, crée une nouvelle discussion (pour plus de visibilité), donne un fragment qui te pose souci et on comparera les deux méthodologies. La prédiction de gènes est chose difficile mais super intéressante et je veux bien filer un coup de main au besoin

  4. #24
    Membre émérite
    Avatar de Jasmine80
    Femme Profil pro
    Bioinformaticienne
    Inscrit en
    Octobre 2006
    Messages
    3 157
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 44
    Localisation : Royaume-Uni

    Informations professionnelles :
    Activité : Bioinformaticienne
    Secteur : Santé

    Informations forums :
    Inscription : Octobre 2006
    Messages : 3 157
    Points : 2 673
    Points
    2 673
    Par défaut
    Citation Envoyé par MaliciaR Voir le message
    Je n'ai pas compris le coup du "plus lourd"
    J'entends par là qu'utiliser un software sur des centaines de séquences, faisant parfois plus de mille nucléotides, prendra fort probablement plus de temps que d'utiliser une petite regexp qui y compte le nombre de codons stop.

    Citation Envoyé par MaliciaR Voir le message
    Tu peux toujours te contenter de compter des codons STOP. Mais ça ne saura être une prédiction de gène
    Je ne cherche pas à prédire des gènes, je connais les gènes que je suis entrain d'analyser, je veux simplement les remettre dans le sens 5'->3' si besoin est.


    Citation Envoyé par MaliciaR Voir le message
    Ton gène incomplet peut l'être autant entre le début et le milieu qu'entre le milieu et la fin. Les softs type GeneMark et Glimmer recherchent également des RBS ce qui est quand même un indicateur de début
    Soit le début du gène est bien le début de ma séquence, soit mon gène est incomplet et je n'ai pas de début.

    Citation Envoyé par MaliciaR Voir le message
    donne un fragment qui te pose souci et on comparera les deux méthodologies.
    Aucun fragment en particulier ne me pose de problème, je cherche une façon rapide et efficace de connaitre le sens des séquences de ma DB.

    Citation Envoyé par MaliciaR Voir le message
    La prédiction de gènes est chose difficile mais super intéressante et je veux bien filer un coup de main au besoin
    Merci, c'est sympa mais je ne dois pas faire ce genre de prédictions.

  5. #25
    Membre confirmé
    Avatar de MaliciaR
    Inscrit en
    Juillet 2008
    Messages
    513
    Détails du profil
    Informations personnelles :
    Âge : 42

    Informations forums :
    Inscription : Juillet 2008
    Messages : 513
    Points : 600
    Points
    600
    Par défaut
    Salut,

    J'avais mal compris ce que tu cherches à faire exactement. Cela dit, je ne vois pas trop comment tu vas définir si les gènes sont en 5' -> 3' ou inversement en comptant des codons STOP...

  6. #26
    Membre émérite
    Avatar de Jasmine80
    Femme Profil pro
    Bioinformaticienne
    Inscrit en
    Octobre 2006
    Messages
    3 157
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 44
    Localisation : Royaume-Uni

    Informations professionnelles :
    Activité : Bioinformaticienne
    Secteur : Santé

    Informations forums :
    Inscription : Octobre 2006
    Messages : 3 157
    Points : 2 673
    Points
    2 673
    Par défaut
    Citation Envoyé par MaliciaR Voir le message
    Salut,

    J'avais mal compris ce que tu cherches à faire exactement. Cela dit, je ne vois pas trop comment tu vas définir si les gènes sont en 5' -> 3' ou inversement en comptant des codons STOP...
    Je compte les stop pour les 6 cadres de lecture de la séquence de mon gène (partielle ou complète) , et le cadre correct est donc le seul cadre possédant 1 ou 0 stop. Si c'est un des 3 cadres du ses de ma séquence, c'est donc qu'elle est correctement orientée de 5' en 3'. Par contre, si le cadre de lecture correct provient d'un des 3 cadres de la séquence revcom de ma séquence, c'est donc que ma séquence est orientée de 3' en 5'. Est-ce clair?

+ Répondre à la discussion
Cette discussion est résolue.
Page 2 sur 2 PremièrePremière 12

Discussions similaires

  1. Problème de selection (mélange) de session
    Par CAML dans le forum ASP.NET
    Réponses: 5
    Dernier message: 15/05/2009, 13h18
  2. Réponses: 7
    Dernier message: 16/01/2009, 21h41
  3. Réponses: 4
    Dernier message: 05/07/2007, 15h22
  4. Problème d'index, Mélange de données
    Par Herman dans le forum Access
    Réponses: 4
    Dernier message: 06/10/2006, 17h40
  5. problème de séquences
    Par alliance dans le forum Oracle
    Réponses: 14
    Dernier message: 27/10/2005, 11h40

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo