IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

C++ Discussion :

[bioinfo ]Clustering Sequences


Sujet :

C++

  1. #1
    Futur Membre du Club
    Profil pro
    Inscrit en
    Mai 2009
    Messages
    6
    Détails du profil
    Informations personnelles :
    Localisation : Belgique

    Informations forums :
    Inscription : Mai 2009
    Messages : 6
    Points : 5
    Points
    5
    Par défaut [bioinfo ]Clustering Sequences
    Bonsoir,
    Je recherche un moyen de faire du clustering sur des séquences de petites protéines
    ex:
    VLYLQRK
    VLYLQKK
    ELLVLLE
    SLLVLLE
    ELLVLLS
    SLLVLLS
    DLLVLLE
    ELLVLLD
    DLLVLLD
    AELLVLL
    APLLVLL
    ELLVLLR
    AKLLVLL
    KLLVLLK
    afin d'éliminer les protéines de séquences trop similaires et d'avoir un sample le plus diversifié.

    Je ne sais pas trop si je suis au bon endroit mais bon, je poste aussi dans le forum bioinfo

    Merci d'avance.

  2. #2
    Expert éminent sénior
    Avatar de koala01
    Homme Profil pro
    aucun
    Inscrit en
    Octobre 2004
    Messages
    11 614
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 52
    Localisation : Belgique

    Informations professionnelles :
    Activité : aucun

    Informations forums :
    Inscription : Octobre 2004
    Messages : 11 614
    Points : 30 626
    Points
    30 626
    Par défaut
    Salut, et bienvenue sur le forum.

    Ben, bonne chance, et bon courage.

    Il est difficile de répondre autre chose car tu ne donnes aucune indication quant à ce que tu as déjà fait ou aux problèmes que tu rencontres...

    As tu des problèmes au niveau de la conception au niveau de l'algorithme au niveau de l'implémentation

    La règle d'or de ce forum est "aide nous à t'aider". Il ne faut pas oublier que près de cinquante pourcent de la réponse résident bien souvent dans la question et la manière de la poser.

    Mais en gros, comment apporter une réponse à une question inexistante
    A méditer: La solution la plus simple est toujours la moins compliquée
    Ce qui se conçoit bien s'énonce clairement, et les mots pour le dire vous viennent aisément. Nicolas Boileau
    Compiler Gcc sous windows avec MinGW
    Coder efficacement en C++ : dans les bacs le 17 février 2014
    mon tout nouveau blog

  3. #3
    Futur Membre du Club
    Profil pro
    Inscrit en
    Mai 2009
    Messages
    6
    Détails du profil
    Informations personnelles :
    Localisation : Belgique

    Informations forums :
    Inscription : Mai 2009
    Messages : 6
    Points : 5
    Points
    5
    Par défaut
    Bonjour,
    et bien il y a bien une question :
    je recherche un moyen pour faire du clustering sur base des séquences du premier post (un extrait de 64 séquences ici en fait), donc un algo déjà implémenté dans une librairie c++ ou un conseil pour le faire.

    je dois conserver au maximum 90% d'identité, soit 6 caractères identiques sur 7 de manière générale.

    Je pensais le faire en R, mais j'ai pas saisi comment je pouvais faire cela sur base de séquences et non de chiffres :-/

    Au pire, j'implémente l'algo "con" qui consiste à rassembler en premier les 2 plus proches, et ainsi de suite.

    Des idées ?

  4. #4
    Futur Membre du Club
    Profil pro
    Inscrit en
    Mai 2009
    Messages
    6
    Détails du profil
    Informations personnelles :
    Localisation : Belgique

    Informations forums :
    Inscription : Mai 2009
    Messages : 6
    Points : 5
    Points
    5
    Par défaut
    j'oubliais, le but est ici de conserver les séquences les plus représentatives afin d'éviter la redondance lors de l'apprentissage par mon HMM...

    Ha, oui, autre question, si j'ai pas de réponse j'irais faire un nouveau thread :
    Je dois concevoir un profile HMM, est ce qui me pose problème c'est ici pas vrm l'apprentissage, mais plutot une fois que l'apprentissage aura été fait, quel algo utiliser pour la reconnaissance :-/
    Pour l'apprentissage, je me sers de Baum-Welch (combinaison entre l'algo forward et backward pour ajuster les probas : http://www.cs.tau.ac.il/~rshamir/alg...c06/node5.html), cependant, une fois que j'aurai ajuster tout ces brols, comment vais-je concrètement faire pour reconnaitre une séquence inconnue. Le but est ici de calculer un classificateur qui dira si la séquence inconnue est d'un type X ou non.

    merci

Discussions similaires

  1. programmation corba: le type "sequence"
    Par Kali dans le forum CORBA
    Réponses: 4
    Dernier message: 28/08/2005, 16h09
  2. [bioinfo] reverse complementaire d'une sequence
    Par perlgirl dans le forum Bioinformatique
    Réponses: 6
    Dernier message: 18/06/2004, 11h22
  3. Cluster sous Débian 3.0 (Woody)
    Par regular dans le forum Développement
    Réponses: 3
    Dernier message: 06/08/2003, 11h02
  4. voir les sequences existantes ?
    Par soniaSQL dans le forum PostgreSQL
    Réponses: 6
    Dernier message: 25/06/2003, 16h33
  5. Réponses: 2
    Dernier message: 05/06/2002, 12h29

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo