IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Calcul scientifique Python Discussion :

'downsampling' de sequences


Sujet :

Calcul scientifique Python

Mode arborescent

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Membre averti
    Homme Profil pro
    Étudiant
    Inscrit en
    Janvier 2013
    Messages
    12
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Etats-Unis

    Informations professionnelles :
    Activité : Étudiant
    Secteur : Santé

    Informations forums :
    Inscription : Janvier 2013
    Messages : 12
    Par défaut 'downsampling' de sequences
    Bonjour
    Comme vous allez le constater, je ne suis pas un expert dans le domaine mais je pense que ma question devrait trouver facilement une solution pour la majorité d'entre vous.
    Je travaille des gros sets de sequences d'ADN viral organisée comme cela (format fasta):
    >Name_date_location_x_y_z
    ATGCATGCATGCATGCATGCATGCATGCATGCATGCATGCATGCATGC
    >Name2_date2_location_x_y_z
    ATGCATGCATGCATGCATGCATGCATGCATGCATGCATGCATGCATGC

    Je mets en PJ un exemple avec une vingtaine de seq.

    J'ai differents sets de données de taille variable allant de 100 à plus de 5000 sequences et je souhaiterais faire un 'down-sampling' pour avoir 100 sequences de chaque dataset.
    Mon souhait initial serait de faire ce 'downsampling' de telle manière que j'ai un panel avec une qqté ± equivalente de sequences de chaque année (la date est au format numerique comme ceci: 2000.4; 2004.6; 2012.1...)
    Dans l'identifiant de la sequence (ligne commencant par '>'), la date est toujours après le premier '_'.

    Si cela n'est pas possible, un downsampling 'aleatoire' pourrait faire l'affaire.


    Merci beaucoup d'avoir pris le temps de me lire et merci pour votre aide et vos conseils.
    Amicalement,
    Fichiers attachés Fichiers attachés

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. programmation corba: le type "sequence"
    Par Kali dans le forum CORBA
    Réponses: 4
    Dernier message: 28/08/2005, 16h09
  2. listage de triggers/sequences avec sql plus
    Par stross dans le forum Oracle
    Réponses: 52
    Dernier message: 20/04/2004, 15h41
  3. peut-on savoir si un champ a une sequence??
    Par e11137 dans le forum PostgreSQL
    Réponses: 3
    Dernier message: 09/01/2004, 14h54
  4. voir les sequences existantes ?
    Par soniaSQL dans le forum PostgreSQL
    Réponses: 6
    Dernier message: 25/06/2003, 16h33
  5. Réponses: 2
    Dernier message: 05/06/2002, 12h29

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo