IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Bioinformatique Perl Discussion :

Extraction des genes d'un fichier à partir d'une liste


Sujet :

Bioinformatique Perl

  1. #1
    Nouveau Candidat au Club
    Homme Profil pro
    Enseignant Chercheur
    Inscrit en
    Août 2014
    Messages
    2
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Essonne (Île de France)

    Informations professionnelles :
    Activité : Enseignant Chercheur
    Secteur : Service public

    Informations forums :
    Inscription : Août 2014
    Messages : 2
    Points : 1
    Points
    1
    Par défaut Extraction des genes d'un fichier à partir d'une liste
    Bonjour à tous,
    cela fait un moment que je cherche sans trouver de solutions....
    J'ai 2 fichiers, un qui contient une liste de noms :
    Citation:
    >Gene29857
    >Gene1
    >Gene1
    >Gene1
    >Gene29912
    >Gene29912
    >Gene29912
    >Gene3
    >Gene29925
    >Gene29925
    >Gene29928
    >Gene29928
    >Gene29942
    >Gene4
    >Gene29986
    >Gene29986
    >Gene30035
    >Gene30035
    >Gene30049
    ...
    Et un qui contient les caractéristiques de ces noms :
    >Gene1
    MSVEITGI
    >Gene2
    MSVESSSGSGDRITVNPDPIH
    >Gene3
    MMNQ
    >Gene4
    MVKFTADELRRIMDYKHNIRNMSVIAQ
    ...
    Je voudrais récupérer les ensembles noms+caractéristiques dans le 2ème fichier des noms présents dans le premier fichier...
    Je voudrais faire çà sur un serveur distant, donc en shell ce serait super :-D

    Si quelqu'un avait une piste, ou même une solution, je suis preneur...
    Merci beaucoup par avance !

  2. #2
    Rédacteur/Modérateur

    Avatar de Lolo78
    Homme Profil pro
    Conseil - Consultant en systèmes d'information
    Inscrit en
    Mai 2012
    Messages
    3 612
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Yvelines (Île de France)

    Informations professionnelles :
    Activité : Conseil - Consultant en systèmes d'information
    Secteur : High Tech - Opérateur de télécommunications

    Informations forums :
    Inscription : Mai 2012
    Messages : 3 612
    Points : 12 469
    Points
    12 469
    Billets dans le blog
    1
    Par défaut
    Bonjour,

    peux-tu donner une idée approximative de la taille des deux fichiers?

  3. #3
    Nouveau Candidat au Club
    Homme Profil pro
    Enseignant Chercheur
    Inscrit en
    Août 2014
    Messages
    2
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Essonne (Île de France)

    Informations professionnelles :
    Activité : Enseignant Chercheur
    Secteur : Service public

    Informations forums :
    Inscription : Août 2014
    Messages : 2
    Points : 1
    Points
    1
    Par défaut
    Le fichier référence fait dans les 15Mo (environ 2x25000 lignes), le 1er fichier est plus petit (juste les noms, environ 10-20000 lignes).

  4. #4
    Rédacteur/Modérateur

    Avatar de Lolo78
    Homme Profil pro
    Conseil - Consultant en systèmes d'information
    Inscrit en
    Mai 2012
    Messages
    3 612
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Yvelines (Île de France)

    Informations professionnelles :
    Activité : Conseil - Consultant en systèmes d'information
    Secteur : High Tech - Opérateur de télécommunications

    Informations forums :
    Inscription : Mai 2012
    Messages : 3 612
    Points : 12 469
    Points
    12 469
    Billets dans le blog
    1
    Par défaut
    Bon, tu commences par lire le premier fichier ligne par ligne et stockes les lignes individuelles dans un hash (n'oublie pas de faire un chomp dessus avant). Puis tu fermes ce fichier, tu n'en as plus besoin.

    Ensuite tu lis le second fichier ligne par ligne, chaque fois que tu rencontres un gène, tu vérifies dans le hash si c'est un de ceux dont tu as besoin, et si c'est le cas, tu récupère les caractéristiques sur la ligne suivante.

    Bien sûr, c'est une solution Perl (nous sommes sur un forum Perl). Mais rien ne t'empêche de copier le script Perl sur le serveur distant, puis d'exécuter le script à distance depuis ton poste de travail (en shell ou autrement). Ou même d'inclure le code Perl dans un shell, tu n'auras même pas deboin de transférer le script Perl.

    Sinon, tu peux aussi utiliser du awk (qui a des tables de hachage) dans un shell, mais ça revient au même que de mettre du Perl dans un shell.

Discussions similaires

  1. [RDF] Extraction des concepts pour un terme à partir d'une ontologie ODP
    Par khaled87 dans le forum Ontologies
    Réponses: 0
    Dernier message: 05/03/2014, 10h11
  2. [XL-2010] Macro pour renommer des fichiers à partir d'une liste de nom de fichiers
    Par thomahh dans le forum Macros et VBA Excel
    Réponses: 7
    Dernier message: 25/01/2013, 17h03
  3. [Batch] Supprimer des fichiers à partir d'une liste contenu dans un fichier txt
    Par damsmut dans le forum Scripts/Batch
    Réponses: 10
    Dernier message: 15/11/2012, 10h23
  4. Réponses: 1
    Dernier message: 19/04/2008, 16h26
  5. Sélectionner un fichier à partir d'une liste filtrée
    Par Lenaick dans le forum C++Builder
    Réponses: 7
    Dernier message: 14/03/2006, 11h16

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo