IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Python Discussion :

Sélectionner une partie d'un fichier


Sujet :

Python

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Membre confirmé
    Homme Profil pro
    Étudiant
    Inscrit en
    Janvier 2019
    Messages
    61
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 28
    Localisation : France, Puy de Dôme (Auvergne)

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Janvier 2019
    Messages : 61
    Par défaut Sélectionner une partie d'un fichier
    Bonjour à tous,
    J'ai le fichier suivant :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
    37
    38
    39
    40
    41
    42
    43
    44
    45
    46
    47
    48
    LOCUS       MK559245                 402 bp    DNA     linear   BCT 30-JUN-2019
    DEFINITION  Bradyrhizobium sp. strain 83012 ThrA (thrA) gene, partial cds.
    ACCESSION   MK559245
    VERSION     MK559245.1
    KEYWORDS    .
    SOURCE      Bradyrhizobium sp.
      ORGANISM  Bradyrhizobium sp.
                Bacteria; Proteobacteria; Alphaproteobacteria; Rhizobiales;
                Bradyrhizobiaceae; Bradyrhizobium.
    REFERENCE   1  (bases 1 to 402)
      AUTHORS   Zhang,Z. and Li,Y.
      TITLE     Direct Submission
      JOURNAL   Submitted (21-FEB-2019) Key Laboratory of Coastal Biology and
                Utilization, Yantai Institute of Coastal Zone Research, Chinese
                Academy of Sciences, 17 Chunhui Road, Laishan District, Yantai,
                Shandong 264003, China
    COMMENT     ##Assembly-Data-START##
                Sequencing Technology :: Sanger dideoxy sequencing
                ##Assembly-Data-END##
    FEATURES             Location/Qualifiers
         source          1..402
                         /organism="Bradyrhizobium sp."
                         /mol_type="genomic DNA"
                         /strain="83012"
                         /isolation_source="nodules"
                         /host="Aeschynomene indica"
                         /db_xref="taxon:376"
                         /country="China"
         gene            <1..>402
                         /gene="thrA"
         CDS             <1..>402
                         /gene="thrA"
                         /codon_start=1
                         /transl_table=11
                         /product="ThrA"
                         /protein_id="QDF43547.1"
                         /translation="FEAAVGAAIPVIKTLREGLAGTGISRVYGILNGTCNYILTRMEQ
                         EGLSFDECLKDAQRLGYAEADPSFDIHGHDTAQKLAILASLAFGTQVAEKSIYVEGIS
                         SIAPEDLKAAAELGYRVKLLGVAMRTAKGIEQ"
    ORIGIN      
            1 ttcgaggccg ccgtcggggc cgccattccg gtcatcaaga ccctgcgcga ggggctcgcc
           61 ggcaccggca tcagccgcgt ctatggcatc ctcaacggga cctgcaacta catcctgacc
          121 cggatggagc aggagggcct gtcgttcgac gagtgcctga aggacgccca gcgcctgggt
          181 tacgccgagg ccgatccgtc gttcgacatt catggccacg ataccgcgca gaagctggcg
          241 atcctggcga gtctcgcctt cggcacccag gtggccgaaa aatccatcta cgtggaaggc
          301 atctcctcga tcgccccgga ggatctgaag gccgcggccg agctgggtta tcgcgtcaag
          361 ctgctcggcg tcgccatgcg taccgccaag ggcatcgagc ag
    //
    Je dois isoler la séquence d'ADN ( ttcgaggccg...ag) de ce fichier et la placer dans une liste... or je ne vois pas du tout comment faire, pouvez vous m'aider ?

    Merci

  2. #2
    Expert éminent
    Homme Profil pro
    Architecte technique retraité
    Inscrit en
    Juin 2008
    Messages
    21 753
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Manche (Basse Normandie)

    Informations professionnelles :
    Activité : Architecte technique retraité
    Secteur : Industrie

    Informations forums :
    Inscription : Juin 2008
    Messages : 21 753
    Par défaut
    Salut,

    Citation Envoyé par Amniote Voir le message
    je ne vois pas du tout comment faire, pouvez vous m'aider ?
    Vous pourriez lire le fichier ligne par ligne, détecter celle qui commence par "ORIGIN", stocker les suivantes dans une liste. Puis nettoyer la liste de lignes...

    - W
    Architectures post-modernes.
    Python sur DVP c'est aussi des FAQs, des cours et tutoriels

  3. #3
    Expert confirmé Avatar de BufferBob
    Profil pro
    responsable R&D vidage de truites
    Inscrit en
    Novembre 2010
    Messages
    3 041
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations professionnelles :
    Activité : responsable R&D vidage de truites

    Informations forums :
    Inscription : Novembre 2010
    Messages : 3 041
    Par défaut
    salut,

    par exemple avec des regex et en mettant tout le fichier en mémoire (5 lignes) :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    import re
    with open('fichier', 'r') as f:
       content = f.read()
    block = re.findall(r'ORIGIN(.+)//', content, re.DOTALL)[0]  # on isole le bloc "ORIGIN (...) //"
    sequences = re.findall(r'[actg]{2,}', block)                # on garde uniquement les séquences actg de 2 caractères ou +
    et le résultat :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    >>> sequences
    ['ttcgaggccg', 'ccgtcggggc', 'cgccattccg', 'gtcatcaaga', 'ccctgcgcga', 'ggggctcgcc', 'ggcaccggca', 'tcagccgcgt', 'ctatggcatc', 'ctcaacggga', 'cctgcaacta', 'catcctgacc', 'cggatggagc', 'aggagggcct', 'gtcgttcgac', 'gagtgcctga', 'aggacgccca', 'gcgcctgggt', 'tacgccgagg', 'ccgatccgtc', 'gttcgacatt', 'catggccacg', 'ataccgcgca', 'gaagctggcg', 'atcctggcga', 'gtctcgcctt', 'cggcacccag', 'gtggccgaaa', 'aatccatcta', 'cgtggaaggc', 'atctcctcga', 'tcgccccgga', 'ggatctgaag', 'gccgcggccg', 'agctgggtta', 'tcgcgtcaag', 'ctgctcggcg', 'tcgccatgcg', 'taccgccaag', 'ggcatcgagc', 'ag']

  4. #4
    Expert confirmé Avatar de CosmoKnacki
    Homme Profil pro
    Justicier interdimensionnel
    Inscrit en
    Mars 2009
    Messages
    2 986
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Charente Maritime (Poitou Charente)

    Informations professionnelles :
    Activité : Justicier interdimensionnel

    Informations forums :
    Inscription : Mars 2009
    Messages : 2 986
    Par défaut
    Avec itertools:
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    from itertools import dropwhile, takewhile, chain
     
    with open('rhyzome.txt', 'r') as fh:
         l=dropwhile(lambda x: not x.startswith('ORIGIN'), fh)
         n=chain.from_iterable([m.split()[1::] for m in takewhile(lambda x: not x.startswith('//'), l)])
         print(list(n))

  5. #5
    Expert confirmé
    Avatar de fred1599
    Homme Profil pro
    Lead Dev Python
    Inscrit en
    Juillet 2006
    Messages
    4 064
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Meurthe et Moselle (Lorraine)

    Informations professionnelles :
    Activité : Lead Dev Python
    Secteur : Arts - Culture

    Informations forums :
    Inscription : Juillet 2006
    Messages : 4 064
    Par défaut
    Bonsoir,

    Avec un flag ça passe bien aussi,

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    In [1]: with open('test.txt', 'r') as f:     
        ...:     start = False 
        ...:     for line in f: 
        ...:         if line.startswith('ORIGIN'): 
        ...:             line = next(f) 
        ...:             start = True 
        ...:         elif line.startswith('\\'):  
        ...:             break 
        ...:         if start: 
        ...:             n, *values = line.lstrip().split() 
        ...:             if values: 
        ...:                 print(values)
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    ['ttcgaggccg', 'ccgtcggggc', 'cgccattccg', 'gtcatcaaga', 'ccctgcgcga', 'ggggctcgcc']
    ['ggcaccggca', 'tcagccgcgt', 'ctatggcatc', 'ctcaacggga', 'cctgcaacta', 'catcctgacc']
    ['cggatggagc', 'aggagggcct', 'gtcgttcgac', 'gagtgcctga', 'aggacgccca', 'gcgcctgggt']
    ['tacgccgagg', 'ccgatccgtc', 'gttcgacatt', 'catggccacg', 'ataccgcgca', 'gaagctggcg']
    ['atcctggcga', 'gtctcgcctt', 'cggcacccag', 'gtggccgaaa', 'aatccatcta', 'cgtggaaggc']
    ['atctcctcga', 'tcgccccgga', 'ggatctgaag', 'gccgcggccg', 'agctgggtta', 'tcgcgtcaag']
    ['ctgctcggcg', 'tcgccatgcg', 'taccgccaag', 'ggcatcgagc', 'ag']

  6. #6
    Expert éminent
    Homme Profil pro
    Architecte technique retraité
    Inscrit en
    Juin 2008
    Messages
    21 753
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Manche (Basse Normandie)

    Informations professionnelles :
    Activité : Architecte technique retraité
    Secteur : Industrie

    Informations forums :
    Inscription : Juin 2008
    Messages : 21 753
    Par défaut
    Citation Envoyé par fred1599 Voir le message
    Avec un flag ça passe bien aussi
    Sans "flag", ce n'est pas si horrible non plus:

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    with open('test.txt', 'r') as f:
        for line in f:
            if line.startswith('ORIGIN'):
                break
        lines = []
        for line in f:
            lines += line.rstrip().split()[1:]
    print (''.join(lines))
    Bon d'accord, je n'écrirai pas cela ainsi car çà fonctionne lorsque le fichier texte est "bien formé" et que l'expérience rend méfiant... Mais çà reste à la portée de ce qu'a (normalement) appris un débutant.

    - W
    Architectures post-modernes.
    Python sur DVP c'est aussi des FAQs, des cours et tutoriels

Discussions similaires

  1. Supprimer une partie d'un fichier
    Par onet dans le forum Linux
    Réponses: 2
    Dernier message: 05/01/2007, 19h13
  2. [DOM] Récupérer une partie d’un fichier HTML
    Par fadex dans le forum Bibliothèques et frameworks
    Réponses: 4
    Dernier message: 05/01/2007, 12h30
  3. Awk extraire une partie d'un fichier
    Par titexe dans le forum Linux
    Réponses: 2
    Dernier message: 30/11/2006, 11h54
  4. [VB6]Lire une partie d'un fichier .txt
    Par patoch76 dans le forum VB 6 et antérieur
    Réponses: 26
    Dernier message: 02/05/2006, 20h49
  5. [VB]recherche dans une partie d'un fichier texte
    Par malhivertman1 dans le forum VB 6 et antérieur
    Réponses: 11
    Dernier message: 19/01/2006, 11h56

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo