IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Modules Perl Discussion :

[XML] Améliorer le parsing


Sujet :

Modules Perl

  1. #1
    Expert confirmé
    Avatar de GLDavid
    Homme Profil pro
    Service Delivery Manager
    Inscrit en
    Janvier 2003
    Messages
    2 852
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 47
    Localisation : France, Seine Saint Denis (Île de France)

    Informations professionnelles :
    Activité : Service Delivery Manager
    Secteur : Industrie Pharmaceutique

    Informations forums :
    Inscription : Janvier 2003
    Messages : 2 852
    Points : 4 759
    Points
    4 759
    Par défaut [XML] Améliorer le parsing
    Bonjour à vous tous !

    Voici mon petit problème du WE (bon WE à tous ). Voici un fichier XML que je veux parser :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
     
    <protein_group group_number="2" probability="1.00">
          <protein protein_name="UniRef100_Q8IUK7" n_indistinguishable_proteins="3" probability="1.00" percent_coverage="3.8" unique_stripped_peptides="KVPQVSTPTLVEVSR" group_sibling_id="a" total_number_peptides="2">
             <annotation protein_description="Similar to serum albumin precursor [Homo sapiens]"/>
             <indistinguishable_protein protein_name="UniRef100_P02768">
                <annotation protein_description="Serum albumin precursor [Homo sapiens]"/>         </indistinguishable_protein>
             <indistinguishable_protein protein_name="UniRef100_Q86YG0">
                <annotation protein_description="Similar to alpha-fetoprotein [Homo sapiens]"/>         </indistinguishable_protein>
             <peptide peptide_sequence="KVPQVSTPTLVEVSR" charge="2" initial_probability="1.00" nsp_adjusted_probability="1.00" peptide_group_designator="a" weight="1.00" is_nondegenerate_evidence="Y" n_tryptic_termini="2" n_sibling_peptides="0.99" n_sibling_peptides_bin="3" n_instances="1" is_contributing_evidence="Y">
             </peptide>
             <peptide peptide_sequence="KVPQVSTPTLVEVSR" charge="3" initial_probability="0.99" nsp_adjusted_probability="1.00" peptide_group_designator="a" weight="1.00" is_nondegenerate_evidence="Y" n_tryptic_termini="2" n_sibling_peptides="1.00" n_sibling_peptides_bin="3" n_instances="1" is_contributing_evidence="Y">
             </peptide>
          </protein>
    </protein_group>
    Et voici mon code qui parse ce fichier XML :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
    37
    38
    39
    40
    41
    42
    43
    44
    45
    46
    47
    48
    49
    50
    51
    52
    53
    54
    55
    56
    57
    58
    59
    60
    61
    62
    63
    64
    65
    66
    67
    68
    69
    70
    71
    72
    73
    74
    75
    76
    77
    78
    79
     
    use XML::Parser;
     
    # initialize the parser
    my $parser = XML::Parser->new( Handlers => 
    {
    Start=>\&handle_start
    });
    $url = "./interact-prot.xml";
    $parser->parsefile( $url );
    open FILE, ">>Results.txt" or die "Peut pas ouvrir Result.txt !!";
    print FILE "\nURL:$url";
     
    my @stack;
     
    sub handle_start {
    	my(@stack);
    	my($name, $desc, $val);
    	my( $expat, $protein, %attrs ) = @_;
    	push( @stack, { protein_group=>$protein});
    	if( %attrs ) {
    		while( my( $key, $value ) = each( %attrs )) {
    			if ($key eq "group_number") {
    				$val = $value;
    				open FILE, ">>Results.txt" or die "Peut pas ouvrir Result.txt !!";
    				print FILE "\nGroup number: $val\n";
    			}		
    		}
    		while( my( $key, $value ) = each( %attrs )) {
    			if ($key eq "protein_name") {
    				$name = $value;
    				open FILE, ">>Results.txt" or die "Peut pas ouvrir Result.txt !!";
    				print FILE "AccessionNumber: $name\n";
    			}	
    		}
    		while( my( $key, $value ) = each( %attrs )) {
    			if ($key eq "probability") {
    				$val = $value;
    				open FILE, ">>Results.txt" or die "Peut pas ouvrir Result.txt !!";
    				print FILE "probability=$val\t";
    			}
    		}
    		while( my( $key, $value ) = each( %attrs )) {
    			if ($key eq "percent_coverage") {
    				$val = $value;
    				open FILE, ">>Results.txt" or die "Peut pas ouvrir Result.txt !!";
    				print FILE "percent_coverage=$val\t";
    			}
    		}
    		while( my( $key, $value ) = each( %attrs )) {
    			if ($key eq "unique_stripped_peptides") {
    				$val = $value;
    				open FILE, ">>Results.txt" or die "Peut pas ouvrir Result.txt !!";
    				print FILE "unique_stripped_peptides=$val\n";
    			}
    		}	
    		while( my( $key, $value ) = each( %attrs )) {
    			if ($key eq "peptide_sequence") {
    				$val = $value;
    				open FILE, ">>Results.txt" or die "Peut pas ouvrir Result.txt !!";
    				print FILE "peptide_sequence=$val\t";
    			}
    		}		
    		while( my( $key, $value ) = each( %attrs )) {
    			if ($key eq "charge") {
    				$val = $value;
    				open FILE, ">>Results.txt" or die "Peut pas ouvrir Result.txt !!";
    				print FILE "charge=$val\t";
    			}
    		}		
    		while( my( $key, $value ) = each( %attrs )) {
    			if ($key eq "initial_probability") {
    				$val = $value;
    				open FILE, ">>Results.txt" or die "Peut pas ouvrir Result.txt !!";
    				print FILE "initial_probability=$val\n";
    			}
    		}	
    	}	
    }
    Vous l'aurez remarqué, je ne cherche que quelques infos. Toute fois, j'observe des redondances notamment au niveau des attributs probability. En outre, je voudrais faire le distingo entre l'attribut protein_name appartenant à la balise protein et l'attribut protein_name appartenant à la la balise indistinguishable_protein. Voyez-vous comment je pourrais faire ?
    Je vous remercie d'avance pour votre aide et excusez la longueur du thread.

    @ ++
    GLDavid
    Consultez la FAQ Perl ainsi que mes cours de Perl.
    N'oubliez pas les balises code ni le tag

    Je ne répond à aucune question technique par MP.

  2. #2
    Expert éminent
    Avatar de Jedai
    Homme Profil pro
    Enseignant
    Inscrit en
    Avril 2003
    Messages
    6 245
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Côte d'Or (Bourgogne)

    Informations professionnelles :
    Activité : Enseignant

    Informations forums :
    Inscription : Avril 2003
    Messages : 6 245
    Points : 8 586
    Points
    8 586
    Par défaut
    Un truc comme ça, non :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
    37
    38
    39
    40
    41
    42
    43
    44
    45
    46
    47
    48
    49
    50
    51
    52
    53
    54
    55
    56
    57
    58
    59
    60
    61
    62
    63
    64
    65
    66
    67
     
    #! /usr/bin/perl
    use strict;
    use warnings;
    use XML::Parser;
     
    # initialize the parser
    my $parser = XML::Parser->new( Handlers =>
    {
    Start=>\&handle_start
    });
    my $url = "./interact-prot.xml";
    $parser->parsefile( $url );
    open FILE, ">>Results.txt" or die "Peut pas ouvrir Result.txt !!";
    print FILE "\nURL:$url";
    close FILE;
     
    sub handle_start {
       my(@stack);
       my($name, $desc, $val);
       my( $expat, $protein, %attrs ) = @_;
       push( @stack, { protein_group=>$protein});
       if( %attrs ) {
            open FILE, ">>Results.txt" or die "Peut pas ouvrir Result.txt !!";
            foreach my $key( keys %attrs ) {
                if ($key eq "group_number") {
                    $val = $attrs{$key};
                    print FILE "\nGroup number: $val\n";
                }
                elsif ($key eq "protein_name" and $protein eq 'protein') {
                    #pour la balise 'protein'
                    $name = $attrs{$key};
                    print FILE "AccessionNumber: $name\n";
                }
                elsif ($key eq "protein_name" and $protein eq 'indistinguishable_protein') {
                    #pour la balise 'indistinguishable_protein'
                    $name = $attrs{$key};
                    print FILE "AccessionNumber: $name\n";
                }
                elsif ($key eq "probability") {
                    $val = $attrs{$key};
                    print FILE "probability=$val\t";
                }
                elsif ($key eq "percent_coverage") {
                    $val = $attrs{$key};
                    print FILE "percent_coverage=$val\t";
                }
                elsif ($key eq "unique_stripped_peptides") {
                    $val = $attrs{$key};
                    print FILE "unique_stripped_peptides=$val\n";
                }
                elsif ($key eq "peptide_sequence") {
                    $val = $attrs{$key};
                    print FILE "peptide_sequence=$val\t";
                }
                elsif ($key eq "charge") {
                    $val = $attrs{$key};
                    print FILE "charge=$val\t";
                }
                elsif ($key eq "initial_probability") {
                    $val = $attrs{$key};
                    print FILE "initial_probability=$val\n";
                }
            }
            close FILE;        
        }   
    }


    --
    Jedaï

  3. #3
    Expert confirmé
    Avatar de GLDavid
    Homme Profil pro
    Service Delivery Manager
    Inscrit en
    Janvier 2003
    Messages
    2 852
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 47
    Localisation : France, Seine Saint Denis (Île de France)

    Informations professionnelles :
    Activité : Service Delivery Manager
    Secteur : Industrie Pharmaceutique

    Informations forums :
    Inscription : Janvier 2003
    Messages : 2 852
    Points : 4 759
    Points
    4 759
    Par défaut
    Salut Jedaï, j'ai hâte de tester ton code car là tu me fais un super cadeau (j'ai pô Internet encore ma cabane au Canada qui est blotti au fond des bois, on y vois des écureuils sur le seuil...). Alors, vivement lundi !
    Et je te remercie très vivement avec une Maudite (c'est la bière à Robert Charlebois).

    @++
    GLDavid
    Consultez la FAQ Perl ainsi que mes cours de Perl.
    N'oubliez pas les balises code ni le tag

    Je ne répond à aucune question technique par MP.

  4. #4
    Expert confirmé
    Avatar de GLDavid
    Homme Profil pro
    Service Delivery Manager
    Inscrit en
    Janvier 2003
    Messages
    2 852
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 47
    Localisation : France, Seine Saint Denis (Île de France)

    Informations professionnelles :
    Activité : Service Delivery Manager
    Secteur : Industrie Pharmaceutique

    Informations forums :
    Inscription : Janvier 2003
    Messages : 2 852
    Points : 4 759
    Points
    4 759
    Par défaut
    Que te dire d'autres que :


    @ ++
    GLDavid
    Consultez la FAQ Perl ainsi que mes cours de Perl.
    N'oubliez pas les balises code ni le tag

    Je ne répond à aucune question technique par MP.

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Générer du XMl avec Xpath/LINQ et parsing
    Par patrickvier dans le forum VB.NET
    Réponses: 1
    Dernier message: 10/03/2014, 20h09
  2. [JAXB] Créer Fichier XML en Java (problème de parsing)
    Par rogersdrejordan dans le forum Format d'échange (XML, JSON...)
    Réponses: 5
    Dernier message: 13/06/2012, 19h02
  3. Réponses: 2
    Dernier message: 12/04/2011, 09h13
  4. XML Parsing Error: not well-formed
    Par localhost dans le forum Valider
    Réponses: 5
    Dernier message: 16/06/2005, 14h20
  5. Réponses: 14
    Dernier message: 25/10/2004, 21h33

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo