IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Langage Perl Discussion :

Problème de tableau après parsing


Sujet :

Langage Perl

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Membre confirmé
    Inscrit en
    Octobre 2007
    Messages
    99
    Détails du profil
    Informations forums :
    Inscription : Octobre 2007
    Messages : 99
    Par défaut Problème de tableau après parsing
    Bonjour à tous,

    Voici mon problème, j'ai souhaité via mon programme Perl parser une adresse URL (rentrer dans le code html) et récupérer des informations qui se situent entre des balises.

    J'arrive à les récupérer, cependant ma console n'affiche pas ce que je voudrais réellement !! Je m'explique :

    Je voudrais récupérer des noms de gène, de maladies et de médicaments. Ainsi je voudrais que la console m'écrive :

    Noms des différents gène : ********* / ************ / ********/ ...
    Noms des différentes maladies : ********/ ********/ ...
    Noms des différents médicaments : *********/ *********/ **/ ...

    J'ai pour cela créer des tableaux, mais regarder plutot mon code et dite moi ce qu'il ne convient pas MERCI

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
    37
    38
    39
    40
    41
    42
    43
    44
    45
    46
    47
    48
    49
    50
    51
    52
    53
    54
    55
    56
    57
    58
    59
    60
    61
    62
    63
    64
    65
    66
    67
    68
    69
    70
    71
    72
    73
    74
    75
    76
    77
    78
    79
    80
    81
    82
    83
    84
    85
    86
    87
    88
    89
    90
    91
    92
    93
    94
    95
    96
    97
    98
    99
    100
    101
    102
    103
    104
    105
    106
    107
    108
    109
    110
    111
    112
    113
    114
    115
    116
    117
    118
    119
    120
    121
    122
    123
    #!/usr/bin/perl
    use strict; 
    use warnings;
     
    use HTML::Parser;
    use LWP::Simple;
     
    my $baseurl = 'http://www.pharmgkb.org/do/serve?objId=';
    my $flag = 0;
     
     
     
    die "usage: $0 role code\n"
        if @ARGV != 2;
     
    my $role = $ARGV[0];
    my $code = $ARGV[1];
     
    print "$code\n";
    print "$role\n";
     
    if ($role ne 'Gene'){
    	if ($role ne 'Disease'){
    		if ($role ne 'Drug'){
    			die "not a valid a role\n";
    		}
    	}
    }
     
    my $url = $baseurl.$code.'&objCls='.$role;
    my $page = get($url);
     
    my @tab_gene= @_ ;
    my @tab_disease = @_;
    my @tab_drug= @_;
     
     
    #Parser
     
    my $parser = HTML::Parser->new(start_h => [\&start_rtn,"tag, attr"],
                    text_h => [\&text_rtn, "text"],
                    end_h => [\&end_rtn, "tag"]
                    );
     
    sub start_rtn {
     
            my ($tag, $attr) = @_;
        if ($tag =~ /^title$/){
            $flag = 1;
        }
     
        if ($tag =~ /^a$/ 
            and defined $attr->{href}  
            and $attr->{href} =~ /^\/do\/serve\?objId=PA[0-9]+&objCls=Gene$/
        ){    
            $flag = 2;
        }
     
        if ($tag =~ /^a$/ and defined $attr->{href}  
            and $attr->{href} =~ /^\/do\/serve\?objId=PA[0-9]+&objCls=Disease$/
        ){    
            $flag = 3;
        }
     
        if ($tag =~ /^a$/ and defined $attr->{href}  
            and $attr->{href} =~ /^\/do\/serve\?objId=PA[0-9]+&objCls=Drug$/
        ){    
            $flag = 4;
        }                
    }
     
    sub text_rtn {
     
    	my ($text) = @_;
        	$text =~ s/\n//g;
     
    	if($flag == 1){                
            	print "Le titre : $text \n";
    	}
     
       	if($flag == 2){
     
    		push(@tab_gene, $text);
    		my $Text_gene = join(" / ", @tab_gene);
    		print"Noms des différents gènes : $Text_gene\n";
        	}
     
       	if($flag == 3){
     
    		push(@tab_disease, $text);
    		my $Text_disease = join(" / ", @tab_disease);
    		print"Noms des différentes maladies : $Text_disease\n";
    	}
     
       	if($flag == 4){
     
    		push(@tab_drug, $text);
    		my $Text_drug = join(" / ", @tab_drug);
    		print"Noms des différents médicaments : $Text_drug\n";
    	}
     
    }
     
    sub end_rtn {
     
        	my ($tag) = @_;
     
       	if ($tag =~ /^\/title$/){
                    $flag = 0;
       	}
     
        	if ($tag =~ /^\/a$/ && ($flag==2 || $flag==3 || $flag == 4)){
           	 	$flag = 0;	
    	}
     
    }
     
     
    #start parsing
    $parser->parse($page);
     
    #end parser
    $parser ->eof;
    Ma console m'écrit :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    PA444517
    Disease
    Le titre : PharmGKB: Hypercholesterolemia, Familial 
    Noms des différents gènes : ESR1
    Noms des différents gènes : ESR1 / LDLR
    Noms des différents gènes : ESR1 / LDLR / MTTP
    Noms des différents médicaments : atorvastatin
    Noms des différents médicaments : atorvastatin / estrogens
    Noms des différents médicaments : atorvastatin / estrogens / torcetrapib
    Et je voudrais que ma console écrive : (supprimer les étapes "intermédiaire" des tableaux)

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    PA444517
    Disease
    Le titre : PharmGKB: Hypercholesterolemia, Familial 
    Noms des différents gènes : ESR1 / LDLR / MTTP
    Noms des différents médicaments : atorvastatin / estrogens / torcetrapib
    MERCI pour vos commentaires, et demandez moi si vous ne saisissez pas mon problème !!!

  2. #2
    Membre chevronné Avatar de iblis
    Inscrit en
    Janvier 2007
    Messages
    510
    Détails du profil
    Informations personnelles :
    Âge : 58

    Informations forums :
    Inscription : Janvier 2007
    Messages : 510
    Par défaut
    Il te suffit juste d'imprimer tes résultats hors de la boucle de parsage, une fois le parsage terminé, dans le main, en fin de code.

    Par exemple avec un
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    print (join ' / ', @tab_gene), "\n";

  3. #3
    Membre confirmé
    Profil pro
    Inscrit en
    Février 2008
    Messages
    39
    Détails du profil
    Informations personnelles :
    Localisation : France, Paris (Île de France)

    Informations forums :
    Inscription : Février 2008
    Messages : 39
    Par défaut
    Bonjour,

    Tu fais les prints en même temps que tu lis les données. Donc une impression est faite à chaque reconnaissance d'un élément. Tu cumules bien les éléments dans des tableaux mais il faut faire l'affichage uniquement en fin de document.

    Dans ton exemple, ajoute le code suivant dans end_rtn pour voir les médicaments.

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    if ($tag eq "/html") {
        my $Text_drug = join(" / ", @tab_drug);
        print"===> médicaments : $Text_drug\n";
    }

  4. #4
    Membre confirmé
    Inscrit en
    Octobre 2007
    Messages
    99
    Détails du profil
    Informations forums :
    Inscription : Octobre 2007
    Messages : 99
    Par défaut
    Cela est parfait !!! CA FONCTIONNE

    Je vous montre mon code et ma console (pour 1 exemple)

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
    37
    38
    39
    40
    41
    42
    43
    44
    45
    46
    47
    48
    49
    50
    51
    52
    53
    54
    55
    56
    57
    58
    59
    60
    61
    62
    63
    64
    65
    66
    67
    68
    69
    70
    71
    72
    73
    74
    75
    76
    77
    78
    79
    80
    81
    82
    83
    84
    85
    86
    87
    88
    89
    90
    91
    92
    93
    94
    95
    96
    97
    98
    99
    100
    101
    102
    103
    104
    105
    106
    107
    108
    109
    110
    111
    112
    113
    114
    115
    116
    117
    118
    119
    120
    121
    122
    123
    124
    125
    126
    #!/usr/bin/perl
    use strict; 
    use warnings;
     
    use HTML::Parser;
    use LWP::Simple;
     
    #Constantes
    my $baseurl = 'http://www.pharmgkb.org/do/serve?objId=';
    my $flag = 0;
     
    #Tableau @ARGV : paramètres dans la console 
    die "usage: $0 role code\n"
        if @ARGV != 2;
     
    my $role = $ARGV[0];
    my $code = $ARGV[1];
     
    #Vérification des paramètres 
    print "$code\n";
    print "$role\n";
     
    if ($role ne 'Gene'){
    	if ($role ne 'Disease'){
    		if ($role ne 'Drug'){
    			die "not a valid a role\n";
    		}
    	}
    }
     
    #Compostion de l'URL final (à parser ensuite)
    my $url = $baseurl.$code.'&objCls='.$role;
    my $page = get($url);
     
    #Tableaux où seront stocker les différentes informations 
    my @tab_gene= @_ ;
    my @tab_disease = @_;
    my @tab_drug= @_;
     
    #Parser
    my $parser = HTML::Parser->new(start_h => [\&start_rtn,"tag, attr"],
                    text_h => [\&text_rtn, "text"],
                    end_h => [\&end_rtn, "tag"]
                    );
     
    sub start_rtn {
     
        my ($tag, $attr) = @_;	#Tableau 
     
    #Définition des balises de départ
     
        if ($tag =~ /^title$/){
            $flag = 1;
        }
     
        if ($tag =~ /^a$/ 
            and defined $attr->{href}  
            and $attr->{href} =~ /^\/do\/serve\?objId=PA[0-9]+&objCls=Gene$/){    
            $flag = 2;
        }
     
        if ($tag =~ /^a$/ and defined $attr->{href}  
            and $attr->{href} =~ /^\/do\/serve\?objId=PA[0-9]+&objCls=Disease$/){    
            $flag = 3;
        }
     
        if ($tag =~ /^a$/ and defined $attr->{href}  
            and $attr->{href} =~ /^\/do\/serve\?objId=PA[0-9]+&objCls=Drug$/){    
            $flag = 4;
        }                
     
    }
     
    sub text_rtn {
     
    	my ($text) = @_;
        	$text =~ s/\n//g;
     
    	if($flag == 1){                
            	print "Le titre : $text \n";
    	}
     	if($flag == 2){
    		push(@tab_gene, $text);		#Le texte entre balises est ajouté dans un tableau correspondant à son rôle(@tab_gene)
        	}
       	if($flag == 3){
    		push(@tab_disease, $text);	#Le texte entre balises est ajouté dans un tableau correspondant à son rôle(@tab_disease)
    	}
      	if($flag == 4){
    		push(@tab_drug, $text);		#Le texte entre balises est ajouté dans un tableau correspondant à son rôle(@tab_drug)
    	}
     
    }
     
    sub end_rtn {
     
        	my ($tag) = @_;
     
       	if ($tag =~ /^\/title$/){
                    $flag = 0;
       	}
     
        	if ($tag =~ /^\/a$/ && ($flag==2 || $flag==3 || $flag == 4)){
           	 	$flag = 0;	
    	}
     
    	if ($tag eq "/html") {
        		my $Text_gene = join(" / ", @tab_gene);
        		print"===> genes : $Text_gene\n";
    	}
    	if ($tag eq "/html") {
      		my $Text_disease = join(" / ", @tab_disease);
        		print"===> maladies : $Text_disease\n";
    	}
    	if ($tag eq "/html") {
    		my $Text_drug = join(" / ", @tab_drug);		#Les informations ($text) seront séparées par un "/"
        		print"===> médicaments : $Text_drug\n";
    	}
     
    }
     
     
    #start parsing
    $parser->parse($page);
     
    #end parser
    $parser ->eof;
    Console : En ayant tapé dans la console : Nom_du_Programme.pl Gene PA227

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    PA227
    Gene
    Le titre : PharmGKB: LDLR 
    ===> genes : 
    ===> maladies : Hypercholesterolemia, Familial / Metabolic Syndrome X
    ===> médicaments : atorvastatin
    Ainsi je vous remercie pour votre rapidité, et l'efficacité de vos réponses !!! MERCI

  5. #5
    Membre confirmé
    Profil pro
    Inscrit en
    Février 2008
    Messages
    39
    Détails du profil
    Informations personnelles :
    Localisation : France, Paris (Île de France)

    Informations forums :
    Inscription : Février 2008
    Messages : 39
    Par défaut
    Merci pour le feedback et le tag résolu.

    C'est sympa pour ceux qui ont répondu et c'est très utile pour les lecteurs suivants.

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. problème d'intentation après une figure ou un tableau
    Par RouRa22 dans le forum Tableaux - Graphiques - Images - Flottants
    Réponses: 1
    Dernier message: 26/08/2010, 08h29
  2. [XHTML] problème de tableau
    Par virgul dans le forum Balisage (X)HTML et validation W3C
    Réponses: 5
    Dernier message: 28/04/2005, 07h18
  3. Problème de tableau
    Par tom06440 dans le forum Balisage (X)HTML et validation W3C
    Réponses: 3
    Dernier message: 26/04/2005, 20h30
  4. Problème de tableau
    Par krfa1 dans le forum Mise en page CSS
    Réponses: 2
    Dernier message: 08/02/2005, 11h09
  5. Problèmes d'espaces après requete SQL
    Par innosang dans le forum Bases de données
    Réponses: 7
    Dernier message: 29/04/2004, 16h47

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo