IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Langage Perl Discussion :

regex perl difficile


Sujet :

Langage Perl

  1. #1
    Membre averti
    Inscrit en
    Juin 2008
    Messages
    39
    Détails du profil
    Informations forums :
    Inscription : Juin 2008
    Messages : 39
    Par défaut regex perl difficile
    bonjour,
    je cherche à faire une regex pour un script perl.
    je dois recherche dans des fichiers texte le motif suivant:
    http://www.google.fr
    ou
    http://www.mail.google.fr

    les lignes du fichier ressemble à cela:
    192.1.1.1 - - [04/Jul/2009:23:14:00 +0200] "GET http://customercard.decathlon.fr/net...p/tab_left.gif HTTP/1.1" 0 788" "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1)"

    je dois rechercher tout ce qui est entre http et le premier /

    comment faire la regex svp ?

    j'ai fait quelques tests et suit arrivé au résultat suivant mais ça ne fonctionne pas.

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
     
    if ($ligne =~ m/.*GET (http:\/\/[.*].).*)/;
    merci de votre mais c'est assez urgent.
    cdlt

  2. #2
    Responsable Perl et Outils

    Avatar de djibril
    Homme Profil pro
    Inscrit en
    Avril 2004
    Messages
    19 822
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations forums :
    Inscription : Avril 2004
    Messages : 19 822
    Par défaut
    Entre ce que tu dis et ton exemple, ce n'est pas clair . Ton est de récupérer toutes les urls de ton fichier ?

  3. #3
    Membre Expert
    Avatar de s.n.a.f.u
    Homme Profil pro
    Développeur Web
    Inscrit en
    Août 2006
    Messages
    2 760
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 50
    Localisation : France, Loire Atlantique (Pays de la Loire)

    Informations professionnelles :
    Activité : Développeur Web

    Informations forums :
    Inscription : Août 2006
    Messages : 2 760
    Par défaut
    Je suis pas sûr de répondre à la question, mais la regex ne semble pas si ardue :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    #!/usr/bin/perl
     
    my $str = '192.1.1.1 - - [04/Jul/2009:23:14:00 +0200] "GET http://customercard.decathlon.fr/netcard/include/images/signup/tab_left.gif HTTP/1.1" 0 788" "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1)"';
     
    print $1 if ($str =~ m#^.*GET (http://[^/\s]+)#);

  4. #4
    Membre averti
    Inscrit en
    Juin 2008
    Messages
    39
    Détails du profil
    Informations forums :
    Inscription : Juin 2008
    Messages : 39
    Par défaut suite regex difficlile
    bonjour,
    oui je dois récupérer toutes les url, google était un exemple
    et j'ai mis une ligne complète pour bien montrer le format de la ligne complète.
    merci
    cdlt

  5. #5
    Membre averti
    Inscrit en
    Juin 2008
    Messages
    39
    Détails du profil
    Informations forums :
    Inscription : Juin 2008
    Messages : 39
    Par défaut premier test
    bonjour,
    ça ne marche pas j'ai toujours un message
    j'avais déjà ce message avant parce que ça ne match pas

    Unmatched ( in regex; marked by <-- HERE in m/^.*GET ( <-- HERE http:/ at D:\test\fichier.pl

    merci

  6. #6
    Responsable Perl et Outils

    Avatar de djibril
    Homme Profil pro
    Inscrit en
    Avril 2004
    Messages
    19 822
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations forums :
    Inscription : Avril 2004
    Messages : 19 822
    Par défaut
    Il existe déjà des modules propres te proposant des regex efficaces.
    Installe le module Regexp::Common

    Pour l'utiliser dans ton script, tu fais ceci :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    use Regexp::Common qw /URI/;
     
    my $regex_url = $RE{URI}{HTTP};
    my @urls = $str =~ m{($regex_url)}g;
    print "Mes urls : @urls\n";

  7. #7
    Membre averti
    Inscrit en
    Juin 2008
    Messages
    39
    Détails du profil
    Informations forums :
    Inscription : Juin 2008
    Messages : 39
    Par défaut regexp common
    bonjour,
    en revanche je ne sais pas comment installer regexp::common
    j'ai téléchargé un tar.gz mais où j'installe ça ?
    désolé mais je débute !
    cdlt

  8. #8
    Responsable Perl et Outils

    Avatar de djibril
    Homme Profil pro
    Inscrit en
    Avril 2004
    Messages
    19 822
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations forums :
    Inscription : Avril 2004
    Messages : 19 822

  9. #9
    Membre éprouvé
    Avatar de Jasmine80
    Femme Profil pro
    Bioinformaticienne
    Inscrit en
    Octobre 2006
    Messages
    3 157
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 45
    Localisation : Royaume-Uni

    Informations professionnelles :
    Activité : Bioinformaticienne
    Secteur : Santé

    Informations forums :
    Inscription : Octobre 2006
    Messages : 3 157
    Par défaut
    Citation Envoyé par Eric5959
    je dois rechercher tout ce qui est entre http et le premier /
    Si toutes les adresses commencent bien par http:// et se terminent par /, pourquoi ne pas simplement utiliser :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    if ($line =~m{(http://.*?)/}){
    	# récupération de $1
    }
    Quel est le danger de ne pas utiliser le module Regexp::Common ?

  10. #10
    Responsable Perl et Outils

    Avatar de djibril
    Homme Profil pro
    Inscrit en
    Avril 2004
    Messages
    19 822
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations forums :
    Inscription : Avril 2004
    Messages : 19 822
    Par défaut
    Citation Envoyé par Jasmine80 Voir le message
    Quel est le danger de ne pas utiliser le module Regexp::Common ?
    Ce n'est pas un danger de ne pas utiliser ce module. C'est juste qu'il contient énormément de regex bien écrites, optimisées et tester par de nombreux programmeurs compétents. Donc je trouve dommage de devoir réinventer la roue quand tout est déjà disponible.

  11. #11
    Invité
    Invité(e)
    Par défaut
    Citation Envoyé par Jasmine80 Voir le message
    Quel est le danger de ne pas utiliser le module Regexp::Common ?
    Réinventer la roue

  12. #12
    Membre expérimenté

    Profil pro
    Inscrit en
    Août 2009
    Messages
    156
    Détails du profil
    Informations personnelles :
    Âge : 43
    Localisation : France

    Informations forums :
    Inscription : Août 2009
    Messages : 156
    Par défaut
    En plus, réinventer la roue est une perte de temps,
    et au moins, un module, tout le monde sait comment il fonctionne (ou au moins tout le monde peut retrouver facilement), il est mis à jour si une faille est trouvée,
    donc pour la maintenance c'est aussi beaucoup plus simple.

  13. #13
    Membre averti
    Inscrit en
    Juin 2008
    Messages
    39
    Détails du profil
    Informations forums :
    Inscription : Juin 2008
    Messages : 39
    Par défaut suite regex difficlile
    bonjour,
    merci Jasmine80 ça fonctionne !
    je pense que je me compliquait la tâche !

    j'ai en revanche un autre souci, j'ai mis ci-dessous un morceau du code à partir getFiles. mon souci c'est que j'ai pas le résultat attendu, je veux une url et le nombre de fois trouvé. hors dans mon fichier résultat chaque fois qu'une url est trouvée elle est écrite dans le fichier en incrémentent le compteur (j'espère être clair, mais c'est pas évident à expliquer !)

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
     
    getFiles($rep,\@fichiers);
     
    open F_ECRIRE,">$rep/$res"  or die "E/S : $!\n";
     
    foreach $fic(@fichiers){
      open F_LIRE,"$fic" or warn "E/S : $!\n";
       my $ligne;   
       my $foundKey = "";
     
       while($ligne = <F_LIRE>){     
     
                  my $url = "";
                  if ($ligne =~ m{(http://.*?)/}){
                      my $Resulturl = $1;
                      print $Resulturl."\n";
                      #print $1."\n";
     
                  my $tempValue = $hashResults{$Resulturl};
                  #print $hashResults."\n";
                  $tempValue += 1;
                  #print $tempValue."\n";
                  $hashResults{$Resulturl} = $tempValue;
                  #print $tempValue."\n";
                print F_ECRIRE "$_ $hashResults{$_}\n" foreach (sort keys %hashResults);
     
          }
       }
    }
    merci de votre aide

  14. #14
    Membre éprouvé
    Avatar de Jasmine80
    Femme Profil pro
    Bioinformaticienne
    Inscrit en
    Octobre 2006
    Messages
    3 157
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 45
    Localisation : Royaume-Uni

    Informations professionnelles :
    Activité : Bioinformaticienne
    Secteur : Santé

    Informations forums :
    Inscription : Octobre 2006
    Messages : 3 157
    Par défaut
    Incrémente directement la valeur de ton hash au lieu d'utiliser la variable $tempValue

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    $hashResults{$Resulturl} ++;

  15. #15
    Membre éprouvé
    Avatar de Jasmine80
    Femme Profil pro
    Bioinformaticienne
    Inscrit en
    Octobre 2006
    Messages
    3 157
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 45
    Localisation : Royaume-Uni

    Informations professionnelles :
    Activité : Bioinformaticienne
    Secteur : Santé

    Informations forums :
    Inscription : Octobre 2006
    Messages : 3 157
    Par défaut
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    my %hashResults;
     
    open my $F_ECRIRE, '>', $rep.'/'.$res  or die "E/S : $!\n";
     
    foreach my $fic (@fichiers){
     
    	open my $F_LIRE, '<', $fic or warn "E/S : $!\n";
    	my $ligne;   
    	my $foundKey = "";
     
    	while (my $ligne = <$F_LIRE>){     
    		my $url = "";
    		if ($ligne =~ m{(http://.*?)/}){
    			my $Resulturl = $1;
    			print "$1\n";
    			$hashResults{$1} ++;
    		}
    	}
    	close $F_LIRE;
    }
     
    print $F_ECRIRE "$_ $hashResults{$_}\n" foreach (sort keys %hashResults);
    close $F_ECRIRE;
    Quelques conseils
    utilise les pragmas strict et warnings
    Déclare tes variables (my)
    ouvre tes fichiers dans une variable scalaire et utilise 3 arguments
    ferme tes filehandles

  16. #16
    Membre averti
    Inscrit en
    Juin 2008
    Messages
    39
    Détails du profil
    Informations forums :
    Inscription : Juin 2008
    Messages : 39
    Par défaut suite regex difficlile et fin
    bonjour,
    merci de ton aide et de tes conseils.
    c'est encore un peu confus perl pour moi , de plus j'en fais pas souvent ce qui rend difficile la pratique.
    merci, merci

  17. #17
    Membre éprouvé
    Avatar de Jasmine80
    Femme Profil pro
    Bioinformaticienne
    Inscrit en
    Octobre 2006
    Messages
    3 157
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 45
    Localisation : Royaume-Uni

    Informations professionnelles :
    Activité : Bioinformaticienne
    Secteur : Santé

    Informations forums :
    Inscription : Octobre 2006
    Messages : 3 157
    Par défaut
    N'hésite pas à poser des questions, ce forum est là pour ça. Tu peux également consulter la FAQ perl.

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Regex perl (test \n)
    Par slockstone dans le forum Langage
    Réponses: 10
    Dernier message: 18/01/2009, 16h21
  2. regex : différence entre Perl et Python
    Par rambc dans le forum Général Python
    Réponses: 3
    Dernier message: 08/01/2009, 20h53
  3. regex en perl
    Par flavia dans le forum Langage
    Réponses: 5
    Dernier message: 16/07/2008, 11h21
  4. Perl & Regex
    Par Fluxy dans le forum Langage
    Réponses: 5
    Dernier message: 25/02/2007, 12h46
  5. [Regex perl] Matcher un gros fichier
    Par osoumayaj dans le forum Collection et Stream
    Réponses: 2
    Dernier message: 18/01/2007, 09h37

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo