IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Langage Perl Discussion :

Pb programme pattern matching


Sujet :

Langage Perl

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Futur Membre du Club
    Profil pro
    Inscrit en
    Juillet 2009
    Messages
    4
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Juillet 2009
    Messages : 4
    Par défaut Pb programme pattern matching
    Bonjour à tous,

    je suis plutôt novice en perl et je rencontre actuellement un problème avec un
    programmme de pattern matching.
    Mon point de départ est une liste de termes complexes que je dois repérer dans un corpus. Jusque là, pas de souci, mon prog repère les termes. Mais mon but n'est pas de les extraire mais de les baliser dans le corpus lui même et là je sèche.
    Si quelqu'un a une idée ce serait super.
    Merci d'avance

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
     
     
    open (TERMES, "termes.txt") or die "Termes introuvables";
    foreach $ligne (<TERMES>){push @termes, $ligne}
    foreach(@termes)
    {
    	pluriels($_);
    	chomp($_);
    	#s/\r//;
    	push @termes_plur, $_;
    }
    @termes_plur = sort{length($b) <=> length($a)} @termes_plur;
    open (FICHIER, "corpus.txt") or die "Fichier d'entrée introuvable";
    push @fichier, <FICHIER>;
    foreach $terme (@termes_plur)
    {
        foreach(@fichier)
        {
    	while(/($terme)/g){print $terme."\t".$1."\n"}
        }
    }

  2. #2
    Membre éprouvé
    Avatar de Jasmine80
    Femme Profil pro
    Bioinformaticienne
    Inscrit en
    Octobre 2006
    Messages
    3 157
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 45
    Localisation : Royaume-Uni

    Informations professionnelles :
    Activité : Bioinformaticienne
    Secteur : Santé

    Informations forums :
    Inscription : Octobre 2006
    Messages : 3 157
    Par défaut
    Citation Envoyé par marge31 Voir le message
    Jusque là, pas de souci, mon prog repère les termes. Mais mon but n'est pas de les extraire mais de les baliser dans le corpus lui même et là je sèche.
    Tu ne peux pas modifier directement ton fichier de données, tu dois en recréer un nouveau (cf module FileHandle) et recopier tes données en les balisant si nécessaire.

    Cela t'aide-t'il?

  3. #3
    Futur Membre du Club
    Profil pro
    Inscrit en
    Juillet 2009
    Messages
    4
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Juillet 2009
    Messages : 4
    Par défaut
    Bonjour Jasmine,

    je te remercie de ta réponse mais étant très novice, je ne vois pas trop comment implémenter la chose. Pourrais tu m'en dire plus stp?

    Merci

  4. #4
    Membre éprouvé
    Avatar de Jasmine80
    Femme Profil pro
    Bioinformaticienne
    Inscrit en
    Octobre 2006
    Messages
    3 157
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 45
    Localisation : Royaume-Uni

    Informations professionnelles :
    Activité : Bioinformaticienne
    Secteur : Santé

    Informations forums :
    Inscription : Octobre 2006
    Messages : 3 157
    Par défaut
    Je pensais à quelque chose de ce genre :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    #!/usr/local/bin/perl
     
     
     
    use strict;
    use warnings;
     
    use FileHandle;
     
    ...
     
    # inutile de trier
    # my @termes_plur = sort{length($b) <=> length($a)} @termes_plur;
     
    # ouverture du fichier d'entrée
    open my $fh, '<', "corpus.txt" or die $_;
     
    # création du fichier de sortie
    my $fh_new = FileHandle->new(">new_corpus.txt");
     
    # analyse ligne par ligne
    while (my $line = $fh){
    	# recherche mot par mot de @termes_plur
    	foreach my $word (@termes_plur){
    		# ajout des balises pour l'ensemble d'un même mot (recherche globale)
    		# recherche insensible à la casse
    		$line =~ s/($w)/$balise_entrante$1$balisefermante/gi;
    	}
    	# écriture du résultat dans le nouveau fichier 
    	print $fh_new $line;
    }
    close $fh;

  5. #5
    Futur Membre du Club
    Profil pro
    Inscrit en
    Juillet 2009
    Messages
    4
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Juillet 2009
    Messages : 4
    Par défaut
    Je viens de tester ton bout de code et voici ce que j'obtiens : GLOB(0x35d0c) et ce des millions de fois. T'as une idée d'ou viendrait le pb?

  6. #6
    Membre éprouvé
    Avatar de Jasmine80
    Femme Profil pro
    Bioinformaticienne
    Inscrit en
    Octobre 2006
    Messages
    3 157
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 45
    Localisation : Royaume-Uni

    Informations professionnelles :
    Activité : Bioinformaticienne
    Secteur : Santé

    Informations forums :
    Inscription : Octobre 2006
    Messages : 3 157
    Par défaut
    Non, je ne sais pas d'où vient le problème. Si tu pouvais me donner quelques lignes du fichier corpus en exemple et quelques mots à y rechercher, ça serait plus facile.

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Pattern Matching sur une InputStream?
    Par Phoxtrot dans le forum Général Java
    Réponses: 2
    Dernier message: 19/05/2008, 14h36
  2. Use of uninitialized value in pattern match (m//)
    Par Vladkergan dans le forum Langage
    Réponses: 4
    Dernier message: 13/01/2008, 19h25
  3. pattern matching (image processing)
    Par anatore dans le forum Traitement d'images
    Réponses: 8
    Dernier message: 15/10/2007, 16h01
  4. Use of uninitialized value in pattern match(m//)
    Par hayaet dans le forum Langage
    Réponses: 1
    Dernier message: 08/10/2007, 11h45
  5. [Regex] Pattern matching
    Par jeRame dans le forum Collection et Stream
    Réponses: 1
    Dernier message: 26/06/2007, 14h28

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo