IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Modules Perl Discussion :

Besoin d'aide avec Regexp::Assemble


Sujet :

Modules Perl

  1. #1
    Membre actif Avatar de mobscene
    Profil pro
    Inscrit en
    Avril 2005
    Messages
    331
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Avril 2005
    Messages : 331
    Points : 234
    Points
    234
    Par défaut Besoin d'aide avec Regexp::Assemble
    Bonjour je voudrais pouvroir formater des pages web contenue dans mon tableau @web j'ai fait des essaie avec html::formattext et autre module faisant a peut près le même boulot sa marche mais pas avec tout les encodage ce qui est un problème pour moi.

    J'ai fait quelque essaie avec de RegXp mais sa marche pas , je voudrais votre avis sur la question existe t'il un module ou une suite de regXp toute faite qui permet la formatage d'une page web.

    J'ai trouvé Regexp::Assemble mais mon anglais n'est vraiment pas au point (c'est pas drole).
    Everybody have in their the potential to be their own god : Marilyn Manson

  2. #2
    Membre actif
    Inscrit en
    Février 2005
    Messages
    167
    Détails du profil
    Informations forums :
    Inscription : Février 2005
    Messages : 167
    Points : 203
    Points
    203
    Par défaut
    Je voudrais bien te filer un coup de main avec Regexp::Assemble car son utilisation n'est pas très compliqué (enfin, je sais m'en servir), mais malheureusement je ne vois absolument pas comment tu pourrais utiliser des regexp pour formater une page.

    Ce quoi que tu essaies de faire au juste ?

    N

  3. #3
    Membre actif Avatar de mobscene
    Profil pro
    Inscrit en
    Avril 2005
    Messages
    331
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Avril 2005
    Messages : 331
    Points : 234
    Points
    234
    Par défaut
    J'essaier de formater des pages html pour en garder que le texte
    Everybody have in their the potential to be their own god : Marilyn Manson

  4. #4
    Membre actif
    Inscrit en
    Février 2005
    Messages
    167
    Détails du profil
    Informations forums :
    Inscription : Février 2005
    Messages : 167
    Points : 203
    Points
    203
    Par défaut
    Je ne pense pas que Regexp::Assemble soit appropié. Qu'est-ce qu'y ne marche pas avec HTML::FormatText ?

    Sinon, regardes du coté de HTML::Strip

    N

  5. #5
    Membre à l'essai
    Profil pro
    Inscrit en
    Juin 2005
    Messages
    39
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Juin 2005
    Messages : 39
    Points : 24
    Points
    24
    Par défaut
    ok merci;
    voilà de puis le temps que j'ai poser cette question, je n'arrete pas de progresser.
    mon problème maintenant est le suivant:
    apres avoir réussi à lire tout les fichier HTML ou HTM d'un répertoire; je voulez récupérer le texte qui est dans le fichier Html.
    jusqu'au la j'ai un bon résultat en utilisant ce code.

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
    37
    38
    39
    40
    41
    42
    43
    44
     
    #######################################
     
    # usage : perl htmltotext.pl <rep>
    use HTML::FormatText;
    use HTML::TreeBuilder;
    use Time::HiRes qw(gettimeofday);
    my $debut = gettimeofday; # date de debut de programme
    #le chemin vers le repertoire
    my $dir=$ARGV[0];
    #ouvrir le repertoire
    opendir(DIR, $dir) or die "je ne peux pas : $!";
    my @listeDeFichier= grep {/\.html?$/} (readdir DIR);
    #ordonner les fichiers
    my @listeOrdonnee = sort(@listeDeFichier);
    #fermer le fichier
    close(DIR);
    #affiche quelques statistiques
    print "+--------------------------------------------------+\n";
    print "Nom du repértoire : $dir\n";
    print "Nombre de fichiers : " . (scalar(@listeOrdonnee))."\n";
    print "Noms des fichiers : ---------\n";
    #Traitement sur la liste des fichier
    foreach my $fichier (@listeOrdonnee) {
    print "######################################\n";
    print $dir.'/'.$fichier."\n";
    my $taille = -s $dir."/".$fichier;
    print "$fichier \t $taille octets\n";
     
    $tree = HTML::TreeBuilder->new(); # create TreeBuilder
    $tree->parse_file($dir."/".$fichier); # parse file
     
    $formatter = HTML::FormatText->new(); # formatter object
    open (R, ">$dir"."/"."$fichier.txt") || die "erreur de création du fichier :$fichier.txt\n";
    my $texteTXT = ($formatter->format($tree));
    $texteTXT =~ s/<[^>]+>//g;
    $texteTXT =~ s/\[IMAGE\]//g;
    #$texteTXT =~ s/(\n\s*)+/\n/g;
    #$texteTXT =~ s/(--)+(-)?([.©\n]*)+//g;
    print R $texteTXT;
    close(R) || die "erreur de fermeture du fichier $fichier.txt\n";
    }
    my $tempsTotal = gettimeofday-$debut;
    print "temps d\'execution total: $tempsTotal\n";


    dans ce code en gros, j'ai fait apelle au module HTML::FormatText; et HTML::TreeBuilder;

    il me reste un seul souci : je ne peux pas récuperer le text écrit dans des tableaux. moi je soupçone le HTML::TreeBuilder; qui ne prends pas en compte les tableau.
    merci pour votre aide.

  6. #6
    Responsable Perl et Outils

    Avatar de djibril
    Homme Profil pro
    Inscrit en
    Avril 2004
    Messages
    19 820
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations forums :
    Inscription : Avril 2004
    Messages : 19 820
    Points : 499 184
    Points
    499 184
    Par défaut
    Mettez votre code entre balise code

Discussions similaires

  1. [RegExp] Besoin d'aide avec RegExp
    Par tazquebec dans le forum Général JavaScript
    Réponses: 3
    Dernier message: 18/06/2014, 08h33
  2. [ASA] J'ai besoin d'aide avec sybase et vb6 svp !!
    Par tibo830 dans le forum SQL Anywhere
    Réponses: 7
    Dernier message: 12/05/2006, 10h09
  3. Besoin d'aide avec regexp
    Par goblin dans le forum Langage
    Réponses: 3
    Dernier message: 04/12/2005, 04h27
  4. Réponses: 2
    Dernier message: 29/08/2003, 17h52
  5. Besoin d'aide avec postgresql sous windows NT
    Par Chihuahua dans le forum PostgreSQL
    Réponses: 3
    Dernier message: 18/07/2003, 08h29

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo