IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Index du forum

Recherche:

Type: Messages; Utilisateur: ellinguista

Recherche: Recherche effectuée en 0,02 secondes.

  1. Votes reçus
    +0 -0
    Réponses
    8
    Affichages
    3 011

    ou plus élaboré (j'explore): scrappy ...

    ou plus élaboré (j'explore):
    scrappy
    treebuilder
    text::scraper
    www::scraper

    Quelqu'un connaît ?
  2. Votes reçus
    +0 -0
    Réponses
    107
    Affichages
    131 754

    Sondage : Times il y a des sérifs, ce n'est pas...

    Times
    il y a des sérifs, ce n'est pas proportionnel, mais c'est beaucoup plus agréable

    NB: l'auteur du test sondage dû prévoir de quoi indiquer laquelle, dans la rubrique Autre
  3. Votes reçus
    +0 -0
    Réponses
    8
    Affichages
    3 011

    a) le nettoyer par...

    a) le nettoyer par http://www.w3.org/People/Raggett/tidy/
    mais c'est intrusif
    b) découper par regexp la zone de commentaires en supposant qu'elle, elle est propre (pusiqu'elle a une structure assez...
  4. Votes reçus
    +0 -0
    Réponses
    8
    Affichages
    3 011

    [QUOTE=djibril;5632675]En téléchargeant le...

    [QUOTE=djibril;5632675]En téléchargeant le contenu de cette page et en le reformattant via un éditeur de texte, on s'aperçoit qu'il n'est pas valide.

    Hm hm...

    Lemonde a l'air très mal xml-isé...
  5. Votes reçus
    +0 -0
    Réponses
    8
    Affichages
    3 011

    ## Voici un test sur une page de Le Figaro ...

    ## Voici un test sur une page de Le Figaro



    #!/usr/bin/perl -w
    use strict;

    use XML::Twig;
  6. Votes reçus
    +0 -0
    Réponses
    8
    Affichages
    3 011

    XML::Twig "parse error"

    J'applique Twig pour parser des sites de forums, et sur la plupart des sites j'ai énormément de "parse errors", pratiquement intraçables.
    Où est le problème?

    Leur code XMTML n'est pas conforme...
  7. Votes reçus
    +0 -0
    Réponses
    8
    Affichages
    33 599

    Important : Strictement du XML, ou ça tolère du XHTML variété...

    Strictement du XML, ou ça tolère du XHTML variété blog ?
  8. Votes reçus
    +0 -0
    Réponses
    2
    Affichages
    1 474

    use XML::Twig; ##... sub f_hard() { ...

    use XML::Twig;

    ##...


    sub f_hard() {
    my ($t, $elt) = @_;
    my $value = $elt->first_child->pcdata();
    my $tag= $elt->name();
    print "tag: $tag, value: $value\n";
Affichage des résultats 1 à 8 sur 8