IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Bibliothèques et frameworks PHP Discussion :

[DOM] Parser XML et wikipedia


Sujet :

Bibliothèques et frameworks PHP

  1. #1
    Membre éclairé
    Inscrit en
    Février 2006
    Messages
    522
    Détails du profil
    Informations forums :
    Inscription : Février 2006
    Messages : 522
    Par défaut [DOM] Parser XML et wikipedia
    Bonjour, j'ai récupéré un très gros fichier XML (de wikipedia).

    D'un autre coté, j'ai un parser de fichier XML en PHP. Je ne connais pas du tout le XML ni son fonctionnement pour le moment... La question est la suivante :
    Dans le xml, chaque mot cle est séparé par <doc>...</doc> avec divers renseignement à l'intérieur. Ma question est la suivante ...
    Dois je parcourir tout le fichier XML pour trouver le resultat d'une recherche? Ou est ce que, avec le fichier qui parse, si je teste que "if($doc -> title =="hop"), il cherche directement ds la balises title et au bon endroit?

    Je suppose que non ce serait trop simple... Je suppose que je dois faire un algo de parcours par ordre alphabétique? Je voudrais juste éviter de parcourir tout le fichier si je cherche une "auto" comme mot clé par exemple :s

  2. #2
    Membre éclairé
    Inscrit en
    Février 2006
    Messages
    522
    Détails du profil
    Informations forums :
    Inscription : Février 2006
    Messages : 522
    Par défaut
    Ou alors importer dans une base mysql le fichier xml? possible? :d

  3. #3
    Rédacteur/Modérateur

    Avatar de gorgonite
    Homme Profil pro
    Ingénieur d'études
    Inscrit en
    Décembre 2005
    Messages
    10 322
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 40
    Localisation : France

    Informations professionnelles :
    Activité : Ingénieur d'études
    Secteur : Transports

    Informations forums :
    Inscription : Décembre 2005
    Messages : 10 322
    Par défaut
    ça dépend pas mal du parser... lequel utilises-tu ?
    Evitez les MP pour les questions techniques... il y a des forums
    Contributions sur DVP : Mes Tutos | Mon Blog

  4. #4
    Membre éclairé
    Inscrit en
    Février 2006
    Messages
    522
    Détails du profil
    Informations forums :
    Inscription : Février 2006
    Messages : 522
    Par défaut
    Bah en fait, sur le site de wikipedia, ils proposent une manière de le faire avec un script perl mais ca fonctionne pas...

    sur http://download.wikimedia.org/frwiki/20060527/

    on peut trouver les différents fichiers.

    Celui qui correspondrait le plus a mes attentes est abstract.xml mais il faudrait que je mette ca ds la base sql... ce serait ennuyeux de parser un si gros fichier a chaque fois

    J'ai essayé d utiliser le parser perl mais ca a pas tres bien marcher...
    Je tente autre chose Je connais rien en perl (

    Je vais tenter autre chose

  5. #5
    Membre éprouvé Avatar de hansaplast
    Homme Profil pro
    Artisant logiciel
    Inscrit en
    Septembre 2005
    Messages
    950
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 43
    Localisation : France, Isère (Rhône Alpes)

    Informations professionnelles :
    Activité : Artisant logiciel
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Septembre 2005
    Messages : 950
    Par défaut
    en gros, (dsl si je me trompe) tu a 3 grande ecoloes de parser :

    les DOM : tres pratiques, mais peu puissant si ton doc est tres gros (mais TRES preatique)

    les requetes X-PATH : on pourrait associer ca a des requetes SQL (j'ai jamais utilisé)

    le reste : qui es tplus lourd a gerer, generalement (le premier que j'ai utilisé générait 2 tableau recursif l'un pour l'autre, permettant de parser les balises et leurs attributs)


    en gros, meme si DOM est reputé peut performant, je te le conseil, a fdefaut de connaitre X-path

  6. #6
    Expert confirmé Avatar de Mr N.
    Profil pro
    Inscrit en
    Septembre 2004
    Messages
    5 418
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Septembre 2004
    Messages : 5 418
    Par défaut
    Hansaplast, en effet, DOM charge le document xml en entier en mémoire sous forme d'objet.
    Tu as oublié SAX qui travaille sur des "handlers" appelés à chaque noeuds de l'arbre xml

  7. #7
    Membre éprouvé Avatar de hansaplast
    Homme Profil pro
    Artisant logiciel
    Inscrit en
    Septembre 2005
    Messages
    950
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 43
    Localisation : France, Isère (Rhône Alpes)

    Informations professionnelles :
    Activité : Artisant logiciel
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Septembre 2005
    Messages : 950
    Par défaut
    Citation Envoyé par Mr N.
    Hansaplast, en effet, DOM charge le document xml en entier en mémoire sous forme d'objet.
    Tu as oublié SAX qui travaille sur des "handlers" appelés à chaque noeuds de l'arbre xml
    vi, dsl, je venait corriger cet oubli.
    donc, y'a SAX ausssi, plus performant que DOM, mais moins "convivial"...

Discussions similaires

  1. Votre avis: pour parser XML, la librarie SAX, Dom, JDom ou d'autre librairie
    Par jean1979 dans le forum Format d'échange (XML, JSON...)
    Réponses: 3
    Dernier message: 21/10/2011, 09h36
  2. [DOM] Parser du XML
    Par gussoner dans le forum Général JavaScript
    Réponses: 5
    Dernier message: 10/12/2008, 15h35
  3. parser xml dom?
    Par motivée dans le forum Ubuntu
    Réponses: 3
    Dernier message: 12/11/2008, 17h12
  4. [DOM] Parser XML avec DOM
    Par webrider dans le forum Général JavaScript
    Réponses: 3
    Dernier message: 31/01/2008, 12h45
  5. [JAXB/DOM] Parser Xml : possible avec path reel et non uri !
    Par Jaxofun dans le forum Servlets/JSP
    Réponses: 7
    Dernier message: 01/08/2005, 10h04

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo