Précédent   Forum des professionnels en informatique > PHP > Bibliothèques et frameworks > XML > DOM
DOM Forum d'entraide pour l'extension DOM permettant de manipuler des documents XML en PHP 5 (approche DOM). Avant de poster -> tutoriels DOM
Partagez cette discussion sur d'autres réseaux sociaux : Viadeo Twitter Google Facebook Digg Delicious MySpace Yahoo
Réponse Proposer ce sujet en actualité
 
Outils de la discussion
Publicité
'
Vieux 26/05/2006, 16h29   #1
Membre confirmé
 
Inscription : février 2006
Messages : 493
Détails du profil
Informations forums :
Inscription : février 2006
Messages : 493
Points : 206
Points : 206
Par défaut [DOM] Parser XML et wikipedia

Bonjour, j'ai récupéré un très gros fichier XML (de wikipedia).

D'un autre coté, j'ai un parser de fichier XML en PHP. Je ne connais pas du tout le XML ni son fonctionnement pour le moment... La question est la suivante :
Dans le xml, chaque mot cle est séparé par <doc>...</doc> avec divers renseignement à l'intérieur. Ma question est la suivante ...
Dois je parcourir tout le fichier XML pour trouver le resultat d'une recherche? Ou est ce que, avec le fichier qui parse, si je teste que "if($doc -> title =="hop"), il cherche directement ds la balises title et au bon endroit?

Je suppose que non ce serait trop simple... Je suppose que je dois faire un algo de parcours par ordre alphabétique? Je voudrais juste éviter de parcourir tout le fichier si je cherche une "auto" comme mot clé par exemple :s
trihanhcie est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 26/05/2006, 16h57   #2
Membre confirmé
 
Inscription : février 2006
Messages : 493
Détails du profil
Informations forums :
Inscription : février 2006
Messages : 493
Points : 206
Points : 206
Ou alors importer dans une base mysql le fichier xml? possible? :d
trihanhcie est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 26/05/2006, 19h07   #3
Rédacteur/Modérateur
 
Avatar de gorgonite
 
Homme Nicolas Vallée
Ingénieur Système
Inscription : décembre 2005
Messages : 9 774
Détails du profil
Informations personnelles :
Nom : Homme Nicolas Vallée
Âge : 27
Localisation : France

Informations professionnelles :
Activité : Ingénieur Système
Secteur : Transports

Informations forums :
Inscription : décembre 2005
Messages : 9 774
Points : 14 303
Points : 14 303
ça dépend pas mal du parser... lequel utilises-tu ?
__________________
Evitez les MP pour les questions techniques... il y a des forums
Contributions sur DVP : Mes Tutos | Mon Blog
gorgonite est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 29/05/2006, 09h51   #4
Membre confirmé
 
Inscription : février 2006
Messages : 493
Détails du profil
Informations forums :
Inscription : février 2006
Messages : 493
Points : 206
Points : 206
Bah en fait, sur le site de wikipedia, ils proposent une manière de le faire avec un script perl mais ca fonctionne pas...

sur http://download.wikimedia.org/frwiki/20060527/

on peut trouver les différents fichiers.

Celui qui correspondrait le plus a mes attentes est abstract.xml mais il faudrait que je mette ca ds la base sql... ce serait ennuyeux de parser un si gros fichier a chaque fois

J'ai essayé d utiliser le parser perl mais ca a pas tres bien marcher...
Je tente autre chose Je connais rien en perl (

Je vais tenter autre chose
trihanhcie est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 29/05/2006, 09h58   #5
Membre expérimenté
 
Avatar de hansaplast
 
Inscription : septembre 2005
Messages : 925
Détails du profil
Informations personnelles :
Âge : 30
Localisation : France, Isère (Rhône Alpes)

Informations forums :
Inscription : septembre 2005
Messages : 925
Points : 562
Points : 562
en gros, (dsl si je me trompe) tu a 3 grande ecoloes de parser :

les DOM : tres pratiques, mais peu puissant si ton doc est tres gros (mais TRES preatique)

les requetes X-PATH : on pourrait associer ca a des requetes SQL (j'ai jamais utilisé)

le reste : qui es tplus lourd a gerer, generalement (le premier que j'ai utilisé générait 2 tableau recursif l'un pour l'autre, permettant de parser les balises et leurs attributs)


en gros, meme si DOM est reputé peut performant, je te le conseil, a fdefaut de connaitre X-path
__________________
Vous un sur Grenoble? on est fait pour tout du moins si vous mon CV
hansaplast est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 29/05/2006, 10h06   #6
Expert Confirmé Sénior
 
Avatar de Mr N.
 
Inscription : septembre 2004
Messages : 5 421
Détails du profil
Informations forums :
Inscription : septembre 2004
Messages : 5 421
Points : 5 835
Points : 5 835
Hansaplast, en effet, DOM charge le document xml en entier en mémoire sous forme d'objet.
Tu as oublié SAX qui travaille sur des "handlers" appelés à chaque noeuds de l'arbre xml
Mr N. est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 29/05/2006, 10h35   #7
Membre expérimenté
 
Avatar de hansaplast
 
Inscription : septembre 2005
Messages : 925
Détails du profil
Informations personnelles :
Âge : 30
Localisation : France, Isère (Rhône Alpes)

Informations forums :
Inscription : septembre 2005
Messages : 925
Points : 562
Points : 562
Citation:
Envoyé par Mr N.
Hansaplast, en effet, DOM charge le document xml en entier en mémoire sous forme d'objet.
Tu as oublié SAX qui travaille sur des "handlers" appelés à chaque noeuds de l'arbre xml
vi, dsl, je venait corriger cet oubli.
donc, y'a SAX ausssi, plus performant que DOM, mais moins "convivial"...
__________________
Vous un sur Grenoble? on est fait pour tout du moins si vous mon CV
hansaplast est déconnecté   Envoyer un message privé Réponse avec citation 00
Réponse Proposer ce sujet en actualité
Outils de la discussion



Fuseau horaire GMT +2. Il est actuellement 12h29.


 
 
 
 
Partenaires

Hébergement Web