IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

XML Discussion :

Parsing de fichier XML en C


Sujet :

XML

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Rédacteur
    Avatar de longbeach
    Profil pro
    Architecte de système d’information
    Inscrit en
    Avril 2003
    Messages
    943
    Détails du profil
    Informations personnelles :
    Âge : 50
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Architecte de système d’information

    Informations forums :
    Inscription : Avril 2003
    Messages : 943
    Par défaut Parsing de fichier XML en C
    Bonjour,
    En C,
    Je dois parser un fichier XML afin de supprimer certains caracteres indesirables ( des caracteres ASCII
    et des signes > et < ).
    Existe-t-il un parser qui permet de faire ça rapidement ? Sachant que la taille du fichier XML
    peut varier de 5 MB à 300 MB.
    Quelqu'un a t'il deja implemente une telle solution ?

    Ou sinon quelqu'un a t'il deja ecrit un tel programme, sans faire appel à un parser ?

    Merci pour vos pistes et suggestions.

  2. #2
    Membre éclairé Avatar de ronan99999
    Inscrit en
    Juillet 2003
    Messages
    279
    Détails du profil
    Informations personnelles :
    Âge : 46

    Informations forums :
    Inscription : Juillet 2003
    Messages : 279
    Par défaut
    Tu as un trés bon parseur disponible ici:
    http://xmlsoft.org/

  3. #3
    Rédacteur
    Avatar de longbeach
    Profil pro
    Architecte de système d’information
    Inscrit en
    Avril 2003
    Messages
    943
    Détails du profil
    Informations personnelles :
    Âge : 50
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Architecte de système d’information

    Informations forums :
    Inscription : Avril 2003
    Messages : 943
    Par défaut
    Merci
    tu as un exemple simple d'utilisation sur un fichier XML, pour l'appliquer à mon cas ?
    Sinon je suis preneur d'autres parseurs ou solutions (mais en C).

  4. #4
    Membre Expert
    Avatar de Gruik
    Profil pro
    Développeur Web
    Inscrit en
    Juillet 2003
    Messages
    1 566
    Détails du profil
    Informations personnelles :
    Âge : 42
    Localisation : France

    Informations professionnelles :
    Activité : Développeur Web

    Informations forums :
    Inscription : Juillet 2003
    Messages : 1 566
    Par défaut
    Salut

    Si tes fichiers contiennent des < > dans les données, alors ce ne sont pas des fichiers xml => ce n'est pas un parser xml qu'il te faut

  5. #5
    Membre éclairé Avatar de ronan99999
    Inscrit en
    Juillet 2003
    Messages
    279
    Détails du profil
    Informations personnelles :
    Âge : 46

    Informations forums :
    Inscription : Juillet 2003
    Messages : 279
    Par défaut
    Exact, il ne passeront pas dans un parser xml->document mal formé

    Tu peux donner un exemple d'un de tes exemples de document à corriger.

    Les erreurs se situe dans les noms de sections attributs....?
    Tu peux peut-etre te'n tirer avec des expressions réguliéres (malheureusement ce ne sera pas forcément trés rapide) ?

  6. #6
    Rédacteur
    Avatar de longbeach
    Profil pro
    Architecte de système d’information
    Inscrit en
    Avril 2003
    Messages
    943
    Détails du profil
    Informations personnelles :
    Âge : 50
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Architecte de système d’information

    Informations forums :
    Inscription : Avril 2003
    Messages : 943
    Par défaut
    pourquoi ce n'est pas un fichier XML ?
    Je pense que ça reste un fichier XML, mais mal formé.
    L'utilisation de parser n'est vraiment pas possible du coup ?

    Je n'ai pas de fichier exemple mais je pense par exemple que ça pourrait être ça:

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
     
     
    <?xml version="1.0" encoding="ISO-8859-1"?>     
    <titi>
    <toto> bla > blabla </toto>   // caractere > à remplacer par un blanc
    </titi>
    Et dans un 2eme temps j'aurai un autre type de caractères à supprimer, des carrés:
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
     
     
    <?xml version="1.0" encoding="ISO-8859-1"?>     
    <titi>
    <toto> bla *signesCarrés*  blabla </toto>   // les caracteres carrés à remplacer par un blanc
    </titi>
    Merci

  7. #7
    Membre Expert
    Avatar de Gruik
    Profil pro
    Développeur Web
    Inscrit en
    Juillet 2003
    Messages
    1 566
    Détails du profil
    Informations personnelles :
    Âge : 42
    Localisation : France

    Informations professionnelles :
    Activité : Développeur Web

    Informations forums :
    Inscription : Juillet 2003
    Messages : 1 566
    Par défaut
    Ca depend où sont placés les < >
    Qu'est ce que tu veux que le parser fasse lorsqu'il rencontre ceci
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    <abc> texte texte <def texte texte texte</abc>
    ?

    Il risque de croire que "def" est un element et "texte" sont des attributs.
    C'est ce qu'il se pase chez firefox, dans une page html de ce style : tout ce qu'il ya entre <def et avant </abc> est jarté

    C'est défini nulle part ces comportements, tout simplement parce que c'est plus du xml.

    Pour les signes carrés, je pense pas que ça pose probleme, tant que c'est valide pour le charset donné.

Discussions similaires

  1. Parsing de fichier XML
    Par winflow dans le forum C#
    Réponses: 5
    Dernier message: 06/02/2014, 08h19
  2. [JDOM] Problème avec le parsing du fichier XML
    Par nounouuuuu201186 dans le forum Format d'échange (XML, JSON...)
    Réponses: 2
    Dernier message: 10/02/2012, 14h08
  3. Parsing de fichiers XML : Exception bien bizarre
    Par Grumpy64 dans le forum Android
    Réponses: 11
    Dernier message: 06/11/2010, 14h32
  4. Réponses: 3
    Dernier message: 14/11/2009, 09h26
  5. [SAX] Resultat d'un parsing de fichier XML
    Par t.n.b.g dans le forum Format d'échange (XML, JSON...)
    Réponses: 6
    Dernier message: 07/03/2008, 16h12

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo