IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Programmation et administration système Perl Discussion :

regex xml paragraphes dupliqués


Sujet :

Programmation et administration système Perl

  1. #1
    Membre du Club
    Homme Profil pro
    Étudiant
    Inscrit en
    Octobre 2012
    Messages
    51
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Étudiant
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Octobre 2012
    Messages : 51
    Points : 51
    Points
    51
    Par défaut regex xml paragraphes dupliqués
    Bonjour,
    j'ai des fichiers xml qui ont été "dupliqué" c'est à dire que pour un fichier:

    j'ai désormais
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    <a> 
       <b/>
       <c/>
    </a>
    <a> 
       <b/>
       <c/>
    </a>
    Je voudrais donc une regex qui permettrai de ne garder qu'une seule occurrence de la partie dupliquée.
    j'ai tenté ça, mais en vain:
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    s/(<a>.*?<\/a>)\\n<a>.*?<\/a>/$1/

  2. #2
    Rédacteur/Modérateur

    Avatar de Lolo78
    Homme Profil pro
    Conseil - Consultant en systèmes d'information
    Inscrit en
    Mai 2012
    Messages
    3 612
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Yvelines (Île de France)

    Informations professionnelles :
    Activité : Conseil - Consultant en systèmes d'information
    Secteur : High Tech - Opérateur de télécommunications

    Informations forums :
    Inscription : Mai 2012
    Messages : 3 612
    Points : 12 469
    Points
    12 469
    Billets dans le blog
    1
    Par défaut
    Ton xml semble mal formé.

    Je doute que tu puisses utiliser des expressions régulières en mode multiligne sur un cas qui peut manifestement devenir très complexe (sauf si l'erreur à corriger est très spécifique).

    Je pense que tu vas probablement devoir utiliser un vrai parseur de XML.

  3. #3
    Membre du Club
    Homme Profil pro
    Étudiant
    Inscrit en
    Octobre 2012
    Messages
    51
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Étudiant
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Octobre 2012
    Messages : 51
    Points : 51
    Points
    51
    Par défaut
    le cas est justement très spécifique, je ne veux garder qu'un seul élément <a> lorsqu'il y en a deux.

  4. #4
    Expert confirmé

    Homme Profil pro
    Ingénieur développement logiciels
    Inscrit en
    Avril 2009
    Messages
    3 577
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 58
    Localisation : France, Bas Rhin (Alsace)

    Informations professionnelles :
    Activité : Ingénieur développement logiciels
    Secteur : Aéronautique - Marine - Espace - Armement

    Informations forums :
    Inscription : Avril 2009
    Messages : 3 577
    Points : 5 753
    Points
    5 753
    Par défaut
    N'y aurait-il pas quelque chose d'incompatible entre ces deux phrases :
    Citation Envoyé par Lolo78 Voir le message
    Ton xml semble mal formé.
    Citation Envoyé par Lolo78 Voir le message
    Je pense que tu vas probablement devoir utiliser un vrai parseur de XML.
    Pour l'expression régulière, essaye ceci :

    s/(<a>.*?<\/a>)[\s\n]*\1/$1/
    Plus j'apprends, et plus je mesure mon ignorance (philou67430)
    Toute technologie suffisamment avancée est indiscernable d'un script Perl (Llama book)
    Partagez vos problèmes pour que l'on partage ensemble nos solutions : je ne réponds pas aux questions techniques par message privé
    Si c'est utile, say

  5. #5
    Rédacteur/Modérateur

    Avatar de Lolo78
    Homme Profil pro
    Conseil - Consultant en systèmes d'information
    Inscrit en
    Mai 2012
    Messages
    3 612
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Yvelines (Île de France)

    Informations professionnelles :
    Activité : Conseil - Consultant en systèmes d'information
    Secteur : High Tech - Opérateur de télécommunications

    Informations forums :
    Inscription : Mai 2012
    Messages : 3 612
    Points : 12 469
    Points
    12 469
    Billets dans le blog
    1
    Par défaut
    Citation Envoyé par Philou67430 Voir le message
    N'y aurait-il pas quelque chose d'incompatible entre ces deux phrases :


    Si, bien sûr, mais je voulais surtout dire que l'exemple n'était pas vraiment convaincant et que, d'un autre côté, pour traiter ce genre de problème, un vrai parser paraissait nécessaire. Mais s'il s'agit de corriger juste une erreur d'un type très spécifique (duplication d'un type d'enregistrement), alors pas vraiment besoin d'un parser.

  6. #6
    Expert confirmé

    Homme Profil pro
    Ingénieur développement logiciels
    Inscrit en
    Avril 2009
    Messages
    3 577
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 58
    Localisation : France, Bas Rhin (Alsace)

    Informations professionnelles :
    Activité : Ingénieur développement logiciels
    Secteur : Aéronautique - Marine - Espace - Armement

    Informations forums :
    Inscription : Avril 2009
    Messages : 3 577
    Points : 5 753
    Points
    5 753
    Par défaut
    En fait, je me pose vraiment la question : quel comportement adopte un parser face à un code mal-formé ? Est-il possible de faire certains traitements malgré tout, et dans quelle limite ?
    Plus j'apprends, et plus je mesure mon ignorance (philou67430)
    Toute technologie suffisamment avancée est indiscernable d'un script Perl (Llama book)
    Partagez vos problèmes pour que l'on partage ensemble nos solutions : je ne réponds pas aux questions techniques par message privé
    Si c'est utile, say

Discussions similaires

  1. [RegEx] Regex pour extraire des noeuds XML
    Par lagotonio dans le forum Langage
    Réponses: 6
    Dernier message: 18/04/2008, 14h52
  2. Réponses: 2
    Dernier message: 10/04/2007, 11h46
  3. [XML] Recuperer elements d'un paragraphe
    Par kapfab dans le forum XML/XSL et SOAP
    Réponses: 2
    Dernier message: 14/03/2007, 14h26
  4. regex dans fichier XML
    Par pouss dans le forum Format d'échange (XML, JSON...)
    Réponses: 3
    Dernier message: 10/10/2006, 09h35
  5. [débutant][Regex] changer "cage01.xml" en "cage N° 1
    Par pingoui dans le forum Format d'échange (XML, JSON...)
    Réponses: 2
    Dernier message: 14/09/2004, 13h05

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo