IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Linux Discussion :

awk- supprimer des balises d'un fichier XML


Sujet :

Linux

  1. #1
    Nouveau membre du Club
    Inscrit en
    Septembre 2006
    Messages
    40
    Détails du profil
    Informations forums :
    Inscription : Septembre 2006
    Messages : 40
    Points : 26
    Points
    26
    Par défaut awk- supprimer des balises d'un fichier XML
    Bonjour,
    j'ai un fichier xml dont je voudrais retirerr les 4 balises de debut (et celle de fin biensur!, logique )

    voila mon code:

    awk '{
    lengthOfFile=length($0)
    xmlPosition=index($0,"\<XML")
    xmlEndPosition=index($0,"\<\/read")
    if (xmlEndPosition==0){
    xmlNewEndPosition=lengthOfFile-xmlPosition
    }else{
    xmlNewEndPosition=xmlEndPosition
    }
    xmlFile=substr($0,xmlPosition,xmlNewEndPosition)
    print xmlFile

    }' test.xml > test2.xml

    ce qui se passe en fait c'est que le fichier xml (je pense) est trop gros, du coup, la fonction retire les quelques balises du debut (toutes celles avant <XML> mais de retirent pas celle de la fin, donc toutes celles apres </read>
    je travaille sur mac... et donc je n'ai pas acces a "nawk"...

    merci pour votre aide

    joey

  2. #2
    Expert éminent sénior
    Avatar de Sve@r
    Homme Profil pro
    Ingénieur développement logiciels
    Inscrit en
    Février 2006
    Messages
    12 690
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Oise (Picardie)

    Informations professionnelles :
    Activité : Ingénieur développement logiciels
    Secteur : Aéronautique - Marine - Espace - Armement

    Informations forums :
    Inscription : Février 2006
    Messages : 12 690
    Points : 30 986
    Points
    30 986
    Billets dans le blog
    1
    Par défaut
    Citation Envoyé par joeyd Voir le message
    Bonjour,
    j'ai un fichier xml dont je voudrais retirerr les 4 balises de debut (et celle de fin biensur!, logique )

    voila mon code:

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    awk '{
             lengthOfFile=length($0)
             xmlPosition=index($0,"\<XML")
             xmlEndPosition=index($0,"\<\/read")
             if (xmlEndPosition==0){
                   xmlNewEndPosition=lengthOfFile-xmlPosition
             }else{
                   xmlNewEndPosition=xmlEndPosition
             }
             xmlFile=substr($0,xmlPosition,xmlNewEndPosition)
            print xmlFile
     
    }' test.xml > test2.xml
    ce qui se passe en fait c'est que le fichier xml (je pense) est trop gros, du coup, la fonction retire les quelques balises du debut (toutes celles avant <XML> mais de retirent pas celle de la fin, donc toutes celles apres </read>
    En lisant ton code awk, il me semble que tu considères tout ton fichier comme une énorme et unique ligne. J'espère que ce n'est pas la réalité car je ne sais pas comment awk réagit si c'est le cas. Il n'a pas été conçu pour traiter des lignes "énormes" mais des lignes telles qu'on trouve dans des fichiers normaux (80, 100, 200, voire 1000 carac. max par ligne) et a donc une limite (que je ne connais pas mais qui se comprend). Son but est d'appliquer l'algo écrit entre le '{...}' pour chaque ligne du fichier, pas pour le fichier pris "en totalité"...

    Enfin tu peux vérifier si c'est ça en essayant de traiter un fichier XML moins gros...

    Citation Envoyé par joeyd Voir le message
    je travaille sur mac... et donc je n'ai pas acces a "nawk"...
    http://gawk.darwinports.com
    Mon Tutoriel sur la programmation «Python»
    Mon Tutoriel sur la programmation «Shell»
    Sinon il y en a pleins d'autres. N'oubliez pas non plus les différentes faq disponibles sur ce site
    Et on poste ses codes entre balises [code] et [/code]

Discussions similaires

  1. [WD18] Supprimer des lignes dans un fichier xml
    Par cid5420 dans le forum WinDev
    Réponses: 26
    Dernier message: 10/04/2014, 10h04
  2. Supprimer des balises d'un fichier XML via XSLT
    Par LaBastoss dans le forum XSL/XSLT/XPATH
    Réponses: 8
    Dernier message: 17/12/2012, 20h44
  3. Format des balise dans un fichier XML
    Par Caillou63 dans le forum C#
    Réponses: 2
    Dernier message: 03/05/2010, 11h10
  4. Réponses: 9
    Dernier message: 18/05/2009, 08h25
  5. servlet qui supprime des balises xml
    Par samia13 dans le forum Servlets/JSP
    Réponses: 1
    Dernier message: 17/05/2007, 11h41

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo