IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Développement de jobs Discussion :

Split d'un fichier XML


Sujet :

Développement de jobs

  1. #1
    Membre du Club
    Homme Profil pro
    Étudiant
    Inscrit en
    Novembre 2016
    Messages
    94
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 30
    Localisation : France, Seine Saint Denis (Île de France)

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Novembre 2016
    Messages : 94
    Points : 50
    Points
    50
    Par défaut Split d'un fichier XML
    Bonjour à tous;

    Alors voilà je suis complètement bloqué, je souhaite (je dois surtout) splitté un fichier XML car il n'est pas au bon format.

    Je m'explique j'ai un fichier XML de cette forme :

    <?xml version="1.0" encoding="UTF-8"?>
    <Document xmlns="urn:iso:std:iso:20022:techsd:acmt.02z.001.01:Report" xmlnssi="http://www.w3.org/2001/XMLSchema-instance">
    </Document>
    <?xml version="1.0" encoding="UTF-8"?>
    <Document xmlns="urn:iso:std:iso:20022:techsd:acmt.02z.001.01:Report" xmlnssi="http://www.w3.org/2001/XMLSchema-instance">
    </Document>

    Comme vous l'avez remarqué ce n'est pas du tout le bon format. je souhaiterais donc faire en sorte d'avoir ce fichier en entrée et en sortie avoir deux fichiers, qui contiennent chacun :

    <?xml version="1.0" encoding="UTF-8"?>
    <Document xmlns="urn:iso:std:iso:20022:techsd:acmt.02z.001.01:Report" xmlnssi="http://www.w3.org/2001/XMLSchema-instance">
    </Document>


    Donc en sorti je dois avoir :
    • Fichier 1 : <?xml version="1.0" encoding="UTF-8"?> <Document xmlns="urn:iso:std:iso:20022:techsd:acmt.02z.001.01:Report" xmlnssi="http://www.w3.org/2001/XMLSchema-instance"> </Document>


    • Fichier 2 : <?xml version="1.0" encoding="UTF-8"?> <Document xmlns="urn:iso:std:iso:20022:techsd:acmt.02z.001.01:Report" xmlnssi="http://www.w3.org/2001/XMLSchema-instance"> </Document>



    Je vous remercie par avance pour votre aide .

  2. #2
    Membre expérimenté Avatar de supergeoffrey
    Homme Profil pro
    Ingénieur développement logiciels
    Inscrit en
    Octobre 2010
    Messages
    802
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 37
    Localisation : France, Nord (Nord Pas de Calais)

    Informations professionnelles :
    Activité : Ingénieur développement logiciels
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Octobre 2010
    Messages : 802
    Points : 1 698
    Points
    1 698
    Par défaut
    tFileSplitInputFullRow -row1-> tFlowToIterate -iterate-> tFixedFlowInput -row2-> tFileOutputDelimited

    tFileSplitInputFullRow avec séparateur <?xml version="1.0" encoding="UTF-8"?>

    tFixedFlowInput avec deux entrée (schama une collone de type String)
    1. "<?xml version=\"1.0\" encoding=\"UTF-8\"?>"
    2. row1.line



    C'est bourrin j'avoue

  3. #3
    Membre du Club
    Homme Profil pro
    Étudiant
    Inscrit en
    Novembre 2016
    Messages
    94
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 30
    Localisation : France, Seine Saint Denis (Île de France)

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Novembre 2016
    Messages : 94
    Points : 50
    Points
    50
    Par défaut
    Citation Envoyé par supergeoffrey Voir le message
    tFileSplitInputFullRow -row1-> tFlowToIterate -iterate-> tFixedFlowInput -row2-> tFileOutputDelimited

    tFileSplitInputFullRow avec séparateur <?xml version="1.0" encoding="UTF-8"?>

    tFixedFlowInput avec deux entrée (schama une collone de type String)
    1. "<?xml version=\"1.0\" encoding=\"UTF-8\"?>"
    2. row1.line



    C'est bourrin j'avoue

    Je te remercie de ta réponse, mais je ne trouve pas le composant tFileSplitInputFullRow

  4. #4
    Membre expérimenté Avatar de supergeoffrey
    Homme Profil pro
    Ingénieur développement logiciels
    Inscrit en
    Octobre 2010
    Messages
    802
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 37
    Localisation : France, Nord (Nord Pas de Calais)

    Informations professionnelles :
    Activité : Ingénieur développement logiciels
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Octobre 2010
    Messages : 802
    Points : 1 698
    Points
    1 698
    Par défaut
    Citation Envoyé par nadjimsad Voir le message
    Je te remercie de ta réponse, mais je ne trouve pas le composant tFileSplitInputFullRow
    tFileInputFullRow sorry

  5. #5
    Membre du Club
    Homme Profil pro
    Étudiant
    Inscrit en
    Novembre 2016
    Messages
    94
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 30
    Localisation : France, Seine Saint Denis (Île de France)

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Novembre 2016
    Messages : 94
    Points : 50
    Points
    50
    Par défaut
    Citation Envoyé par supergeoffrey Voir le message
    tFileInputFullRow sorry
    Pas de soucis j'ai trouver le composant.
    Mais je ne comprend pas la partie pour le tFixedFlowInput. Peux-tu s'il te plait m'expliquer plus en détail ?

  6. #6
    Membre averti

    Homme Profil pro
    Consultant en Business Intelligence
    Inscrit en
    Juillet 2011
    Messages
    160
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Seine Saint Denis (Île de France)

    Informations professionnelles :
    Activité : Consultant en Business Intelligence
    Secteur : Service public

    Informations forums :
    Inscription : Juillet 2011
    Messages : 160
    Points : 443
    Points
    443
    Billets dans le blog
    2
    Par défaut
    Salut nadjimsad,

    En complément de supergeoffrey, tu peux créer 2 jobs pour te faire ce traitement, 1 job père qui lit ton fichier xml Document par Document et le donne au job fils qui l'écris dans tes fichiers de sortie.

    Exemple :

    Job père:

    Nom : f-pere-1.png
Affichages : 721
Taille : 18,4 Ko

    Vu que ton fichier source est un Document XML, mais qui n'est pas valide, tu peux faire un petit pré-traitement qui te supprime d'abord toutes les lignes <?xml version="1.0" encoding="UTF-8"?>, ensuite tu ajoutes l'ensemble du contenu de ton fichier dans une balise racine => root.

    Ainsi, tu utilises un tFileInputXml, voici son config :

    Nom : f-config-tXMLinput2.png
Affichages : 724
Taille : 40,1 Ko

    Config tRunJob :

    Nom : f-config-tRun-%22.png
Affichages : 693
Taille : 47,4 Ko

    Enfin, le job fils qui est tous simple :

    Nom : f-fils4.png
Affichages : 696
Taille : 26,8 Ko

    Config tFixedInput :

    Nom : f-Fiex5.png
Affichages : 706
Taille : 17,3 Ko

    tJava_1 :

    row1.Document = context.documentElement;

    le premier tFileInputDelimited crée ton fichier de sortie avec la ligne <?xml version="1.0" encoding="UTF-8"?> et le second l'incremente avec le noeud Document courant.

    Résultats :

    out1.xml
    out2.xml
    Fichiers attachés Fichiers attachés

  7. #7
    Membre du Club
    Homme Profil pro
    Étudiant
    Inscrit en
    Novembre 2016
    Messages
    94
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 30
    Localisation : France, Seine Saint Denis (Île de France)

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Novembre 2016
    Messages : 94
    Points : 50
    Points
    50
    Par défaut
    Citation Envoyé par abdouone0184 Voir le message
    Salut nadjimsad,

    En complément de supergeoffrey, tu peux créer 2 jobs pour te faire ce traitement, 1 job père qui lit ton fichier xml Document par Document et le donne au job fils qui l'écris dans tes fichiers de sortie.

    Exemple :

    Job père:

    Nom : f-pere-1.png
Affichages : 721
Taille : 18,4 Ko

    Vu que ton fichier source est un Document XML, mais qui n'est pas valide, tu peux faire un petit pré-traitement qui te supprime d'abord toutes les lignes <?xml version="1.0" encoding="UTF-8"?>, ensuite tu ajoutes l'ensemble du contenu de ton fichier dans une balise racine => root.

    Ainsi, tu utilises un tFileInputXml, voici son config :

    Nom : f-config-tXMLinput2.png
Affichages : 724
Taille : 40,1 Ko

    Config tRunJob :

    Nom : f-config-tRun-%22.png
Affichages : 693
Taille : 47,4 Ko

    Enfin, le job fils qui est tous simple :

    Nom : f-fils4.png
Affichages : 696
Taille : 26,8 Ko

    Config tFixedInput :

    Nom : f-Fiex5.png
Affichages : 706
Taille : 17,3 Ko

    tJava_1 :

    row1.Document = context.documentElement;

    le premier tFileInputDelimited crée ton fichier de sortie avec la ligne <?xml version="1.0" encoding="UTF-8"?> et le second l'incremente avec le noeud Document courant.

    Résultats :

    out1.xml
    out2.xml

    Je vous remercie infiniment pour votre aide je vais essayer votre solution dès ce soir et je vous fais un retour . (la méthode supergeoffrey fonctionne parfaitement )

  8. #8
    Membre expérimenté Avatar de supergeoffrey
    Homme Profil pro
    Ingénieur développement logiciels
    Inscrit en
    Octobre 2010
    Messages
    802
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 37
    Localisation : France, Nord (Nord Pas de Calais)

    Informations professionnelles :
    Activité : Ingénieur développement logiciels
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Octobre 2010
    Messages : 802
    Points : 1 698
    Points
    1 698
    Par défaut
    Citation Envoyé par nadjimsad Voir le message
    Pas de soucis j'ai trouver le composant.
    Mais je ne comprend pas la partie pour le tFixedFlowInput. Peux-tu s'il te plait m'expliquer plus en détail ?
    En fait tu recrées un input avec deux entrée pour pouvoir les sortir dans tFileOutputDelimeted :
    Le première qui est le header XML que tu as perdu puisque c'est ton séparateur de ligne dans le tFileInputFullRow.
    La seconde est ta ligne extraite dans le tFileInputFullRow.


    En fait tu es obligé d'ajouter le tFlowToIterate et le tFixedFlowInput car tu n'écris pas dans le même fichier.

    Si tu te contentes de tFileSplitInputFullRow -row1-> -row2-> tFileOutputDelimited ça ne fonctionnera jamais, c'est lié à la génération du code Talend mais je ne rentre pas dans les détails.


    Au fait j'ai juste répondu à ton besoin de découper le fichier en plusieurs fichier XML.
    Après si tu veux exploiter directement le xml sans l'écrire tu peux faire un truc dans le genre.
    tFileInputFullRow -row1-> tExtractXmlField -row2-> LaSuite...

    Topics liés :
    https://www.developpez.net/forums/d1...l-l-interieur/
    https://www.developpez.net/forums/d1...sieurs-header/

Discussions similaires

  1. Recuperation du fichier xml
    Par Geulderack dans le forum XMLRAD
    Réponses: 10
    Dernier message: 28/02/2003, 11h06
  2. Insertion dans un fichier XML
    Par [DreaMs] dans le forum XMLRAD
    Réponses: 4
    Dernier message: 27/02/2003, 17h16
  3. Lire un attribut dans un fichier XML en C++
    Par ti.k-nar dans le forum XML
    Réponses: 2
    Dernier message: 14/10/2002, 15h22
  4. [Kylix] Composant IBM pour fichiers XML
    Par Mister Nono dans le forum EDI
    Réponses: 1
    Dernier message: 29/09/2002, 20h28
  5. Balises HTML dans un fichier XML
    Par Bastet79 dans le forum XML/XSL et SOAP
    Réponses: 12
    Dernier message: 04/09/2002, 15h29

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo