IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Développement de jobs Discussion :

Import fichier plat xml


Sujet :

Développement de jobs

  1. #1
    Membre régulier
    Inscrit en
    Juillet 2003
    Messages
    207
    Détails du profil
    Informations forums :
    Inscription : Juillet 2003
    Messages : 207
    Points : 85
    Points
    85
    Par défaut Import fichier plat xml
    Bonjour,

    Je cherche à importer un fichier xml issue d'un export du journal d’événements Windows dans Talend

    Si je choisis un metadata de type xml, cela m'indique que ce n'est pas un fichier xml.

    Mais si je choisis un metadata de type file delimited, il n'y a pas de délimiteur de champ. les champs sont séparés par des balises de type <nom_balise>blablabla</nom_balise>

    Exemple d'une partie d'une ligne de ce fichier:
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    <EventID>307</EventID><Version>0</Version><Level>4</Level><Task>26</Task><Opcode>11</Opcode><Keywords>0x4000000000000840</Keywords><TimeCreated SystemTime='2018-02-19T13:17:38.181678500Z'/><EventRecordID>1310</EventRecordID> ...etc
    Comment faire pour importer ce type de fichier dans Talend ?

    Merci d'avance
    David

  2. #2
    Membre averti

    Homme Profil pro
    Consultant en Business Intelligence
    Inscrit en
    Juillet 2011
    Messages
    160
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Seine Saint Denis (Île de France)

    Informations professionnelles :
    Activité : Consultant en Business Intelligence
    Secteur : Service public

    Informations forums :
    Inscription : Juillet 2011
    Messages : 160
    Points : 443
    Points
    443
    Billets dans le blog
    2
    Par défaut
    Bonjour davelop,

    Citation Envoyé par davelop Voir le message
    Si je choisis un metadata de type xml, cela m'indique que ce n'est pas un fichier xml.
    Est ce que tu peux afficher l'erreur qui t'es indiqué ?

    Est ce que tu as vérifié que ton fichier xml est bien valide ?

    car s'il n'est pas valide Talend peut t'afficher différent types de message d'erreur selon les cas.
    Utilisez le bouton pour mettre en valeur la ou les réponses qui vous ont été les plus utiles. Marquez comme si c'est le cas.

    ''Le savoir est la seule matière qui s’accroît lorsqu’on la partage.''
    (Socrate)

  3. #3
    Membre régulier
    Inscrit en
    Juillet 2003
    Messages
    207
    Détails du profil
    Informations forums :
    Inscription : Juillet 2003
    Messages : 207
    Points : 85
    Points
    85
    Par défaut
    Merci de ta réponse :

    Le message indiqué par Talend au moment de créer la metadata XML, quand je sélectionne le fichier xml est :
    "C:/logs_imp/evtdump-2017-01-03.xml" is not found or the xml format is incorrect."

    Ce fichier XML est généré via la commande Powershell wevtutil qui récupère des événements du journal d’événements en fichier .xml

  4. #4
    Membre averti

    Homme Profil pro
    Consultant en Business Intelligence
    Inscrit en
    Juillet 2011
    Messages
    160
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Seine Saint Denis (Île de France)

    Informations professionnelles :
    Activité : Consultant en Business Intelligence
    Secteur : Service public

    Informations forums :
    Inscription : Juillet 2011
    Messages : 160
    Points : 443
    Points
    443
    Billets dans le blog
    2
    Par défaut
    Au faite je pense que le problème vient du faite que le xml généré avec la commande PowerShell wevtutil à comme première ligne ça : <?xml version="1.0" encoding="UTF-8"?> pour dire que c'est bien un document xml ce qui est tout à fait normal.

    Par contre dans les metadata de Talend il ne considère pas cette ligne <?xml version="1.0" encoding="UTF-8"?> comme étant du xml valide, donc il te dit que le format de ton fichier xml est incorrect.

    Donc si tu supprimes cette ligne au début de ton fichier xml ça devrait marché.

    Si tu as plusieurs fichiers soit tu pense à supprimer cette ligne à la main, ou bien tu fais un petit job Talend qui te le fais.

    Par contre je ne sais pas s'il y a une façon standard de dire à Talend de ne pas considéré cette ligne dans les metadonnées ?!
    Utilisez le bouton pour mettre en valeur la ou les réponses qui vous ont été les plus utiles. Marquez comme si c'est le cas.

    ''Le savoir est la seule matière qui s’accroît lorsqu’on la partage.''
    (Socrate)

  5. #5
    Membre averti

    Homme Profil pro
    Consultant en Business Intelligence
    Inscrit en
    Juillet 2011
    Messages
    160
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Seine Saint Denis (Île de France)

    Informations professionnelles :
    Activité : Consultant en Business Intelligence
    Secteur : Service public

    Informations forums :
    Inscription : Juillet 2011
    Messages : 160
    Points : 443
    Points
    443
    Billets dans le blog
    2
    Par défaut
    Citation Envoyé par davelop Voir le message
    Merci de ta réponse :
    "C:/logs_imp/evtdump-2017-01-03.xml" is not found or the xml format is incorrect."
    Supprime juste la ligne <?xml version="1.0" encoding="UTF-8"?> de ton fichier xml et réessaye.
    Utilisez le bouton pour mettre en valeur la ou les réponses qui vous ont été les plus utiles. Marquez comme si c'est le cas.

    ''Le savoir est la seule matière qui s’accroît lorsqu’on la partage.''
    (Socrate)

  6. #6
    Membre régulier
    Inscrit en
    Juillet 2003
    Messages
    207
    Détails du profil
    Informations forums :
    Inscription : Juillet 2003
    Messages : 207
    Points : 85
    Points
    85
    Par défaut
    Non il n'y a pas cette première ligne dans le fichier XML généré par le Powerscript

    Le fichier commence directement par :
    <EventID>307</EventID><Version>0</Version>....etc...

  7. #7
    Membre averti

    Homme Profil pro
    Consultant en Business Intelligence
    Inscrit en
    Juillet 2011
    Messages
    160
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Seine Saint Denis (Île de France)

    Informations professionnelles :
    Activité : Consultant en Business Intelligence
    Secteur : Service public

    Informations forums :
    Inscription : Juillet 2011
    Messages : 160
    Points : 443
    Points
    443
    Billets dans le blog
    2
    Par défaut
    Citation Envoyé par davelop Voir le message
    Non il n'y a pas cette première ligne dans le fichier XML généré par le Powerscript

    Le fichier commence directement par :
    <EventID>307</EventID><Version>0</Version>....etc...
    Ah ok, j'ai pensé que le tiens contenait cette ligne par ce que quand je génère un fichier xml avec cette commande le fichier a cette ligne or cette ligne au début de ton fichier pouvait te conduire à la même erreur, donc c'est n'est pas ça le problème.

    Par contre si ton xml commence par :

    <EventID>307</EventID>
    <Version>0</Version>
    et..


    ça veut dire que ces elements <EventID> et <Version> etc.. ne sont pas dans une balise racine ?

    Or, afin que ton fichier soit considéré comme valide il lui faut une balise racine comme :

    <racine>
    <EventID>307</EventID>
    <Version>0</Version>
    etc...

    </racine>

    Essaye de rajouter une balise racine s'il n'existe pas dans ton fichier comme ci-dessus pour voir.
    Utilisez le bouton pour mettre en valeur la ou les réponses qui vous ont été les plus utiles. Marquez comme si c'est le cas.

    ''Le savoir est la seule matière qui s’accroît lorsqu’on la partage.''
    (Socrate)

  8. #8
    Membre régulier
    Inscrit en
    Juillet 2003
    Messages
    207
    Détails du profil
    Informations forums :
    Inscription : Juillet 2003
    Messages : 207
    Points : 85
    Points
    85
    Par défaut
    Alors en fait oui il y a bien une balise racine car je n'ai pas mis toute la ligne d'un enregistrement.

    Voici la ligne complète :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    <Event xmlns='http://schemas.microsoft.com/win/2004/08/events/event'><System><Provider Name='Microsoft-Windows-PrintService' Guid='{747EF6FD-E535-4D16-B510-42C90F6873A1}'/><EventID>307</EventID><Version>0</Version><Level>4</Level><Task>26</Task><Opcode>11</Opcode><Keywords>0x4000000000000840</Keywords><TimeCreated SystemTime='2018-02-19T13:17:38.181678500Z'/><EventRecordID>1210</EventRecordID><Correlation/><Execution ProcessID='1096' ThreadID='6012'/><Channel>Microsoft-Windows-PrintService/Operational</Channel><Computer>A25SVPS.za.if.atcsg.net</Computer><Security UserID='S-1-5-21-3095416536-3097367016-2845470932-29946'/></System><UserData><DocumentPrinted xmlns='http://manifests.microsoft.com/win/2005/08/windows/printing/spooler/core/events'><Param1>213</Param1><Param2>Print Document</Param2><Param3>N3196715</Param3><Param4>A25LT50546</Param4><Param5>A25PRT05P0A</Param5><Param6>10.128.45.159</Param6><Param7>133897</Param7><Param8>1</Param8></DocumentPrinted></UserData></Event>

  9. #9
    Membre averti

    Homme Profil pro
    Consultant en Business Intelligence
    Inscrit en
    Juillet 2011
    Messages
    160
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Seine Saint Denis (Île de France)

    Informations professionnelles :
    Activité : Consultant en Business Intelligence
    Secteur : Service public

    Informations forums :
    Inscription : Juillet 2011
    Messages : 160
    Points : 443
    Points
    443
    Billets dans le blog
    2
    Par défaut
    Citation Envoyé par davelop Voir le message
    Alors en fait oui il y a bien une balise racine car je n'ai pas mis toute la ligne d'un enregistrement.

    Voici la ligne complète :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    <Event xmlns='http://schemas.microsoft.com/win/2004/08/events/event'><System><Provider Name='Microsoft-Windows-PrintService' Guid='{747EF6FD-E535-4D16-B510-42C90F6873A1}'/><EventID>307</EventID><Version>0</Version><Level>4</Level><Task>26</Task><Opcode>11</Opcode><Keywords>0x4000000000000840</Keywords><TimeCreated SystemTime='2018-02-19T13:17:38.181678500Z'/><EventRecordID>1210</EventRecordID><Correlation/><Execution ProcessID='1096' ThreadID='6012'/><Channel>Microsoft-Windows-PrintService/Operational</Channel><Computer>A25SVPS.za.if.atcsg.net</Computer><Security UserID='S-1-5-21-3095416536-3097367016-2845470932-29946'/></System><UserData><DocumentPrinted xmlns='http://manifests.microsoft.com/win/2005/08/windows/printing/spooler/core/events'><Param1>213</Param1><Param2>Print Document</Param2><Param3>N3196715</Param3><Param4>A25LT50546</Param4><Param5>A25PRT05P0A</Param5><Param6>10.128.45.159</Param6><Param7>133897</Param7><Param8>1</Param8></DocumentPrinted></UserData></Event>
    Je n'arrive pas à reproduire le problème, vu que ton xml est bien valide, quand je crée un metadata xml tout marche bien :

    Nom : etape3-2.PNG
Affichages : 509
Taille : 55,3 Ko


    Nom : etape_4-3.PNG
Affichages : 554
Taille : 58,7 Ko



    Ton fichier xml ne se trouve pas sur un serveur auquel Talend n'a pas accès ??!!
    Utilisez le bouton pour mettre en valeur la ou les réponses qui vous ont été les plus utiles. Marquez comme si c'est le cas.

    ''Le savoir est la seule matière qui s’accroît lorsqu’on la partage.''
    (Socrate)

  10. #10
    Membre régulier
    Inscrit en
    Juillet 2003
    Messages
    207
    Détails du profil
    Informations forums :
    Inscription : Juillet 2003
    Messages : 207
    Points : 85
    Points
    85
    Par défaut
    Alors effectivement cela fonctionne mais uniquement quand il n'y a qu'une seule ligne.

    C'est apparemment le retour chariot entre chaque ligne qui pose problème.

  11. #11
    Membre averti

    Homme Profil pro
    Consultant en Business Intelligence
    Inscrit en
    Juillet 2011
    Messages
    160
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Seine Saint Denis (Île de France)

    Informations professionnelles :
    Activité : Consultant en Business Intelligence
    Secteur : Service public

    Informations forums :
    Inscription : Juillet 2011
    Messages : 160
    Points : 443
    Points
    443
    Billets dans le blog
    2
    Par défaut
    C'est apparemment le retour chariot entre chaque ligne qui pose problème.
    Ah ok.
    Utilisez le bouton pour mettre en valeur la ou les réponses qui vous ont été les plus utiles. Marquez comme si c'est le cas.

    ''Le savoir est la seule matière qui s’accroît lorsqu’on la partage.''
    (Socrate)

  12. #12
    Membre à l'essai
    Homme Profil pro
    Technicien en statistique et en informatique
    Inscrit en
    Décembre 2021
    Messages
    31
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Isère (Rhône Alpes)

    Informations professionnelles :
    Activité : Technicien en statistique et en informatique

    Informations forums :
    Inscription : Décembre 2021
    Messages : 31
    Points : 10
    Points
    10
    Par défaut
    Citation Envoyé par Netsoro Voir le message
    Au faite je pense que le problème vient du faite que le xml généré avec la commande PowerShell wevtutil à comme première ligne ça : <?xml version="1.0" encoding="UTF-8"?> pour dire que c'est bien un document xml ce qui est tout à fait normal.

    Par contre dans les metadata de Talend il ne considère pas cette ligne <?xml version="1.0" encoding="UTF-8"?> comme étant du xml valide, donc il te dit que le format de ton fichier xml est incorrect.

    Donc si tu supprimes cette ligne au début de ton fichier xml ça devrait marché.

    Si tu as plusieurs fichiers soit tu pense à supprimer cette ligne à la main, ou bien tu fais un petit job Talend qui te le fais.

    Par contre je ne sais pas s'il y a une façon standard de dire à Talend de ne pas considéré cette ligne dans les metadonnées ?!
    Bonjour,

    Je me permets de relancer le sujet car j'ai exactement la même problématique, je serai intéressé par ce que vous avez dit "ou bien tu fais un petit job Talend qui te le fais.". Quel type de Job pourrais-je mettre en place pour supprimer cette 1ère ligne (ou plutôt cette première partie car mon XML est également à plat) ?

    Merci beaucoup par avance

Discussions similaires

  1. [Débutant] Import fichier plat FTP
    Par Nako_lito dans le forum C#
    Réponses: 13
    Dernier message: 08/09/2011, 17h00
  2. [2005] Import fichier plat avec accent
    Par tornade69 dans le forum SSIS
    Réponses: 1
    Dernier message: 09/06/2011, 11h05
  3. Automatiser Import fichier plat
    Par mboubidi dans le forum Administration
    Réponses: 10
    Dernier message: 23/10/2010, 16h00
  4. Probleme import fichier plat en VBA
    Par spaukensen dans le forum Macros et VBA Excel
    Réponses: 1
    Dernier message: 21/07/2008, 21h16
  5. Importation fichier plat vers Mysql
    Par xender dans le forum Requêtes
    Réponses: 3
    Dernier message: 09/05/2006, 22h36

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo