Précédent   Forum des professionnels en informatique > Logiciels > Solutions d'entreprise > Business Intelligence > ETL > Talend
Talend Forum d'entraide sur Talend (Talend Open Studio, ...). Avant de poster --> FAQ Talend, Tutoriels Talend
Partagez cette discussion sur d'autres réseaux sociaux : Viadeo Twitter Google Facebook Digg Delicious MySpace Yahoo
Réponse Proposer ce sujet en actualité
 
Outils de la discussion
Publicité
'
Vieux 07/04/2011, 14h29   #1
Invité de passage
 
Inscription : avril 2011
Messages : 46
Détails du profil
Informations forums :
Inscription : avril 2011
Messages : 46
Points : 3
Points : 3
Par défaut Talend : Conversion Excel - XML

Bonjour,

Je suis débutant sur Talend, et je dois convertir un fichier excel en fichier xml.

1er Question : Je voudrais savoir comment attribuer un schéma pour chacune de mes feuilles excel...

et 2 Question : Quand je creer un fichier XML pour ma sortie, j'importe bien un schéma mais j'ai pourtant comme erreur "Add a schema on repository" et "Define the schema" alors je ne comprend pas, et du coup je ne peux pas continuer...

Merci d'avance
chtrousselle est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 08/04/2011, 09h50   #2
Membre habitué
 
Inscription : août 2005
Messages : 117
Détails du profil
Informations personnelles :
Âge : 29
Localisation : France, Paris (Île de France)

Informations forums :
Inscription : août 2005
Messages : 117
Points : 145
Points : 145
Pour attribuer un schéma à ta feuille excel il y a plusieurs moyens, le plus rapide et réutilisable est de cliquer sur "Fichier Excel" dans la partie "Métadonnées" puis sur "créer un nouveau fichier Excel". Il te suffit ensuite de sélectionner ton fichier. Tu fais ensuite un glisser / déposer de ton objet présent dans tes métadata vers ton job chaque fois que tu as besoin de lire le dit fichier excel.

Quel composant utilises-tu pour la création de ton fichier XML ? Lorsque, sur ton composant XML (tFileOutputXML, tAdvancedFileOutputXML, ...) tu vas dans éditer le schémas, y a t'il bien un schéma défini pour la partie input et output ?
tetsu no tama est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 08/04/2011, 10h48   #3
Invité de passage
 
Inscription : avril 2011
Messages : 46
Détails du profil
Informations forums :
Inscription : avril 2011
Messages : 46
Points : 3
Points : 3
Pour le fichier excel j'ai bien compris^la démarche, mais j'ai des feuilles avec des schémas différents, donc comment faire pour attribuer un schéma à chaque feuille ?

Et le fichier XML oui jai un schéma dans input et output mais cest le meme, donc y a surement un soucis ^^
chtrousselle est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 08/04/2011, 11h48   #4
Membre habitué
 
Inscription : août 2005
Messages : 117
Détails du profil
Informations personnelles :
Âge : 29
Localisation : France, Paris (Île de France)

Informations forums :
Inscription : août 2005
Messages : 117
Points : 145
Points : 145
Pour la partie Excel :
Si tes schémas sont identiques sur toutes tes feuilles, tu peux toutes les intégrer pour ne générer qu'un seul flux de sortie. Or, chez toi, ce n'est pas le cas, il te faut donc définir 1 métadonnée par feuille (répéter l'opération que je t'ai indiqué en choisissant la feuille correspondante)

Pour la partie XML :
Non, c'est normal que tes schémas soient identiques en input et output.
Par contre, il te faut configurer l'arbre XML de sortie (Si tu utilises un tAdvancedFileOuputXML). Si tu as déjà un exemple de fichier XML tel que tu l'attends en sortie, tu peux l'importer dans tes métadata, sinon, je te conseille d'utiliser le tAdvancedFileOuputXML qui te permettras de faire le lien entre tes champs et tes nœuds (et de définir sur quel nœud tu itères, etc.)
tetsu no tama est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 08/04/2011, 11h50   #5
Invité de passage
 
Inscription : avril 2011
Messages : 46
Détails du profil
Informations forums :
Inscription : avril 2011
Messages : 46
Points : 3
Points : 3
Ok, super je vais faire tout ca !

Merci bien ! ;-)
chtrousselle est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 11/04/2011, 14h26   #6
Invité de passage
 
Inscription : avril 2011
Messages : 46
Détails du profil
Informations forums :
Inscription : avril 2011
Messages : 46
Points : 3
Points : 3
C'est encore moi, j'ai un probleme lorsque je veux ajouter mon schéma de sortie de mon fichier XML j'ai comme erreur "Add a schema on repository - Define the schéma" j'ai essayé pleins de trucs mais je ne sais pas ce qu'il faut que je fasse pour que ca fonctionne enfin... Parce que "définir le schema" cest justement ce que je veux faire... ^^

Merci d'avance, j'ai mis une capture en piece jointe
Images attachées
Type de fichier : png Capture.PNG (109,5 Ko, 9 affichages)
chtrousselle est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 11/04/2011, 16h32   #7
Membre habitué
 
Inscription : août 2005
Messages : 117
Détails du profil
Informations personnelles :
Âge : 29
Localisation : France, Paris (Île de France)

Informations forums :
Inscription : août 2005
Messages : 117
Points : 145
Points : 145
Ok, rien de bien grave.

Il te faut faire du glisser déposer des champs de ton flux d'entrée (à gauche) vers les noeuds correspondant dans ton arbre XML (à droite) et ensuite sélectionner les noeuds de regroupement et les noeuds à itérer.
tetsu no tama est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 11/04/2011, 22h06   #8
Invité de passage
 
Inscription : avril 2011
Messages : 46
Détails du profil
Informations forums :
Inscription : avril 2011
Messages : 46
Points : 3
Points : 3
J'avais fini par trouver, j'ai fait tout ca !
Mais merci pour tes reponses

Dernière question, j'ai des erreurs comme quoi jai des attributs en double mais je ne peux pas faire autrement, comment gérer les doublons ?? en mettant des clés ?

voir pièce jointe ;-)
Images attachées
Type de fichier : png Capture.PNG (46,5 Ko, 4 affichages)
chtrousselle est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 12/04/2011, 09h48   #9
Membre habitué
 
Inscription : août 2005
Messages : 117
Détails du profil
Informations personnelles :
Âge : 29
Localisation : France, Paris (Île de France)

Informations forums :
Inscription : août 2005
Messages : 117
Points : 145
Points : 145
Il ne s'agit visiblement pas d'un problème de données mais d'un problème de métadonnées. Il y a plusieurs colonnes portant le même nom dans ton fichier Excel ce qui génère des erreurs de compilation de ton job.

Renomme tes colonnes portant les mêmes noms.
tetsu no tama est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 13/04/2011, 14h00   #10
Invité de passage
 
Inscription : avril 2011
Messages : 46
Détails du profil
Informations forums :
Inscription : avril 2011
Messages : 46
Points : 3
Points : 3
Merci beaucoup!
Pour en revenir au fichier excel avec plusieurs feuilles, j'ai créé une métadonnée pour chacune des feuilles...mais impossible de les parcourir sauf la première...
chtrousselle est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 13/04/2011, 14h26   #11
Membre habitué
 
Inscription : août 2005
Messages : 117
Détails du profil
Informations personnelles :
Âge : 29
Localisation : France, Paris (Île de France)

Informations forums :
Inscription : août 2005
Messages : 117
Points : 145
Points : 145
Pour faire le test simplement et vérifier si le problème vient de la définition de tes métadonnées ou de ton tmap (si tu fais une jointure entre les deux flux), tu peux essayer ceci :

tFileInputExcel_1 (correspondant à la feuille 1) --> tLogRow
tFileInputExcel_2 (correspondant à la feuille 2) --> tLogRow

si la sortie affiche bien le contenu des deux feuilles c'est que la configuration de tes métadonnées est bonne et que le problème vient de plus loin dans le design de ton job.
tetsu no tama est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 13/04/2011, 14h42   #12
Invité de passage
 
Inscription : avril 2011
Messages : 46
Détails du profil
Informations forums :
Inscription : avril 2011
Messages : 46
Points : 3
Points : 3
Merci, je vais chercher par là car toutes les feuilles me donnent en résultat le conten de la première
chtrousselle est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 13/04/2011, 15h05   #13
Membre habitué
 
Inscription : août 2005
Messages : 117
Détails du profil
Informations personnelles :
Âge : 29
Localisation : France, Paris (Île de France)

Informations forums :
Inscription : août 2005
Messages : 117
Points : 145
Points : 145
Dans ce cas, c'est qu'à mon avis tu as mal configuré tes métadonnées Excel. Lorsque tu fais "créer un fichier Excel" dans la partie métadonnées, tu sélectionne le fichier existant puis tu dans la partie "configurer les paramètres de la feuille" tu sélectionne bien uniquement la feuille correspondant.
tetsu no tama est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 13/04/2011, 15h25   #14
Invité de passage
 
Inscription : avril 2011
Messages : 46
Détails du profil
Informations forums :
Inscription : avril 2011
Messages : 46
Points : 3
Points : 3
J'ai créer un fichier excel avec la première feuille, je fais une métadonnée pour celle-ci.
Ensuite je refais "éditer" le fichier excel, je sélectionne la deuxième feuille et ensuite clique droit sur le fichier : "récupérer le schéma" pour faire la métadonnée de la deuxième feuille... etc
chtrousselle est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 13/04/2011, 15h39   #15
Invité de passage
 
Inscription : avril 2011
Messages : 46
Détails du profil
Informations forums :
Inscription : avril 2011
Messages : 46
Points : 3
Points : 3
Je suis obligé de faire comme ca, parce qu'en fait dans l'edition du fichier, si il y a deja une métadonnée de créée je ne peux pas acceder à l'étape 4 pour creer une metadonnée justement
chtrousselle est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 13/04/2011, 16h08   #16
Membre habitué
 
Inscription : août 2005
Messages : 117
Détails du profil
Informations personnelles :
Âge : 29
Localisation : France, Paris (Île de France)

Informations forums :
Inscription : août 2005
Messages : 117
Points : 145
Points : 145
Et bien voilà où est le "hic".

Lorsque tu créé ton tFileInputxcel, tu lui spécifie la feuille, la partie métadonnées (champs / typage) est la dernière étape.

Lorsque tu vas faire un "drag and drop" de la définition de ton fichier Excel dans ton job, il va se référer à la feuille spécifiée, or dans ton cas, c'est toujours la feuille 1 vu que tu n'as modifié que les métadonnées.

Il te faut, dans ton cas, créer un fichier Excel pour chacune de tes feuilles et spécifier, pour chacune, les métadonnées attendues.

Évidemment, si chacune de tes feuilles comporte le même genre de données et le même schéma, tu ne créé qu'un seul fichier Excel dans lequel tu inclues toutes les feuilles, mais ça ne semble pas être ton cas.
tetsu no tama est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 13/04/2011, 16h14   #17
Invité de passage
 
Inscription : avril 2011
Messages : 46
Détails du profil
Informations forums :
Inscription : avril 2011
Messages : 46
Points : 3
Points : 3
Ok, merci! c'est ce que j'avais commencé a faire, je vais donc créer un fichier pour chaque feuille. Merci bien ;-)
chtrousselle est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 13/04/2011, 17h09   #18
Invité de passage
 
Inscription : avril 2011
Messages : 46
Détails du profil
Informations forums :
Inscription : avril 2011
Messages : 46
Points : 3
Points : 3
Derniere petite question après j'ai terminé
Je voulais avoir la confirmation : j'arrive à importer mes feuilles excel, mais séparément. Il faut que j'importe tout en une fois, dans le meme fichier XML, pour cela il faut bien utiliser tMap cest ca ??
chtrousselle est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 13/04/2011, 17h31   #19
Membre habitué
 
Inscription : août 2005
Messages : 117
Détails du profil
Informations personnelles :
Âge : 29
Localisation : France, Paris (Île de France)

Informations forums :
Inscription : août 2005
Messages : 117
Points : 145
Points : 145
Il te faut effectivement utiliser un tMap. Je ne sais pas ce que contiennent tes feuilles Excel mais, j'imagine que tu peux identifier un identifiant pour tes enregistrements identiques sur les feuilles 1 / 2 et 3 ?

Auquel cas, tu génère ton flux principal depuis le tFileInputExcel_1 et tu mets les autres flux en look-up de ton tmap, puis tu fais une jointure interne.
tetsu no tama est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 14/04/2011, 09h29   #20
Invité de passage
 
Inscription : avril 2011
Messages : 46
Détails du profil
Informations forums :
Inscription : avril 2011
Messages : 46
Points : 3
Points : 3
je vais me pencher attentivement sur tmap alors mais je n'ai aucune feuille identique
chtrousselle est déconnecté   Envoyer un message privé Réponse avec citation 00
Réponse Proposer ce sujet en actualité
Outils de la discussion



Fuseau horaire GMT +2. Il est actuellement 05h53.


 
 
 
 
Partenaires

Hébergement Web