Bonjour, je suis étudiant et j'ai en ce moment un TP sur Talend. J'ai besoin de votre aide pour m'aiguiller sur les solutions pour résoudre la demande.
Voici la situation:
Je suis dans une agence de super héros, chaque jour les villes m'envoient un fichier CSV des interventions et des crimes qui ont eu lieu dans la nuit précédente.
Un fichier CSV contient 5 types de ligne:

TYPE 1: ligne "crime"
id_crime, type_ligne, date_debut, date_fin, description_crime, Lieu, bilan_mission
TYPE 2: ligne "super-héros"
id_crime, type_ligne, date_intervention, superhéros, santé_avant_mission, santé_après_mission, gravité_blessures (de 0 à 10)
TYPE 3: ligne "super-vilain"
id_crime, type_ligne, ennemi, interpele, gravité_blessures (de 0 à 10)
TYPE 4: ligne "victime"
id_crime, type_ligne, nom_victime, prenom_victime, etat_fin_intervention
TYPE 5: ligne "arme"
id_crime, type_ligne, type_arme, nom_arme, propriétaire

L'objectif est de transférer les données dans une base de données MySQL créer d'après le diagramme dimensionnel suivant :
Nom : scd.PNG
Affichages : 3021
Taille : 69,2 Ko
(Il est imposé par le prof)

Nous avons créé un job avec les éléments suivants:
  • tFileList pour lister les fichier csv qui sont dans un répertoire
  • tFileInputMSDelimited pour parcourir les fichiers et décomposer le contenu en fonction de la colonne type_ligne
  • tMysqlOutput pour insérer les données dans la BDD


Le prof veut que l'on utilise un composant tMysqlSCD dans le job. Pour moi tous les champs de la dimension sont de type 1 donc de suite je n'en vois pas vraiment l'utilité, d'ailler je ne comprends pas totalement le fonctionnement de ce composant également.

La question est de savoir quelle composant utiliser pour faire les relations entre la dimension et les fait avant d'insérer en base?