Bonjour,
Avant toute chose, merci et bravo pour l'ensemble des forums de développez, il y a une somme de connaissances impressionnantes par ici...
Un petit point sur ma situation, je prends en main la responsabilité du SID dans mon entreprise (jusque là il n'y en avait pas: le décisionnel était assuré par les pôles OLTP).
J'hérite donc de 8 datawarehouse différents, 3 ETL (ODI, BODS, Talend), quand aux outils de reporting ça va plus vite de compter ceux qu'on n'a pas (on a du BO, du Cognos, du Powerplay, du Qlikview...).
De plus, côté OLTP, on est sur une approche dite "Best of breed" = empiler et essayer de faire causer des progiciels différents. Donc mes ODS peuvent être : Oracle, DB2, Sql Server (de 2003 à 2013), Access et excel.
Enfin, les travaux ETL déjà déployés utilisent des méthodes propres à chaque pôle fonctionnel (pour ne pas dire à chaque programmeur).
1/ définition de priorité, est-ce que vous auriez la même que moi?
Fusionner au plus vite les ETL / DWH (avant de gérer des dimensions conformes, ce serait pas mal qu'lles soient au moins stockées et alimentées au même endroit).
2/ Avant choix des outils, arrêter une méthode, j'imagine la suivante:
En gros, dans l'extraction, on reste au plus près des sources, puis une phase de "renormalisation" permettant de consolider les données avant de dénormaliser sur des données propres
Comme ça au débotté, je prends toutes les critiques ou suggestion sur la méthode, de toutes façons vous aurez la dents moins dure que mes collègues...
En prime, des premières suggestions sur le choix d'ETL basé sur vos avis perso et sur un choix d'outil de modélisation (j'aime bien la ligne de commande SQL, mais bon un peu de reverse, génération de DDL, ça peut être sympa aussi).
Merci à tous ceux qui ont déjà lu jusque là, et encore plus à ceux qui prendront le temps de répondre.
Cordialement,
Yohann
Partager