Bonjour à tous,
Je suis novice dans le domaine de l’informatique décisionnel, et je fais actuellement un stage qui devrait me permettre d’apprendre dans ce domaine tout en aidant l’entreprise (à but non lucratif) à lancer ce projet. Cependant il n’est pas toujours évident de trouver des réponses à mes questions sur les différents forums et personne n’est capable de répondre à mes différentes questions dans le département informatique où je me trouve. Je me permets donc de poster sur ce forum en espérant que quelqu’un puisse m’aider.
Présentation du projet :
Mon stage s’effectue dans une clinique, qui se sert de différents logiciels qui sont principalement un ERP, un logiciel de dossier patient informatisé, et un logiciel de planification des rendez-vous. Il y a 3 ans, un projet a débuté avec une entreprise externe qui a réussi à vendre Qlikview mais sans mise en place d’un datawarehouse ce qui nous donne des dashboard uniquement branché sur l’ERP, pas toujours corrects, et surtout très compliqués à améliorer.
J’ai donc proposé de faire une preuve de concept avec la mise en place d’un datawarehouse (pour l’instant sur SQL Server Express), alimenté par un ETL (Talend), et je pense utiliser PowerBI comme Dataviz.
Le premier datamart que je dois mettre en place concerne l’activité de l’entreprise qui se mesure en nuit passé par le patient. Je souhaite donc faire une table de fait avec une ligne pour chaque nuit passée par un patient, car des informations peuvent changer au cours d’un séjour comme le médecin traitant etc… Mon fait est donc une date mais je souhaite également les filtrer et les afficher par date qui ressemble ainsi une dimension, qui de plus pourrait me servir à d’autres endroits (ex : date de naissance d’un patient).
Mes questions sont donc les suivantes :
Modélisation :
• J’ai vu plusieurs exemples ou les personnes utilisent pour la date une clé de type yyyyMMdd. Dois-je donc le faire pour toutes mes dates et donc avoir une dimension date qui peut être utilisé par ma table de fait mais aussi par une table de dimension patient contenant la date de naissance ?
• Est-il simple de faire des count pour la visualisation ? Ou dois-je ajouter dans chaque ligne une colonne avec une valeur de 1 pour faire des sommes ?
Architecture :
• J’ai entendu que Microsoft essaye de pousser les gens à utiliser du tabular au lieu de cubes OLAP. J’ai donc cherché malheureusement sans trouver quels sont les avantages et les limites de chacun de ces « systèmes » ?
• PowerBI est-il uniquement prévu pour du tabular ?
• Pour le logiciel de visualisation, la différence de qualité (vitesse et facilité d'utilisation) est-elle grande entre QlikView et PowerBI ? (Car l'a différence de prix l'est clairement...)
• Au niveau du datawarehouse, quel sera ma limite avec SQL server Express qu’est-ce que vous me conseillez ? Car j’ai entendu que MySQL n’est pas forcément fait pour du multidimensionnel ?
Merci d’avance pour votre aide et n’hésitez surtout pas à me dire si je suis un peu (voir complètement) à côté de la plaque…
Cordialement,
Julien
Partager