Bonjour à tous,
Est ce que l'un d'entre vous a déjà implémenté cette méthodologie en entreprise ?
J'ouvre ce post uniquement pour partager vos connaissances/expériences.
Merci
Bonjour à tous,
Est ce que l'un d'entre vous a déjà implémenté cette méthodologie en entreprise ?
J'ouvre ce post uniquement pour partager vos connaissances/expériences.
Merci
Jamais. L'idée est séduisante de prime abord, mais :
- est couteuse, car une fois qu'on a un data vault il faut quand même faire les data marts
- gère peu les règles métiers (en data vault raw, il n'y a aucune règle métier)
- n'est pas très optimisée au niveau des performances (beacoup de join large/large, n'exploite pas bien le stockage en colonne). Le DV 2.0 semble mieux mais je n'ai pas les détail.
- la doc n'est pas disponible gratuitement, pour le DV 2.0 il faut payer pour avoir les infos.
- le système un peu totalitaire où les gens non certifiés sont systématiquement dénigrés.
La solution Kimball est toujours nécessaire en restitution et pour les règles métiers. Le DV est excellent pour historiser les données des systèmes opérationnel, du staging amélioré en sorte.
Pour moi ayant évolué sur un 3NF Enterprise DWH, je me suis demandé ce qu'il y avait de différent par rapport à cette méthodologie.
D'après ce que j'ai pu lire sur le net, une des différences que j'ai pu relevé c'est que le datavault ne serait pas impacté dans le cas où le système source devait changer au niveau de sa structure. Comparé au EDWH (Inmon), dès le moindre changement de structure...
Je te rejoins, Jester, sur le coût, mais tout dépend de la stratégie de départ.
La doc est limitée, mais aussi les exemples d'implémentation...
https://www.google.be/url?sa=t&rct=j...kmUplfVJ92Mr9Q
Le DV se situe entre le 3NF de Kimball et l'anchor modelling. Si un nouvel ensemble de colonnes se rajoute sur une table source, tu créés un nouveau satellite.
Il y a un moment je voulais détailler une méthode basée sur du layering que j'utilise actuellement. Finalement je ne suis pas allé beaucoup plus loin qu'une introduction [1]. Je l'utilise depuis un an et j'en suis satisfait.
[1] http://www.dataintoresults.com/2013/...ata-warehouse/
Oui, serait idéal d'avoir (en français par exemple sur ce forum) une certaine présentation des différentes méthodologies existantes, et ainsi d'avoir les différentes expériences de chacun, ça permettrait d'avoir une évolution positive des pratiques.
dommage ça n'a pas l'air d'intéressé grand monde...![]()
Hello,
Je pense qu'au contraire ça intéresserait beaucoup de monde
Mais ça prend du temps à faire
Ce que je te (vous) propose, c'est de faire un article dessus. Article au lieu de discussion car c'est plus lisible et ça ne part pas dans tous les sens comme dans les billets
On peut commencer par un plan, une intro et les différentes méthodos envisagées. Puis créer un billet pour chaque chapitre.
Ca vous tente ?
N'oubliez pas de cliquer surlorsque votre problème est réglé !
bonjour
je relance le sujet pour référencer les méthodes existantes?
Vous avez un bloqueur de publicités installé.
Le Club Developpez.com n'affiche que des publicités IT, discrètes et non intrusives.
Afin que nous puissions continuer à vous fournir gratuitement du contenu de qualité, merci de nous soutenir en désactivant votre bloqueur de publicités sur Developpez.com.
Partager