Précédent   Forum des professionnels en informatique > Logiciels > Solutions d'entreprise > Business Intelligence > Conception/Modélisation Décisionnelle
Conception/Modélisation Décisionnelle Forum d'entraide sur la conception de datawarehouse, datamarts et la modélisation décisionnelle : Tables de faits et de dimension, Modèles en étoile ou en flocons, etc.
Partagez cette discussion sur d'autres réseaux sociaux : Viadeo Twitter Google Facebook Digg Delicious MySpace Yahoo
Réponse Proposer ce sujet en actualité
 
Outils de la discussion
Publicité
'
Vieux 21/04/2008, 13h33   #1
Nouveau Membre du Club
 
Inscription : décembre 2006
Messages : 73
Détails du profil
Informations forums :
Inscription : décembre 2006
Messages : 73
Points : 26
Points : 26
Par défaut stockage d'infos dans le cube

Bonjour,
j'ai une petite question à propos du cube et de la manière dont il stocke les données.
on sait que la particularité d'un cube c'est qu'il stocke les données, ce qui facilite l'accés à celles-ci, maintenant, est ce que le cube stocke les données de degré de granularité le plus bas, et il fait des agrégations en cas de besoin? (dans ce cas, il ressemblera plus à un datamart), ou bien il stocke toutes les données, résultats de tous les croisements possibles entre les dimensions? (et dans ce cas sa taille sera énorme). Merci pour votre aide et vos explications.
h_ismaili est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 21/04/2008, 17h54   #2
Nouveau Membre du Club
 
Inscription : octobre 2007
Messages : 29
Détails du profil
Informations forums :
Inscription : octobre 2007
Messages : 29
Points : 32
Points : 32
Bonjour,

Citation:
est ce que le cube stocke les données de degré de granularité le plus bas, et il fait des agrégations en cas de besoin? (dans ce cas, il ressemblera plus à un datamart),
Un Datamart stocke des données pré-agrégées, donc la granularité est plus grossière que celle du Datawarehouse.
Attention, le terme de granularité peut être trompeur. On parle de granularité fine ou grossière. Dans le doute, il me semble préférable d'utiliser le terme d'Agrégation forte ou faible.

Citation:
ou bien il stocke toutes les données, résultats de tous les croisements possibles entre les dimensions? (et dans ce cas sa taille sera énorme).
Tout dépend de l'implémentation choisie :

C'est toute la problématique des cubes MOLAP, qui effectivement présentent l'ensemble des tuples envisageables suivant les combinaisons entre les dimensions existantes. La taille physique d'un cube est donc par définition importante.
En revanche, dans le cas du ROLAP où les agrégations sont effectuées à la volée, il n'est pas nécessaire de présenter l'ensemble des tuples. Néanmoins, une modélisation en étoile est conseillée pour améliorer les performances.

Cette problématique de volumétrie, et donc par conséquent de temps d'alimentation, est l'un des critères qui entre dans le choix d'une implémentation R ou M OLAP.
Jean_Paul_XX est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 21/04/2008, 20h02   #3
Membre Expert
 
Développeur informatique
Inscription : juillet 2007
Messages : 690
Détails du profil
Informations personnelles :
Âge : 28
Localisation : Canada

Informations professionnelles :
Activité : Développeur informatique

Informations forums :
Inscription : juillet 2007
Messages : 690
Points : 1 558
Points : 1 558
Citation:
Un Datamart stocke des données pré-agrégées, donc la granularité est plus grossière que celle du Datawarehouse.
Attention ! Un datamart est un sous ensemble d'un DW, il peut, effectivement, s'agir de données agrégées. Mais il peut tout à fait être une division fonctionnelle du data warehouse : un datamart des ventes, un datamart pour une succursale.
ygrim est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 21/04/2008, 22h40   #4
Membre actif
 
Inscription : janvier 2007
Messages : 205
Détails du profil
Informations forums :
Inscription : janvier 2007
Messages : 205
Points : 192
Points : 192
J'ai cru entendre dire que les cubes Cognos pouvaient ne pas forcément contenir tout les calculs à tous les niveaux, ce qui signifierait que les données à des niveaux aggrégés seraient calculés au moment de la requête.

Est-ce qu'un spécialiste Transformer pourrait confirmer cela?
yphilogene est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 22/04/2008, 11h18   #5
Nouveau Membre du Club
 
Inscription : octobre 2007
Messages : 29
Détails du profil
Informations forums :
Inscription : octobre 2007
Messages : 29
Points : 32
Points : 32
Citation:
il peut tout à fait être une division fonctionnelle du data warehouse : un datamart des ventes
Oui, oui. En effet Ygrim. Je n'en ai pas fait mention car nous traitions de la granularité et non de l'aspect fonctionnel.
Jean_Paul_XX est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 22/04/2008, 11h57   #6
Nouveau Membre du Club
 
Inscription : décembre 2006
Messages : 73
Détails du profil
Informations forums :
Inscription : décembre 2006
Messages : 73
Points : 26
Points : 26
Pour revenir au sujet, je conclue donc que les cubes MOLAP stocke toutes les données de tous les croisements possibles alors que les ROLAP ne le font pas, au contraire ils générent des requêtes au besoin. c'est ça.
h_ismaili est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 22/04/2008, 15h38   #7
Membre actif
 
Inscription : janvier 2007
Messages : 205
Détails du profil
Informations forums :
Inscription : janvier 2007
Messages : 205
Points : 192
Points : 192
Le R-OLAP ne fait pas du stockage. Il ne génère pas de cubes physiques contrairement au M-OLAP. Le R-OLAP est une couche logicielle (de modélisation) permettant d'intérroger une base de données avec une logique d'analyse OLAP.

Les cubes M-OLAP stockent bien de la donnée, sous un format prédisposé à l'analyse OLAP (requêtage MDX). Classiquement, toutes les combinaisons sont précalculées et stockées. Je pense cependant que certaines technologies permettent de précalculer les données au niveau de détails le plus fin, mais pas nécessairement à tous les niveaux, laissant au moteur le soin de calculer les indicateurs au niveaux aggrégés au moment de l'execution de la requête. Encore une fois, y a-t-il quelqu'un qui serait capable de confirmer cette supposition? Je suis quasiment sûr que les cubes Cognos proposent cette option.
yphilogene est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 22/04/2008, 18h13   #8
Nouveau Membre du Club
 
Inscription : décembre 2006
Messages : 73
Détails du profil
Informations forums :
Inscription : décembre 2006
Messages : 73
Points : 26
Points : 26
merci encore une fois pour ta reponse
h_ismaili est déconnecté   Envoyer un message privé Réponse avec citation 00
Réponse Proposer ce sujet en actualité Cette discussion est résolue.
Outils de la discussion



Fuseau horaire GMT +2. Il est actuellement 19h41.


 
 
 
 
Partenaires

Hébergement Web