|
Publicité ' | |||||||||||||||||||||||
|
|
#1 |
|
Nouveau Membre du Club
![]() ![]() Inscription : mars 2008 Messages : 32 ![]() |
bonjour,
je débute en BI. j'ai lu des tutos sur ce site ainsi que d'autres et en partie le livre the dataware house lifecycle toolkit 2e version. Malgré tout de nombreux points ne me semblent pas clairs : 1 : en amont on a des données hétérogènes qu'on traite avec un ETL pour les charger dans une BDD (dataware house). Il semble clair d'après ce que j'ai lu que cette BDD est toujours relationnelle. La plupart du temps cette BDD est en étoile (ou flocon). Est il pertinent que dans certains cas cette BDD soit sous forme normale ou sera elle systématiquement en étoile (ou flocon)? 2 : Si j'ai bien compris un utilisateur a besoin d'accéder d'une part aux données détails (stockées dans une BDD relationnelle étoile) et d'autre part à des données plus au moins agrégées avec des bons temps de réponse. Pour répondre à ce second besoin on peut utiliser par exemple un moteur OLAP ou des vues matérialisées ORACLE. Dans certains cas pour des raisons de performances les données détails sont également stockées dans le moteur OLAP (donc duplication car elles sont déjà stockées dans la BDD relationnelle étoile). Est ce que tout celà est correct? 3 : la définition d'OLAP ne me semble pas très claire. Si je choisis comme architecture une BDD relationnelle ORACLE en étoile+ des vues matérialisées est ce que c'est OLAP? 4 : si on utilise un moteur OLAP les requêtes ne sont pas faites en SQL mais avec un langage de requêtage ad hoc mais il n'y a pas encore de standart (MDX est souvent utilisé mais pas toujours). Est ce que tout celà est correct? 5 : Lorsqu'on stocke dans une BDD relationnelle en étoile (dataware house) toutes les données nécessaire pour la BI, il y aura souvent plusieurs étoiles. est il possible que des requêtes utilisent plusieurs étoiles? (je pense que Non mais je ne suis pas sur). cordialement loïc midy |
|
|
00
|
|
|
#2 |
|
Membre chevronné
![]() Inscription : septembre 2003 Messages : 623 ![]() |
1. La forme normale vous posera des problèmes de performance. L'idée de l'étoile, c'est une lecture séquentielle de la table de fait (qui est sous entendue ne tenant pas en mémoire) et des hash lookup sur les dimensions. Bref complexité n avec n le nombre de ligne de la table de fait.
2. Ou un process ETL qui va remplir une table plus agrégée. Ou ça duplique et oui si un jour une données erronée rentre, vous galérez à tout corriger. 3. Il y a le concept OLAP et les produits OLAP. Le mieux c'est la définition http://fr.wikipedia.org/wiki/Online_...cal_Processing . 4. oui 5. Il faut éviter les jointures entre 2 tables de faits (sauf si elles sont de petites tailles). Après ça se voit souvent. Mais pour moi ce sera du mauvais design. |
|
|
10
|
|
|
#3 | |
|
Nouveau Membre du Club
![]() ![]() Inscription : mars 2008 Messages : 32 ![]() |
merci pour ces réponses.
Seul le point 3 n'est pas complètement clair pour moi. Sur Citation:
Si je choisis comme architecture une BDD relationnelle ORACLE en étoile+ des vues matérialisées est ce que cela respecte le concept OLAP? cordialement loïc midy |
|
|
|
00
|
|
|
#4 |
|
Membre éclairé
![]() Consultant en Business Intelligence Inscription : mai 2006 Messages : 275 ![]() |
Non, les vues matérialisées ne sont pas de l'OLAP.
Concrètement quand tu fais de l'OLAP, tu utilises des logiciels dédiés ou des add-ins dans des logiciels tels qu'Excel qui vont chercher leurs données sur un serveur OLAP. Ce serveur peut reposer sur plusieurs technologies mais la façon d'accéder aux données reste la même. Ensuite pour rentrer dans le détails, il existe en gros 2 familles de technos OLAP : MOLAP : Multidimensionnal OLAP : les données sont stockées dans un format de fichier interne au serveur où il a préparé les données pour des transformations OLAP. Il faut rafraichir un cube pour mettre à jour les données. ROLAP Relationnal OLAP : les données sont stockées dans une base relationnelle et le serveur fait des requêtes SQL (parfois très complexes) pour accéder aux données (c'est transparent pour l'utilisateur). Les données sont toujours à l'image de la base puisqu'il n'y a pas de couche intermédiaire. Il existe le HOLAP : Hybrid OLAP qui combine les 2 familles ci-dessus à divers degrés (souvent ROLAP pour le détail et MOLAP pour les agrégats). |
|
|
10
|
|
|
#5 |
|
Membre chevronné
![]() Inscription : septembre 2003 Messages : 623 ![]() |
C'est de l'OLAP au niveau du concept, mais aujourd'hui on appelle OLAP plus les produits comme présenté par Prjprj.
Pour ma part, je me limite à parler de cube. |
|
|
10
|
Copyright © 2000-2012 - www.developpez.com