IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Décisions SGBD Discussion :

gain stockage olap


Sujet :

Décisions SGBD

  1. #1
    Membre régulier
    Profil pro
    Inscrit en
    Mai 2003
    Messages
    51
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Mai 2003
    Messages : 51
    Points : 93
    Points
    93
    Par défaut [resolu] gain stockage olap
    Bonjour,
    c'est mon premier post, j'espères ne pas me tromper de forum.
    Je travaille sur les bases de données décisionnelles et je suis surpris de constater que le coût de stockage des cubes OLAP est extrèmement faible (stocké en MOLAP)!
    Pour une base de données de 10Go, je n'aperçois que quelques Mo de surplus au chargement des données dans le cube OLAP.
    Je précise qu'il s'agit s'un mode de stockage MOLAP donc que les données sont effectivement dupliquées.
    Je suis bien conscient que les données peuvent être comprimées mais je trouve le gain un peu énorme (vous me direz tant mieux).
    J'ai cependant peur d'avoir loupé quelque chose alors si quelqu'un peut me dire le rapport de gain attendu en coût de stockage OLAP, je l'en remercie d'avance.
    P.S Je travaille avec le module Analysis Service de SQL Server

  2. #2
    Rédacteur

    Homme Profil pro
    Consultant / formateur Oracle et SQL Server
    Inscrit en
    Décembre 2002
    Messages
    3 460
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Var (Provence Alpes Côte d'Azur)

    Informations professionnelles :
    Activité : Consultant / formateur Oracle et SQL Server

    Informations forums :
    Inscription : Décembre 2002
    Messages : 3 460
    Points : 8 074
    Points
    8 074
    Par défaut
    Bonjour

    Bon, on va supposer que vous avez non seulement défini votre cube, mais que vous l'avez aussi réellement "exécuté", donc calculé et rempli.

    Tout dépend de ce que vous avez mis dedans. Quelle portion de données OLTP prenez-vous initialement, et quel est le niveau de vos données détaillées ? Combien y a-t-il de valeurs différentes dans vos dimensions ? Combien avez-vous de dimensions ? Sont-elles hiérarchisées ou plates ?

    Si vous travaillez uniquement à un niveau très agrégé, avec peu de valeurs dans les dimensions, il peut être tout à fait normal que votre cube soit très peu volumineux.
    Consultant / formateur Oracle indépendant
    Certifié OCP 12c, 11g, 10g ; sécurité 11g

    Ma dernière formation Oracle 19c publiée sur Linkedin : https://fr.linkedin.com/learning/oracle-19c-l-administration

  3. #3
    Membre régulier
    Profil pro
    Inscrit en
    Mai 2003
    Messages
    51
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Mai 2003
    Messages : 51
    Points : 93
    Points
    93
    Par défaut
    Bonjour Pomalaix et merci de t'intéresser au problème,
    J'ai 6 dimensions dans mon cube répartis sur cinq tables de dimensions plates (modèle en étoile).
    Les tables de dimensions sont peu volumineuses (pour OLAP) un maximum de 400 000 lignes pour la table Contact. Par contre, la table de faits pèse quand même 300 millions de lignes.
    J'ai choisi le stockage MOLAP et si j'ai bien compris, il stocke toutes les données détaillées des tables dans le cube (à la différence de ROLAP et HOLAP). C'est pour cela que je suis étonné de constater que le coût de stockage est négligeable : 7 Mo pour 300 millions de lignes !
    Je précise qu'il n'y a pas beaucoup de colonnes dans la table de faits (uniquement 6 clés et 4 mesures) et que leurs tailles sont réduites mais tout de même.
    Au niveau des dimensions, elles sont aussi simples avec environ 4 niveaux.
    Mais bon, si vous me dites que c'est normal après tout tant mieux.
    Je suis juste surpris.

  4. #4
    Rédacteur

    Homme Profil pro
    Consultant / formateur Oracle et SQL Server
    Inscrit en
    Décembre 2002
    Messages
    3 460
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Var (Provence Alpes Côte d'Azur)

    Informations professionnelles :
    Activité : Consultant / formateur Oracle et SQL Server

    Informations forums :
    Inscription : Décembre 2002
    Messages : 3 460
    Points : 8 074
    Points
    8 074
    Par défaut
    Attention, je ne dis pas que C'EST normal, je ne suis pas dans vos données.
    Je dis juste que ça peut l'être parfois, du fait du principe même de l'agrégation, dont l'effet réducteur dépend de la granularité et du nombre des dimensions combinées.

    Illustration numérique :
    Disons qu'on a une table de faits décrivant des ventes, de 100 millions de lignes occupant chacune 50 octets, soit donc 5 Go pour la table de faits.
    On va examiner le chiffre d'affaires en fonction de la date (niveau jour, semaine ou mois), du rayon (20 rayons différents) et du magasin (5 magasins).
    Au niveau le plus détaillé, on stockera donc 365*20*5 soit 36500 valeurs. Si on suppose que chaque cellule du cube, dans ces conditions, prend 50 octets de stockage, on occupe 1,8 Mo.
    Dans l'hypothèse où on précalcule les agrégats en ne descendant qu'au niveau de la semaine, et non plus du jour, on divise encore le volume par 7.
    Si de plus on prend en compte une compression automatique des données et un traitement intelligent des cellules creuses dans le cube, on peut donc avoir des cubes très petits au regard de la table de faits initiale.

    J'espère que ça vous permettra de juger si votre situation est normale ou pas.
    Consultant / formateur Oracle indépendant
    Certifié OCP 12c, 11g, 10g ; sécurité 11g

    Ma dernière formation Oracle 19c publiée sur Linkedin : https://fr.linkedin.com/learning/oracle-19c-l-administration

  5. #5
    Membre régulier
    Profil pro
    Inscrit en
    Mai 2003
    Messages
    51
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Mai 2003
    Messages : 51
    Points : 93
    Points
    93
    Par défaut
    merci de ton exemple, c'est maintenant beaucoup plus clair dans mon esprit.

  6. #6
    Membre régulier
    Profil pro
    Inscrit en
    Mai 2003
    Messages
    51
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Mai 2003
    Messages : 51
    Points : 93
    Points
    93
    Par défaut
    un affreux doute m'envahit soudain.
    Les données ne sont pas réelles. En effet, pour juger des performances sur de grands jeux de données, j'ai dupliqué plusieurs fois mes données existantes. Est-il possible que l'ordinateur en profite pour effectuer des optimisations qui ne sont pas possibles d'habitude?

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Réponses: 0
    Dernier message: 10/11/2009, 10h46
  2. Olap pour le stockage
    Par wxcvbn123456 dans le forum Décisions SGBD
    Réponses: 1
    Dernier message: 09/06/2006, 17h28
  3. Modelisation OLAP
    Par Guizz dans le forum MS SQL Server
    Réponses: 2
    Dernier message: 17/06/2003, 10h11
  4. [Stockage] Image dans un fichier XML
    Par ovh dans le forum XML/XSL et SOAP
    Réponses: 4
    Dernier message: 30/04/2003, 16h21
  5. [Concept] Datawarehouse et OLAP
    Par senke dans le forum Alimentation
    Réponses: 6
    Dernier message: 30/03/2003, 00h54

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo