Précédent   Forum des professionnels en informatique > Logiciels > Solutions d'entreprise > Business Intelligence > Conception/Modélisation Décisionnelle
Conception/Modélisation Décisionnelle Forum d'entraide sur la conception de datawarehouse, datamarts et la modélisation décisionnelle : Tables de faits et de dimension, Modèles en étoile ou en flocons, etc.
Partagez cette discussion sur d'autres réseaux sociaux : Viadeo Twitter Google Facebook Digg Delicious MySpace Yahoo
Réponse Proposer ce sujet en actualité
 
Outils de la discussion
Publicité
'
Vieux 14/03/2011, 00h09   #1
Invité régulier
 
Inscription : juillet 2009
Messages : 95
Détails du profil
Informations forums :
Inscription : juillet 2009
Messages : 95
Points : 7
Points : 7
Par défaut Calcul d'indicateurs (ETL ou Analyse)

Bonjour,

Je suis entrain de réaliser mon projet de fin d'étude en informatique décisionnelle, c'est mon premier projet en BI, j'ai un petit point qui reste flou pour moi;
j'ai besoin de faire le suivi d'un certain nombre d'indicateurs, je ne sais pas si le calcul de ces indicateurs doit se faire dans la phase ETL, c'est à dire l'indicateur doit être calculé et stocké dans le datawarehouse (ce que je trouve illogique), ou bien l'indicateur ne va être calculé que dans la phase d'analyse, et dans ce cas on doit se baser sur des mesures pour le calculer, mais quelles sont les mesures qu'on doit stocker dans le datawarehouse, par exemple, le nombre de ressources par fonction, je pense que c'est une mesure qui ne doit être calculées qu'à la phase d'analyse car elle porte sur plusieurs lignes; c'est points restent floux pour moi.

Et merci d'avance.
phenomeno est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 14/03/2011, 15h28   #2
Membre Expert
 
Avatar de Benoit_Durand
 
Benoit Durand
Consultant en Business Intelligence Freelance
Inscription : mars 2005
Messages : 812
Détails du profil
Informations personnelles :
Nom : Benoit Durand
Localisation : France, Gironde (Aquitaine)

Informations professionnelles :
Activité : Consultant en Business Intelligence Freelance

Informations forums :
Inscription : mars 2005
Messages : 812
Points : 1 084
Points : 1 084
Il est possible de faire des tables d'agrégats précalculées par l'etl pour améliorer les perf des analyses et éviter de faire les calculs à chaque fois.
__________________
Pensez à la fonction Recherche
Benoit_Durand est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 14/03/2011, 15h34   #3
Membre émérite
 
Homme Nicolas Saumande
Architecte Décisionnel
Inscription : février 2008
Messages : 693
Détails du profil
Informations personnelles :
Nom : Homme Nicolas Saumande
Âge : 36
Localisation : France, Haute Garonne (Midi Pyrénées)

Informations professionnelles :
Activité : Architecte Décisionnel

Informations forums :
Inscription : février 2008
Messages : 693
Points : 879
Points : 879
Citation:
Envoyé par phenomeno Voir le message
je ne sais pas si le calcul de ces indicateurs doit se faire dans la phase ETL, c'est à dire l'indicateur doit être calculé et stocké dans le datawarehouse (ce que je trouve illogique)
Bonjour,

Je ne sais pas trop si c'est illogique, mais c'est en tous cas ce qu'on fait dans la pratique.
Principalement pour des raisons de perfs, comme le dit Hebus, mais aussi parce que ces indicateurs sont ainsi disponibles pour l'alimentation des datamarts.
(On ne fait le calcul qu'à un endroit, même si plusieurs datamarts l'utilisent)

Nicolas
DevNico est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 14/03/2011, 16h11   #4
Invité régulier
 
Inscription : juillet 2009
Messages : 95
Détails du profil
Informations forums :
Inscription : juillet 2009
Messages : 95
Points : 7
Points : 7
Merci d'abord pour les réponses,

Oui je sui convaincu que le fait de calculer les indicateurs dans la phase ETL ça augmente les perfs du système, je me demande seulement si l'ETL peut faire des calculs sur plusieurs lignes, par exemple le nombre de ressources par fonction ( on a une colonne ressource et une autre pour la fonction de chaque ressource).

Si non, on peut bien faire les calculs des indicateurs dans la partie analyse et les stocker dans des cubes, et donc on a pas besoin de faire le calcul à chaque fois.

Et merci encore.
phenomeno est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 15/03/2011, 13h12   #5
Membre émérite
 
Homme Nicolas Saumande
Architecte Décisionnel
Inscription : février 2008
Messages : 693
Détails du profil
Informations personnelles :
Nom : Homme Nicolas Saumande
Âge : 36
Localisation : France, Haute Garonne (Midi Pyrénées)

Informations professionnelles :
Activité : Architecte Décisionnel

Informations forums :
Inscription : février 2008
Messages : 693
Points : 879
Points : 879
Citation:
Envoyé par phenomeno Voir le message
je me demande seulement si l'ETL peut faire des calculs sur plusieurs lignes, par exemple le nombre de ressources par fonction ( on a une colonne ressource et une autre pour la fonction de chaque ressource).
Oui, tout à fait.
N'importe quel ETL est capable de calculer des indicateurs agrégés.
DevNico est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 15/03/2011, 16h37   #6
Invité régulier
 
Inscription : juillet 2009
Messages : 95
Détails du profil
Informations forums :
Inscription : juillet 2009
Messages : 95
Points : 7
Points : 7
Merci d'abord,


J'ai un autre point flou, je suis entrain de créer mon datawarehouse en SQL Server, je vais travailler par thème (datamart), par exemple j'ai un thème ressources, dans lequel je dois afficher les indicateurs suivants:

-Nombre de ressources par fonction.
-Nombre de ressources par projet.
-Nombre de ressources par date.
-Nombre de ressources par niveau.

Pour ce thème je pense qu'il est suffisant d'avoir (dans le datawarehouse) une seule table qui a les colonnes suivantes:
Ressource, fonction, projet, date, niveau.

Après dans la phase d'analyse, je crée des cubes avec des dimensions prises de cette table et des mesures calculées dans cette phase.

Donc, et c'est ça mon problème, c'est pas la peine de faire un datamart avec des tables de dimensions et une table de fait qui contient des clés étrangères vers ces tables, une seule table peut englober tout.

Et merci encore
phenomeno est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 15/03/2011, 18h13   #7
Membre chevronné
 
Avatar de Jester
 
Inscription : septembre 2003
Messages : 623
Détails du profil
Informations forums :
Inscription : septembre 2003
Messages : 623
Points : 632
Points : 632
C'est des dimension dégénérée. Ce n'est pas un problème en soit, ça reste conceptuellement des dimensions.
Jester est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 19/04/2011, 16h53   #8
Membre régulier
 
Avatar de roxise
 
Inscription : septembre 2009
Messages : 88
Détails du profil
Informations forums :
Inscription : septembre 2009
Messages : 88
Points : 77
Points : 77
en complément : Contexte, Indicateurs et dimensions
Pour faciliter l’interrogation et améliorer les performances, les données sont organisées suivant une structure dite « en étoiles » ou « en cubes ».
La table centrale de l’étoile correspond aux indicateurs. Ce sont les éléments utilisables comme résultats de l’interrogation : somme des factures, nombre , total des règlements, etc.
Les branches de l’étoile sont dénommées dimension. Chaque dimension correspond à un axe d’analyse. Il existe des axes d’analyses typiques comme les axes temps (dates de calcul , dates de règlements, etc) ou les axes géographique (centre ,structure , etc) et des axes d’analyses divers (catégorie , sensibilité, etc).
Chaque étoile du système d’information décisionnel constitue un contexte. Un contexte correspond à un ensemble cohérent d’informations utilisables pour l’interrogation et l’analyse (contexte facturation, contexte encaissement, etc).
Un fait ou indicateur est une information constituant un élément du résultat dans la vue décisionnelle.
Une condition caractéristique descriptive (qualitative ou quantitative) d’entités ; intervient comme critère dans la formulation d’une requête

crldt
__________________
_________________________________________
Science sans conscience n'est que ruine de l'Âme
roxise est déconnecté   Envoyer un message privé Réponse avec citation 00
Réponse Proposer ce sujet en actualité
Outils de la discussion



Fuseau horaire GMT +2. Il est actuellement 19h54.


 
 
 
 
Partenaires

Hébergement Web