Bonjour à tous.
Dans de la doc sur l'OLAP et la modélisation multidimensionnelle, je suis tombé sur la notion de table d'agrégat, qui fait manifestement défaut à mes connaissances du domaine.
Or, je travaille actuellement sur une base de données issue de la gestion des payes de salariés, et on me demande régulièrement d'extraire des statistiques, comme les montants moyen/global versés selon une multitude de dimensions (age, CSP, l'ancienneté dans l'entreprise, etc).
Le modèle de la base se prête plutôt bien à ce genre de requête, sauf que vu la volumétrie (+/- 100 millions d'enregistrements de paye), les performances sont médiocres.
Je me suis donc dit qu'une table d'agrégat devait être faite pour ce genre de situation, non ?
Sauf qu'après reflexion, je ne vois pas ce que je peux précalculer, étant donné que je ne sais pas à l'avance selon quelles dimensions il me faudra calculer les statistiques... En fait, à part un aggrégat sur le temps (moyenne et somme payée à un employé par mois et par an), je ne vois ce que je calculer d'autre à l'avance sans être confronté par la suite à un soucis de granularité.
Suis-je à côté de la plaque ?
Est-ce le domaine dans lequel je travaille qui ne se prête pas à ça ?
D'une manière plus générale, il me semble que dans la modélisation d'un entrepôt de données, on choisit justement une granularité fine pour satisfaire à toute demande. Donc j'en arrive à la question du titre : que mettre dans une table d'agrégat ??
Partager