IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Optimisations SGBD Discussion :

Aide pour concevoir schema optimal


Sujet :

Optimisations SGBD

  1. #1
    Membre régulier
    Profil pro
    Inscrit en
    Mai 2009
    Messages
    212
    Détails du profil
    Informations personnelles :
    Localisation : Belgique

    Informations forums :
    Inscription : Mai 2009
    Messages : 212
    Points : 71
    Points
    71
    Par défaut Aide pour concevoir schema optimal
    Bonjour voici ma demande :
    SGBD : Postgres
    Besoin : Des entités personnes ont une série de propriétés (environ 100) (Nationalité,catégorie,...) avec historique (start - end date)
    Volumétrie : Millions de lignes . Environ 500k personnes avec chacun leur historique de propriétés.
    Objectif : en un instant T , retrouver l'ensemble des propriétés d'une personne. Retrouver toutes les personnes d'une même nationalité,Etc.


    En un instant t une personne possède une seule propriété par type de proriété, donc une nationalité , et une catégorie.
    Imaginons que dans le temps cette personne puisse changer de nationalité, de catégorie, etc.
    Chaque propriété peut être modifiée indépendament des autres.

    Je pensais faire une table personne, une table nationalité, une table catégorie,etc + une table A reprenant : id_personne,id_nationalite,id_categorie,start_date,end_date.

    Ce qui implique qu'à chaque changement pour une propriété, on ajoute une ligne dans la table A.
    La table A aura donc un gros volume , avec 100 foreign keys.
    On devrait indexer chacune des 100 colonnes afin de pouvoir retrouver rapidement , par exemple , toutes les personnes de nationalité française.
    Cela engendre donc des indexes de volumes important.

    Selon vous, un tel schema est-il viable, performant?
    J'ai peur que le volume de la table A croisse trop rapidement.

    Autre possibilité, des tables de jointures entre personne et chaque propriété avec id_personne,id_propriété,date_start,date_end
    Ce qui impliquerait énormément de jointures.

    Le but est bien sûr d'avoir de bonnes performances de requêtes.

    Que suggereriez-vous comme schema?

    Merci d'avance !

  2. #2
    Membre expert
    Avatar de Spartacusply
    Homme Profil pro
    Développeur Web
    Inscrit en
    Mai 2011
    Messages
    1 723
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Loire Atlantique (Pays de la Loire)

    Informations professionnelles :
    Activité : Développeur Web
    Secteur : High Tech - Multimédia et Internet

    Informations forums :
    Inscription : Mai 2011
    Messages : 1 723
    Points : 3 274
    Points
    3 274
    Par défaut
    Hello !

    La première solution n'est pas la bonne, elle implique une création de ligne à chaque changement de propriété, dupliquant ainsi celles qui n'ont pas bougé, ce qui d'un point de vue normalisation est incorrecte.

    La deuxième n'est pas mauvaise mais mérite d'être complétée.

    Ce que je peux te recommande dans ce cas là, c'est de bien différencier l'état actuel d'une personne (à cet instant même, récupère moi toutes les informations d'une personne) et l'historique d'une personne.
    De manière générale, on accède beaucoup plus souvent à l'état actuel (le rendu doit donc être quasiment instantané), qu'à l'historique, qui lui peut être rendu un peu moins rapidement.

    Ce que je veux te faire dire, c'est que l'état actuel d'une personne, doit se trouver dans la table de cette personne, ne pas en être désolidariser :

    id_personne | nom | prenom | id_categorie| id nationalite
    1 | Martin | Mélanie | 3 | 4

    Ceci permet de retourner l'état actuel d'une personne.

    Pour l'historisation d'une personne, tu peux avoir une table 'historique_personne', qui comprend quelque chose comme ça :

    id_historique_personne | id_personne | colonne | value | date_start |date_end
    1 | 1 | nom | Dupont | 2012-03-09 | 2012-05-09

    Tu sais que Madame Martin s'appelait en fait auparavant Dupont (date_start peut-être vide si c'est depuis toujours, date_end est obligatoirement non NULL). Etant donné qu'on ne change pas de nom tous les jours, ça passe sans problème, et tu peux retrouver tes billes rapidement.
    Un message utile vous a aidé ? N'oubliez pas le

    www.simplifions.fr - Simplifier vos comptes entre amis !

  3. #3
    Modérateur

    Profil pro
    dba
    Inscrit en
    Janvier 2010
    Messages
    5 643
    Détails du profil
    Informations personnelles :
    Localisation : France, Rhône (Rhône Alpes)

    Informations professionnelles :
    Activité : dba

    Informations forums :
    Inscription : Janvier 2010
    Messages : 5 643
    Points : 13 092
    Points
    13 092
    Par défaut
    Bonjour,

    Voici un peu de lecture sur la sixième forme normale qui semble adaptée à votre cas.

  4. #4
    Rédacteur

    Avatar de SQLpro
    Homme Profil pro
    Expert bases de données / SQL / MS SQL Server / Postgresql
    Inscrit en
    Mai 2002
    Messages
    21 770
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Var (Provence Alpes Côte d'Azur)

    Informations professionnelles :
    Activité : Expert bases de données / SQL / MS SQL Server / Postgresql
    Secteur : Conseil

    Informations forums :
    Inscription : Mai 2002
    Messages : 21 770
    Points : 52 726
    Points
    52 726
    Billets dans le blog
    5
    Par défaut
    effectivement votre base doit être en 6e FN. En sus, regroupez les attributs par familles pour ne pas avoir des tables trop larges.

    A +
    Frédéric Brouard - SQLpro - ARCHITECTE DE DONNÉES - expert SGBDR et langage SQL
    Le site sur les SGBD relationnels et le langage SQL: http://sqlpro.developpez.com/
    Blog SQL, SQL Server, SGBDR : http://blog.developpez.com/sqlpro
    Expert Microsoft SQL Server - M.V.P. (Most valuable Professional) MS Corp.
    Entreprise SQL SPOT : modélisation, conseils, audit, optimisation, formation...
    * * * * * Expertise SQL Server : http://mssqlserver.fr/ * * * * *

  5. #5
    Membre régulier
    Profil pro
    Inscrit en
    Mai 2009
    Messages
    212
    Détails du profil
    Informations personnelles :
    Localisation : Belgique

    Informations forums :
    Inscription : Mai 2009
    Messages : 212
    Points : 71
    Points
    71
    Par défaut
    Salut, merci pour ces infos ! Je vais y jeter un oeil

Discussions similaires

  1. Aide pour concevoir un petit jeu en C
    Par samy100 dans le forum Projets
    Réponses: 11
    Dernier message: 30/10/2019, 11h22
  2. [WD12] Demande d'aide pour concevoir ma requête
    Par tom06440 dans le forum WinDev
    Réponses: 9
    Dernier message: 01/06/2008, 16h46
  3. Demande d'aide pour concevoir un algo de routage sur un graphe.
    Par condor_01 dans le forum Algorithmes et structures de données
    Réponses: 3
    Dernier message: 12/11/2007, 12h02
  4. Réponses: 5
    Dernier message: 08/01/2004, 16h48

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo