IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Administration Oracle Discussion :

Optimisation d'une table volumineuse


Sujet :

Administration Oracle

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Membre éprouvé
    Avatar de dtateur
    Inscrit en
    Mars 2004
    Messages
    106
    Détails du profil
    Informations forums :
    Inscription : Mars 2004
    Messages : 106
    Par défaut Optimisation d'une table volumineuse
    Bonjour,

    Nous avons une table contenant aujourd'hui 10 Millions de lignes.
    Cette table grossit d'environs 2 Millions de lignes par mois.
    Voici la structure de ma table :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
     
    Name                              Type
     ----------------------------- -------- -------------------
    TABLE_ID                           NUMBER(10)
    TABLE_DATE                       DATE
    COLUMN_A                         VARCHAR2(100)
    COLUMN_B                         VARCHAR2(100)
    COLUMN_C                         VARCHAR2(10)
    COLUMN_D                         VARCHAR2(30)
    COLUMN_E                         VARCHAR2(50)
    COLUMN_F                         VARCHAR2(30)
    COLUMN_G                         VARCHAR2(50)
    COLUMN_H                         VARCHAR2(30)
    COLUMN_I                          VARCHAR2(30)
    Nous avons un écran de recherche permettant de requêter cette table.
    A partir cet écran, nous pouvons faire une recherche sur n'importe quelles colonnes de cette table.
    Voici des exemples de requêtes :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
     
    SELECT * FROM MA_TABLE WHERE COLUMN_A = 'valeura' AND COLUMN_B = 
    'valeurb' AND COLUMN_I IN ('val1', 'val2', 'val3', 'val4');
     
    SELECT * FROM MA_TABLE WHERE COLUMN_B = 'valeurb' AND COLUMN_E IN ('val10', 'val20', 'val30', 'val40');
     
    SELECT * FROM MA_TABLE WHERE TABLE_DATE between '01-DEC-2013' AND '01-JAN-2014' AND COLUMN_A IN ('vala', 'valb', 'valc', 'vald') AND COLUMN_B = 'valeurb' AND COLUMN_I IN ('val1', 'val2', 'val3', 'val4') AND COLUMN_E IN ('val10', 'val20', 'val30', 'val40') ;
    ...
    Dans l'ensemble, ça marche pas mal, à part une certaine lenteur au niveau des requêtes. Pour info, les requêtes sont générées à partir d'un ORM (Hibernate).

    Nous avons posé des index sur certaines combinaisons pour améliorer le temps d’exécution des requêtes. Mais les requêtes pouvant se faire sur toutes les colonnes indifféremment, nous ne pouvons pas poser des index sur toutes les combinaisons possibles.

    Avez vous des idées pour améliorer les temps d’exécutions des requêtes quel que soit la combinaison de colonnes choisies en critères ?
    Merci de votre aide.

  2. #2
    Rédacteur

    Avatar de SQLpro
    Homme Profil pro
    Expert bases de données / SQL / MS SQL Server / Postgresql
    Inscrit en
    Mai 2002
    Messages
    21 998
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Var (Provence Alpes Côte d'Azur)

    Informations professionnelles :
    Activité : Expert bases de données / SQL / MS SQL Server / Postgresql
    Secteur : Conseil

    Informations forums :
    Inscription : Mai 2002
    Messages : 21 998
    Billets dans le blog
    6
    Par défaut
    Vous avez visiblement un problème de conception....

    1) pourquoi avez-vous nommé vos colonnes COLUMN_A... COLUMN_I ?
    2) avez vous du NULL dans certaines lignes pour vos colonnes COLUMN_A... COLUMN_I ?
    3) allez-vous avoir d'autres colonnes comme COLUMN_J, COLUMN_K, COLUMN_L, ... un de ces jours ?

    Comprenez que plus une table comporte de nombreuses colonnes, plus indexer toutes les combinaisons devient absurde...
    Pour information, dans votre cas, pour répondre à toutes les problématiques d'indexation, il vous faudrait 9 864 100 index !

    La solution est de faire un VRAI modèle relationnel en portant dans des tables vos colonnes parasites. Le volume de données en serait sans doute réduit, l'indexation simple et les performances radicalement efficaces.

    Une croyance malheureuse et imbécile, hélas véhiculées par certains internautes dénués de tout sens critique est de vous faire croire que les jointures c'est mal et c'est pas performant ! C'est bien évidemment tout le contraire, dès que l'on commence à s'interroger sur la volumétrie des données, la concurrence d'accès et bien entendu les performances...
    À lire sur le sujet : http://blog.developpez.com/sqlpro/p1...mances_petites

    Donc, dans votre cas, modélisez comme suit :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    CREATE TABLE MA_GROSSE_TABLE 
    (
    TABLE_ID                           NUMBER(10) NOT NULL PRIMARY KEY,
    TABLE_DATE                       DATE
    );
    CREATE INDEX X_MA_GROSSE_TABLE_DATE_ID 
       ON MA_GROSSE_TABLE (TABLE_DATE, TABLE_ID);
    Puis pour chacune de vos "colonnes" :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    CREATE TABLE MA_GROSSE_TABLE_A 
    (
    TABLE_ID                           NUMBER(10) NOT NULL PRIMARY KEY,
    COLUMN_A                         VARCHAR2(100)
    );
    CREATE INDEX X_MA_GROSSE_TABLE_A_COLA
       ON MA_GROSSE_TABLE_A (COLUMN_A, TABLE_ID);
    A +
    Frédéric Brouard - SQLpro - ARCHITECTE DE DONNÉES - expert SGBDR et langage SQL
    Le site sur les SGBD relationnels et le langage SQL: http://sqlpro.developpez.com/
    Blog SQL, SQL Server, SGBDR : http://blog.developpez.com/sqlpro
    Expert Microsoft SQL Server - M.V.P. (Most valuable Professional) MS Corp.
    Entreprise SQL SPOT : modélisation, conseils, audit, optimisation, formation...
    * * * * * Expertise SQL Server : http://mssqlserver.fr/ * * * * *

  3. #3
    Membre éprouvé
    Avatar de dtateur
    Inscrit en
    Mars 2004
    Messages
    106
    Détails du profil
    Informations forums :
    Inscription : Mars 2004
    Messages : 106
    Par défaut La verité est ailleurs :)
    Merci pour votre réponse.

    1) N’étant pas au travail au moment de la rédaction de mon post, je n'avais le nom exact des colonnes donc j'ai mis COLUMN_A, COLUMN_B, ... pour l'exemple mais mes colonnes ont des vraies noms .
    2) Non je n'ai pas de NULL dans certaines de mes lignes. Toutes mes colonnes sont remplies.
    3) Peut-être. Difficile de savoir comment va évoluer cette table.

    Les colonnes parasites ont déjà été externalisé dans d'autres tables.
    Donc, nous possédons déjà des tables du genre :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
     
    Name                              Type
     ----------------------------- -------- -------------------
    TABLE_ID                           NUMBER(10)
    COLUMN_J                         VARCHAR2(20)
    COLUMN_K                         VARCHAR2(20)
    ...

    Mais, peut-être qu'en transformant chaque colonne de la table principale en table de références, aurons nous de meilleures performances.
    Qu'en pensez-vous ?

  4. #4
    Expert confirmé Avatar de mnitu
    Homme Profil pro
    Ingénieur développement logiciels
    Inscrit en
    Octobre 2007
    Messages
    5 611
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Marne (Champagne Ardenne)

    Informations professionnelles :
    Activité : Ingénieur développement logiciels
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Octobre 2007
    Messages : 5 611
    Par défaut
    Le table_id c’est une clé technique (surogate key). A priori donc votre clé fonctionnelle semble à être la date (colonne table_date). N’est-il pas envisageable d’avoir toujours une dat,e ou mieux dit un intervalle dans vos recherches ?

  5. #5
    Membre éprouvé
    Avatar de dtateur
    Inscrit en
    Mars 2004
    Messages
    106
    Détails du profil
    Informations forums :
    Inscription : Mars 2004
    Messages : 106
    Par défaut
    Non la date n'est pas une clé fonctionnelle. Les utilisateurs peuvent faire des recherches sur n'importe quelles colonnes sans spécifier de dates.

    Mais, on peut imposer la sélection d'une date ou d'un intervalle si cela doit améliorer les performances.
    Mais lors de mes tests, ajouter la date n'améliore pas toujours le temps d'execution.

  6. #6
    Modérateur
    Avatar de Waldar
    Homme Profil pro
    Sr. Specialist Solutions Architect @Databricks
    Inscrit en
    Septembre 2008
    Messages
    8 454
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 47
    Localisation : France, Val de Marne (Île de France)

    Informations professionnelles :
    Activité : Sr. Specialist Solutions Architect @Databricks
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Septembre 2008
    Messages : 8 454
    Par défaut
    Quelle est votre édition d'Oracle Database ?
    Standard, Entreprise ?

Discussions similaires

  1. Réponses: 4
    Dernier message: 03/05/2013, 16h01
  2. Réponses: 9
    Dernier message: 30/05/2012, 16h39
  3. Optimiser une requête ORDER BY sur une table volumineuse
    Par micaz dans le forum Administration
    Réponses: 4
    Dernier message: 19/01/2010, 01h19
  4. Optimisation d'une table
    Par gregal dans le forum Langage SQL
    Réponses: 8
    Dernier message: 16/02/2007, 14h42
  5. Optimisation d'une table
    Par jexl dans le forum SQL Procédural
    Réponses: 2
    Dernier message: 15/12/2005, 13h22

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo