IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Optimisations SGBD Discussion :

Performances sur très grosse table


Sujet :

Optimisations SGBD

  1. #1
    Modérateur

    Avatar de CinePhil
    Homme Profil pro
    Ingénieur d'études en informatique
    Inscrit en
    Août 2006
    Messages
    16 799
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 60
    Localisation : France, Haute Garonne (Midi Pyrénées)

    Informations professionnelles :
    Activité : Ingénieur d'études en informatique
    Secteur : Enseignement

    Informations forums :
    Inscription : Août 2006
    Messages : 16 799
    Points : 34 031
    Points
    34 031
    Billets dans le blog
    14
    Par défaut Performances sur très grosse table
    Bonjour,
    J'ai quelques inquiétudes sur la future utilisation de la base de données que je suis en train de mettre en place.

    Plusieurs tables font plusieurs dizaines de millions de lignes.

    J'en suis à peu près à la moitié du travail d'importation des données dans le modèle normalisé que j'ai créé. J'ai commencé à faire quelques interrogations et je suis inquiet de la lenteur de requêtes simples par rapport aux futurs traitements statistiques qui devront être faits.

    Par exemple, un simple SELECT COUNT(DISTINCT colonne) sur une colonne clé étrangère indexée prend 5 minutes sur une table de 67 millions de lignes.

    Est-ce normal ou choquant ?
    Y-a t-il moyen de baisser ce temps de réponse ?

    Les tables sont en MyIsam (nous n'avons pas besoin de contraintes de clés étrangères car les données ne seront pas modifiées, même si le modèle est normalisé avec des clés étangères).

    Pour le moment, je travaille sur un portable à processeur Intel Core duo à 2,20 GHz et 2Go de mémoire.

    MySQL est en version 4.1.9-max et installé par EasyPHP sans avoir changé la configuration, à part les timeout.

    Le serveur actuel est plus puissant et nous devrions bientôt en avoir un autre. Voici les caractéristiques du serveur actuel :
    Caractéristiques du serveur

    processeur : XEON 5160 bi-processeur double coeur 3GHz/4MB cache
    Mémoire : 8 GB 667 MHz (4x2GB dual rank DIMMs)
    Disque Dur : 3 disques durs de 300 GB SAS (10000 rpm)
    Philippe Leménager. Ingénieur d'étude à l'École Nationale Supérieure de Formation de l'Enseignement Agricole. Autoentrepreneur.
    Mon ancien blog sur la conception des BDD, le langage SQL, le PHP... et mon nouveau blog sur les mêmes sujets.
    « Ce que l'on conçoit bien s'énonce clairement, et les mots pour le dire arrivent aisément ». (Nicolas Boileau)
    À la maison comme au bureau, j'utilise la suite Linux Mageïa !

  2. #2
    Membre éclairé

    Profil pro
    Inscrit en
    Mai 2005
    Messages
    414
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Mai 2005
    Messages : 414
    Points : 671
    Points
    671
    Par défaut
    faire un count sur un distinct implique des opérations de tri et de suppression de doublons sur l'ensemble des données . Ces opérations sont couteuses pour tout SGBD

    Le temps me choque donc pas sur plusieurs dizaines de millions de lignes

  3. #3
    Membre éprouvé
    Avatar de Sivrît
    Profil pro
    Inscrit en
    Février 2006
    Messages
    953
    Détails du profil
    Informations personnelles :
    Âge : 42
    Localisation : France, Paris (Île de France)

    Informations forums :
    Inscription : Février 2006
    Messages : 953
    Points : 1 249
    Points
    1 249
    Par défaut
    Citation Envoyé par gregory.broissard Voir le message
    faire un count sur un distinct implique des opérations de tri et de suppression de doublons sur l'ensemble des données . Ces opérations sont couteuses pour tout SGBD

    Le temps me choque donc pas sur plusieurs dizaines de millions de lignes
    Comme il y a un index sur la colonne ça ne devrait pas être si défavorable que ça puisque tout est déjà trié...

    D'un autre côté avec des tables de cette taille toute opération qui concerne toute la table ne sera pas instantanée. Les accès disques seront certainement le facteur limitant alors avec un disque dur anorexique de portable c'est presque un bon temps

    Eventuellement il y aurait moyen de jouer sur le paramètre key_buffer_size. Sa valeur par défaut doit être de 8Mo ce qui ne servira pas à grand chose avec ces volumes. Ce serait bon à prendre d'arriver à garder les indexes en mémoire au moins, mais même ça va être difficile (du moins sur un portable avec 2Go de RAM).

Discussions similaires

  1. Recherche sur de grosses tables très lentes
    Par webapi dans le forum Requêtes
    Réponses: 32
    Dernier message: 31/07/2013, 08h36
  2. Souci de performance sur des grosses tables - optimisation possible ?
    Par patate_violente dans le forum Administration
    Réponses: 3
    Dernier message: 07/08/2011, 09h16
  3. Quellue interface pour travailler sur une grosse table ?
    Par grinder59 dans le forum MS SQL Server
    Réponses: 4
    Dernier message: 22/12/2006, 16h25
  4. Update trés lent sur une grosse table
    Par neo.51 dans le forum Oracle
    Réponses: 21
    Dernier message: 14/12/2005, 11h06
  5. Problème de performance sur une "grosse" BD
    Par frechy dans le forum Installation
    Réponses: 9
    Dernier message: 19/09/2005, 16h52

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo