Précédent   Forum des professionnels en informatique > Bases de données > Décisions SGBD > Optimisations
Optimisations Forum de conseils pour les optimisations des performances SGBD
Partagez cette discussion sur d'autres réseaux sociaux : Viadeo Twitter Google Facebook Digg Delicious MySpace Yahoo
Réponse Proposer ce sujet en actualité
 
Outils de la discussion
Publicité
'
Vieux 17/09/2008, 10h41   #1
Modérateur
 
Avatar de CinePhil
 
Homme Philippe Leménager
Ingénieur d'études en informatique
Inscription : août 2006
Messages : 11 034
Détails du profil
Informations personnelles :
Nom : Homme Philippe Leménager
Âge : 48
Localisation : France, Haute Garonne (Midi Pyrénées)

Informations professionnelles :
Activité : Ingénieur d'études en informatique
Secteur : Enseignement

Informations forums :
Inscription : août 2006
Messages : 11 034
Points : 18 324
Points : 18 324
Envoyer un message via MSN à CinePhil
Par défaut Performances sur très grosse table

Bonjour,
J'ai quelques inquiétudes sur la future utilisation de la base de données que je suis en train de mettre en place.

Plusieurs tables font plusieurs dizaines de millions de lignes.

J'en suis à peu près à la moitié du travail d'importation des données dans le modèle normalisé que j'ai créé. J'ai commencé à faire quelques interrogations et je suis inquiet de la lenteur de requêtes simples par rapport aux futurs traitements statistiques qui devront être faits.

Par exemple, un simple SELECT COUNT(DISTINCT colonne) sur une colonne clé étrangère indexée prend 5 minutes sur une table de 67 millions de lignes.

Est-ce normal ou choquant ?
Y-a t-il moyen de baisser ce temps de réponse ?

Les tables sont en MyIsam (nous n'avons pas besoin de contraintes de clés étrangères car les données ne seront pas modifiées, même si le modèle est normalisé avec des clés étangères).

Pour le moment, je travaille sur un portable à processeur Intel Core duo à 2,20 GHz et 2Go de mémoire.

MySQL est en version 4.1.9-max et installé par EasyPHP sans avoir changé la configuration, à part les timeout.

Le serveur actuel est plus puissant et nous devrions bientôt en avoir un autre. Voici les caractéristiques du serveur actuel :
Citation:
Caractéristiques du serveur
Citation:

processeur : XEON 5160 bi-processeur double coeur 3GHz/4MB cache
Mémoire : 8 GB 667 MHz (4x2GB dual rank DIMMs)
Disque Dur : 3 disques durs de 300 GB SAS (10000 rpm)
__________________
Philippe Leménager. Ingénieur d'étude à l'École Nationale de Formation Agronomique.
Mon blog sur la conception des BDD, le langage SQL, le PHP avec Zend Framework...
« Ce que l'on conçoit bien s'énonce clairement, et les mots pour le dire arrivent aisément ». (Nicolas Boileau)
À la maison comme au bureau, j'utilise Mandriva Linux ou Mageïa ! Soutenons l'industrie logicielle française !
Linuxiens, comptez-vous !
CinePhil est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 17/09/2008, 14h57   #2
Membre expérimenté
 
Inscription : mai 2005
Messages : 414
Détails du profil
Informations forums :
Inscription : mai 2005
Messages : 414
Points : 589
Points : 589
faire un count sur un distinct implique des opérations de tri et de suppression de doublons sur l'ensemble des données . Ces opérations sont couteuses pour tout SGBD

Le temps me choque donc pas sur plusieurs dizaines de millions de lignes
gregory.broissard est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 17/09/2008, 17h52   #3
Membre Expert
 
Avatar de Sivrît
 
Inscription : février 2006
Messages : 953
Détails du profil
Informations personnelles :
Âge : 30
Localisation : France, Paris (Île de France)

Informations forums :
Inscription : février 2006
Messages : 953
Points : 1 189
Points : 1 189
Citation:
Envoyé par gregory.broissard Voir le message
faire un count sur un distinct implique des opérations de tri et de suppression de doublons sur l'ensemble des données . Ces opérations sont couteuses pour tout SGBD

Le temps me choque donc pas sur plusieurs dizaines de millions de lignes
Comme il y a un index sur la colonne ça ne devrait pas être si défavorable que ça puisque tout est déjà trié...

D'un autre côté avec des tables de cette taille toute opération qui concerne toute la table ne sera pas instantanée. Les accès disques seront certainement le facteur limitant alors avec un disque dur anorexique de portable c'est presque un bon temps

Eventuellement il y aurait moyen de jouer sur le paramètre key_buffer_size. Sa valeur par défaut doit être de 8Mo ce qui ne servira pas à grand chose avec ces volumes. Ce serait bon à prendre d'arriver à garder les indexes en mémoire au moins, mais même ça va être difficile (du moins sur un portable avec 2Go de RAM).
Sivrît est déconnecté   Envoyer un message privé Réponse avec citation 00
Réponse Proposer ce sujet en actualité
Outils de la discussion



Fuseau horaire GMT +2. Il est actuellement 05h57.


 
 
 
 
Partenaires

Hébergement Web