-
Optimisation requete
Bonjour,
je suis entrain de travailler sur une optimisation de ma base en postgres.
dans cette base je dispose d'une table de 55 champs et qui fait actuellement plus de 2 000 000 d'enregistrement.
le moindre select prendre aujourd'hui une infinité.
j'ai crée un index sur les champs que j'utilise pour mes requetes,
avez vous d'autre conseil pour optimizer le traitement
Merci
Mic
-
C'est trop vague :?
Peux-tu donner plus de renseignements sur ta table et ses (types de) données, les requêtes que tu effectues dessus, les index que tu as créés...
Dans l'absolu, la seule chose que je peux te conseiller, c'est de vérifier les plans de tes requêtes avec la syntaxe EXPLAIN (http://www.postgresql.org/docs/8.0/i...l-explain.html).
Tu peux aussi jeter un oeil dans les techdocs : http://techdocs.postgresql.org/#techguides
-
les champs dans ma table sont des int car il s'agit des identifiants d'autre tables
concernant les index je les ai créer ainsi :
create index vueidannonceur on idannonceur(id_annonceur);
concernant les requetes, il s'agit de select distinc ou des calculs via la fonction sum
je vais jeter un coup d'oeil sur le explain
-
fait aussi un vacuum analyse de ta base.
- eviter les requetes imbriquées au maximum car ca fait ramer à fond.
- autant faire deux requetes simple qu'une requete imbriquées si possible.
- eviter les requetes "like ' toto' " si possible
-
'lut,
je realise juste un delect distinct sur un champs, c du numéric sur lequel j'y ai mi un index. j'ai ma requete en 3 minutes sur une table de plus de 2 millions d'enregistrements.
on peut faire mieux ou pas ?
-
Bonjour,
Un select distinct est quand même sévère pour ce volume de données. Tu aurais tout à gagner à faire un simple select éventuellement avec une clause where sur un deuxième champ si c'est possible. Dans ce cas il faut bien entendu redéfinir correctement les index.
D'autre part il faut faire la commande ANALYZE après avoir positionné le ou les index.
Si les données changent peu souvent tu pourrais également essayer la commande CLUSTER qui réorganise une table en fonction d'un index. Attention toutefois à cette commande qui verrouille complètement la table pendant l'opération, vu la volumétrie.
-
ok, je viens de modifier ma requete, d'un distinct je suis passe par un group by & order by, resultat je passe de 20s à 3s
merci les gars