IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Administration PostgreSQL Discussion :

[postgreSql 9.0.4] degradation performance update


Sujet :

Administration PostgreSQL

  1. #1
    Membre régulier
    Profil pro
    Inscrit en
    Mars 2007
    Messages
    254
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Mars 2007
    Messages : 254
    Points : 80
    Points
    80
    Par défaut [postgreSql 9.0.4] degradation performance update
    Bonjour
    Je suis à la recherche de pistes d'optimisation serveur pour le cas suivant:

    Update en boucle "par colonne" de table ayant 70 colonnes et 700 000 enregistrements.
    Scénario:
    La table cible est tronquée, puis initialisation (insert) de l'identifiant de "PK". Ensuite le reste de colonnes est traité en boucle.

    Le traitement de chaque colonne consiste à :
    • récupérer sa valeur dans une table source
    • effectuer une série de tests/transformations
    • transférer la valeur finale dans la colonne correspondante de table cible

    Problème : le temps du traitement de chaque colonne s'allonge au fur et mesure d'avancement (x 10 à la fin).
    Ceci doit s'expliquer par le réarrangement des données dans la page suite au rallongement des enregistrements.

    Serait-il possible de mieux gérer ce stockage initial, via quel paramètre ?

    Merci d'avance
    msomso

    P.S.
    En PJ le fichier log du traitement en cours
    Fichiers attachés Fichiers attachés

  2. #2
    Membre émérite
    Profil pro
    Inscrit en
    Octobre 2008
    Messages
    1 874
    Détails du profil
    Informations personnelles :
    Localisation : France, Paris (Île de France)

    Informations forums :
    Inscription : Octobre 2008
    Messages : 1 874
    Points : 2 890
    Points
    2 890
    Par défaut
    Citation Envoyé par msomso Voir le message
    Problème : le temps du traitement de chaque colonne s'allonge au fur et mesure d'avancement (x 10 à la fin).
    Ceci doit s'expliquer par le réarrangement des données dans la page suite au rallongement des enregistrements.
    S'il s'agit de ça, le paramètre qui peut aider est le FILLFACTOR de la table et des index associés.
    Ceci étant la mise à jour multiple d'une même ligne colonne par colonne est une stratégie pas du tout optimale. Le mieux serait de changer l'algorithme pour grouper les colonnes dans le même ordre UPDATE.

  3. #3
    Membre régulier
    Profil pro
    Inscrit en
    Mars 2007
    Messages
    254
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Mars 2007
    Messages : 254
    Points : 80
    Points
    80
    Par défaut
    Bjr
    Merci bien c'est exactement ce que je voudrais tester.
    Sauriez-vous, comment identifier les enregistrements chainés ?

    msomso

  4. #4
    Membre émérite
    Profil pro
    Inscrit en
    Octobre 2008
    Messages
    1 874
    Détails du profil
    Informations personnelles :
    Localisation : France, Paris (Île de France)

    Informations forums :
    Inscription : Octobre 2008
    Messages : 1 874
    Points : 2 890
    Points
    2 890
    Par défaut
    Il n'y a pas à ma connaissance d'enregistrements chainés. Je sais que ça existe dans d'autres SGBD comme Oracle mais pas postgres, qui utilise un autre mécanisme qui s'appelle TOAST pour les champs qui prennent beaucoup de place.
    En revanche lorsqu'une ligne est mise à jour, l'intégralité de la ligne est recopiée ailleurs pour en faire une nouvelle version. C'est le mécanisme MVCC pour permettre des lectures concurrentes de données qui n'ont pas la même valeur d'une transaction à l'autre.
    Ensuite les anciennes versions des lignes sont recyclées par auto-vacuum, mais ça n'empêche pas les données utiles d'être éparpillées. C'est pourquoi mettre à jour une même ligne en plusieurs UPDATE est mauvais pour les perfs.

  5. #5
    Rédacteur

    Avatar de SQLpro
    Homme Profil pro
    Expert bases de données / SQL / MS SQL Server / Postgresql
    Inscrit en
    Mai 2002
    Messages
    21 772
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Var (Provence Alpes Côte d'Azur)

    Informations professionnelles :
    Activité : Expert bases de données / SQL / MS SQL Server / Postgresql
    Secteur : Conseil

    Informations forums :
    Inscription : Mai 2002
    Messages : 21 772
    Points : 52 735
    Points
    52 735
    Billets dans le blog
    5
    Par défaut
    1) dans ce genre de traitement ligne à ligne il est normale que le système ralentisse au fur et à mesure de l'avancement dans le traitement des lignes, car un SGBDR n'étant pas fait pour ce genre de traitement, vous l'utilisez à l'envers (en le dégradant sciemment).
    Essayez donc de faire ces traitements de manière ensembliste en adoptant la stratégie suivante :
    1.1 créer une fonction qui fait toutes les transformation de manière unitaire
    1.2 encapsulez cette fonction dans l'UPDATE ensembliste

    2) désactivez tous les index avant de réaliser votre traitement,sauf l'index sous-jacent à la clef primaire, puis reconstruisez les en fin de traitement.

    A +
    Frédéric Brouard - SQLpro - ARCHITECTE DE DONNÉES - expert SGBDR et langage SQL
    Le site sur les SGBD relationnels et le langage SQL: http://sqlpro.developpez.com/
    Blog SQL, SQL Server, SGBDR : http://blog.developpez.com/sqlpro
    Expert Microsoft SQL Server - M.V.P. (Most valuable Professional) MS Corp.
    Entreprise SQL SPOT : modélisation, conseils, audit, optimisation, formation...
    * * * * * Expertise SQL Server : http://mssqlserver.fr/ * * * * *

Discussions similaires

  1. [MySQL] Performance Update PHP dans une boucle
    Par tutomania dans le forum PHP & Base de données
    Réponses: 11
    Dernier message: 03/07/2014, 15h03
  2. Réponses: 11
    Dernier message: 21/06/2012, 17h05
  3. Performance Update ?
    Par D_light dans le forum Oracle
    Réponses: 18
    Dernier message: 12/01/2008, 09h41
  4. Problème de performance Update de 60 mille lignes.
    Par ludvax dans le forum Oracle
    Réponses: 15
    Dernier message: 03/07/2006, 10h41
  5. [ POSTGRESQL ] Problème de performance
    Par Djouls64 dans le forum PostgreSQL
    Réponses: 6
    Dernier message: 26/05/2003, 16h18

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo