IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Requêtes PostgreSQL Discussion :

Delete sur une grande table


Sujet :

Requêtes PostgreSQL

  1. #1
    Futur Membre du Club
    Homme Profil pro
    Doctorant
    Inscrit en
    Avril 2012
    Messages
    7
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Orne (Basse Normandie)

    Informations professionnelles :
    Activité : Doctorant
    Secteur : Agroalimentaire - Agriculture

    Informations forums :
    Inscription : Avril 2012
    Messages : 7
    Points : 7
    Points
    7
    Par défaut Delete sur une grande table
    Bonjour,

    Je voudrais effectuer la requête :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    delete from "point" where grid not in (select id from gridmeasure).
    La table "point" contient 56000000 de lignes et dispose d'un index sur la colonne "grid" et d'une colonne geometry.

    Temps d’exécution de la requête incomplete) >17h

    J'ai effectué la même requête sur un échantillon de 1000000 de lignes et je l'ai arrêté après un temps d'exécution > 2h22

    Sauriez vous comment optimiser l'exécution de cette requête? Merci d'avance.

  2. #2
    Expert confirmé
    Homme Profil pro
    Inscrit en
    Mai 2002
    Messages
    3 173
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 41
    Localisation : France, Rhône (Rhône Alpes)

    Informations forums :
    Inscription : Mai 2002
    Messages : 3 173
    Points : 5 345
    Points
    5 345
    Par défaut
    Bonjour,

    Est-ce que vos stats sont à jour ? (analyze table_name)

    Le delete va supprimer combien de lignes (en % approximatif) ?
    => Si c'est un gros volume alors il serai interessant de passer par une création d'une table temporaire en ne gardant dedans que les données voulu puis de dropper / truncate la table initiale.


    => Si ça n'est pas le cas, enlevez tous les autres index (voir même l'index sur grid s'il n'est pas utilisé) avant de faire votre delete.

    => Est-ce que la colonne id de gridmeasure est une pk / indéxé ?


    D'un point de vu générale, pourquoi avez-vous des lignes dans la table point non référencées dans la table gridmeasure ? Vous n'utilisez pas les foreign key ?

  3. #3
    Rédacteur

    Avatar de SQLpro
    Homme Profil pro
    Expert bases de données / SQL / MS SQL Server / Postgresql
    Inscrit en
    Mai 2002
    Messages
    21 766
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Var (Provence Alpes Côte d'Azur)

    Informations professionnelles :
    Activité : Expert bases de données / SQL / MS SQL Server / Postgresql
    Secteur : Conseil

    Informations forums :
    Inscription : Mai 2002
    Messages : 21 766
    Points : 52 561
    Points
    52 561
    Billets dans le blog
    5
    Par défaut
    Il aurait été bien plus intéressant de faire ces delete en temps réel au fil de l'eau.

    mais maintenant que vous êtes dans le mouise, quelques recettes :
    1) désactivez tous les index non sémantiques et inutile pour votre requête, avant delete et recréez les après
    2) désactivez toutes les contraintes inutiles (sauf PK) et recréez les après

    Déjà ceci devrait diminuer singulièrement le temps de traitement.

    Ensuite : procédez par lot pour éviter un engorgement transactionnel plutôt que de passer par une table temporaires. par exemple par lot de 100 000 lignes jusqu'à plus soif.

    Vous devriez arriver en principe à diviser par 2 à 10 le traitement.

    A +
    Frédéric Brouard - SQLpro - ARCHITECTE DE DONNÉES - expert SGBDR et langage SQL
    Le site sur les SGBD relationnels et le langage SQL: http://sqlpro.developpez.com/
    Blog SQL, SQL Server, SGBDR : http://blog.developpez.com/sqlpro
    Expert Microsoft SQL Server - M.V.P. (Most valuable Professional) MS Corp.
    Entreprise SQL SPOT : modélisation, conseils, audit, optimisation, formation...
    * * * * * Expertise SQL Server : http://mssqlserver.fr/ * * * * *

  4. #4
    Membre émérite
    Profil pro
    Inscrit en
    Octobre 2008
    Messages
    1 874
    Détails du profil
    Informations personnelles :
    Localisation : France, Paris (Île de France)

    Informations forums :
    Inscription : Octobre 2008
    Messages : 1 874
    Points : 2 890
    Points
    2 890
    Par défaut balise code, !smiley
    On va supposer que les id en question ne peuvent pas être à NULL.
    Suivant le cas, une simple réécriture comme ceci peut éventuellement résoudre le pb de performance:

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    delete from "point" p where not exists (select id from gridmeasure where id=p.grid)
    Il se peut que ça génère un plan d'éxécution à base d'anti-join, qui sera certainement plus efficace que l'autre, si gridmeasure est une table beaucoup plus petite que point.
    A tester.

    Sinon il y a aussi une autre version possible avec un LEFT JOIN en sous-requête pour sortir les IDs qui sont dans une table et pas dans l'autre. Ca peut aussi donner un plan plus efficace suivant la situation.

    Mais en règle générale, il faudrait poster le résultat d'EXPLAIN de la requête pour avoir des conseils plus éclairés.

  5. #5
    Futur Membre du Club
    Homme Profil pro
    Doctorant
    Inscrit en
    Avril 2012
    Messages
    7
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Orne (Basse Normandie)

    Informations professionnelles :
    Activité : Doctorant
    Secteur : Agroalimentaire - Agriculture

    Informations forums :
    Inscription : Avril 2012
    Messages : 7
    Points : 7
    Points
    7
    Par défaut
    Salut,

    Merci pour ces différentes réponses. Je les traiterai une par une et je vous dirais ce qu'il en est.

    Cordialement.

Discussions similaires

  1. Avoir les 4 derniers résultats sur une grande table
    Par Sam31000 dans le forum Requêtes
    Réponses: 5
    Dernier message: 22/08/2012, 13h52
  2. Une grande table ou répartition sur plusieurs?
    Par jumanji34 dans le forum Administration
    Réponses: 2
    Dernier message: 13/08/2009, 19h12
  3. delete conditionnel sur une autre table?
    Par bylka dans le forum Requêtes
    Réponses: 1
    Dernier message: 05/06/2009, 12h48
  4. Réponses: 17
    Dernier message: 07/06/2007, 14h25
  5. probleme de delete sur une table avec somation
    Par galaad666 dans le forum Langage SQL
    Réponses: 5
    Dernier message: 23/10/2006, 16h44

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo