IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

VBA Access Discussion :

Suppression doublons absolus et gros soucis de performance


Sujet :

VBA Access

  1. #1
    Membre du Club
    Homme Profil pro
    Inscrit en
    Juillet 2012
    Messages
    96
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations forums :
    Inscription : Juillet 2012
    Messages : 96
    Points : 47
    Points
    47
    Par défaut Suppression doublons absolus et gros soucis de performance
    Bonsoir,
    J'essaie de supprimer les doublons absolus de ma table principale (contenant 800000 lignes) en suivant le tuto http://sqlpro.developpez.com/cours/doublons/ et la solution de la table temporaire.
    La requête qui reprend le code suivant m'a posé un soucis:
    Code sql : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    DELETE
    FROM T_DOUBLON T1
    WHERE  EXISTS (SELECT *
                   FROM   T_DOUBLON T2
                   WHERE  T1.NUM = T2.NUM
                     AND  T1.NOM = T2.NOM
                     AND  T1.PRENOM = T2.PRENOM
                   GROUP  BY NUM, NOM, PRENOM
                   HAVING COUNT(*) > 1);

    ACCESS a refusé le select "*" au motif que ce n'est pas compatible avec un regroupement.

    J'ai donc essayé de passer outre en modifiant le code selon:
    Code sql : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    DELETE
    FROM T_DOUBLON T1
    WHERE  EXISTS (SELECT NUM, NOM, PRENOM
                   FROM   T_DOUBLON T2
                   WHERE  T1.NUM = T2.NUM
                     AND  T1.NOM = T2.NOM
                     AND  T1.PRENOM = T2.PRENOM
                   GROUP  BY NUM, NOM, PRENOM
                   HAVING COUNT(*) > 1);

    A ce stade, ma requête s’exécute .... mais ça fait 3h maintenant sans la moindre progression notable .. ??:!

    Mes questions sont les suivantes:
    1) L'erreur du SELECT * est normale ?
    2) La piètre performance de ma nouvelle requête est explicable ? (suffit juste d’être patient)

    Merci pour vos conseils,

    David

  2. #2
    Modérateur

    Homme Profil pro
    Inscrit en
    Octobre 2005
    Messages
    15 335
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Canada

    Informations forums :
    Inscription : Octobre 2005
    Messages : 15 335
    Points : 23 793
    Points
    23 793
    Par défaut
    Solution plus simple si tu te moques de celui que tu gardes :

    1. Créer une table temporaire avec un index unique composé de tes 3 éléments.
    2. Faire une requête d'ajout des données dans la table temporaire.
    3. Accepter que la requête s'éxécute malgrès les erreurs.
    4. => Au final tu auras une seule copie des enregistrements en doublon au départ. Tous les doubles suplémentaires auront été rejetés à cause de l'index unique.


    A+
    Vous voulez une réponse rapide et efficace à vos questions téchniques ?
    Ne les posez pas en message privé mais dans le forum, vous bénéficiez ainsi de la compétence et de la disponibilité de tous les contributeurs.
    Et aussi regardez dans la FAQ Access et les Tutoriaux Access. C'est plein de bonnes choses.

  3. #3
    Membre du Club
    Homme Profil pro
    Inscrit en
    Juillet 2012
    Messages
    96
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations forums :
    Inscription : Juillet 2012
    Messages : 96
    Points : 47
    Points
    47
    Par défaut
    Bonsoir Marot_r

    J avais essayé ton approche mais access a refusé ma modification de table au motif "nombre de verrous maximum atteints..." (il faut que je retrouve le message exact).
    Étonnant non ?

    David

  4. #4
    Expert confirmé

    Homme Profil pro
    consultant développeur
    Inscrit en
    Mai 2005
    Messages
    2 887
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Val de Marne (Île de France)

    Informations professionnelles :
    Activité : consultant développeur
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Mai 2005
    Messages : 2 887
    Points : 4 768
    Points
    4 768
    Par défaut
    Bonsoir,
    En m'inspirant de la lecture de procédure de Sqlpro,
    je suggère une approche simplifiée :

    1 ere étape. On alimente une table temporaire T_DOUBLON_TMP seulement avec les doublons "dédoublonnés" :
    Code sql : Sélectionner tout - Visualiser dans une fenêtre à part
    SELECT DISTINCT NUM, NOM, PRENOM INTO T_DOUBLON_TMP FROM T_DOUBLON GROUP BY NUM, NOM, PRENOM HAVING COUNT(*) > 1
    (question : cette requête s'exécute également sous Access ???)
    12 ème étape. On ajoute à cette table temporaire les lignes qui n'étaient pas en doublons :
    Code sql : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    INSERT INTO T_DOUBLON_TMP
    SELECT NUM, NOM, PRENOM FROM T_DOUBLON 
    GROUP BY NUM, NOM, PRENOM 
    HAVING COUNT(*) = 1
    d'abord pas testé ...
    [EDIT] puis testé : ça marche !
    "Always look at the bright side of life." Monty Python.

  5. #5
    Membre du Club
    Homme Profil pro
    Inscrit en
    Juillet 2012
    Messages
    96
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations forums :
    Inscription : Juillet 2012
    Messages : 96
    Points : 47
    Points
    47
    Par défaut
    Bonsoir Micniv,
    Promis j essaie demain ta méthode !!
    Car là je suis à 8h d exécution ... Et ça tourne ... Et ça tourne....
    Peut être un résultat demain matin que je comparerai avec le tien

  6. #6
    Membre du Club
    Homme Profil pro
    Inscrit en
    Juillet 2012
    Messages
    96
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations forums :
    Inscription : Juillet 2012
    Messages : 96
    Points : 47
    Points
    47
    Par défaut
    Réveil ce matin et toujours pas de résultat ...
    Donc je me rattache à ta solution Micniv qui fonctionne !!!

  7. #7
    Expert confirmé

    Homme Profil pro
    consultant développeur
    Inscrit en
    Mai 2005
    Messages
    2 887
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Val de Marne (Île de France)

    Informations professionnelles :
    Activité : consultant développeur
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Mai 2005
    Messages : 2 887
    Points : 4 768
    Points
    4 768
    Par défaut
    La nuit portant conseil,
    si l'on n'a pas à isoler les doublons on peut faire plus rapidement en 1 seule requete :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    SELECT NUM, NOM, PRENOM INTO T_DOUBLON_TMP2
    FROM T_DOUBLON
    GROUP BY NUM, NOM, PRENOM;
    "Always look at the bright side of life." Monty Python.

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. [Toutes versions] Requête suppression de lignes avec champ vide et soucis de performance
    Par dagada75 dans le forum Requêtes et SQL.
    Réponses: 4
    Dernier message: 23/11/2013, 13h10
  2. [debutant] suppression des doublons absolus
    Par Auteur dans le forum Langage SQL
    Réponses: 9
    Dernier message: 19/10/2007, 09h26
  3. [Visual Studio 2003] J'ai un très gros souci !
    Par bart64 dans le forum EDI/Outils
    Réponses: 2
    Dernier message: 18/11/2005, 15h01
  4. [C#][Visual C# Express] Gros souci avec Excel
    Par poullos dans le forum EDI/Outils
    Réponses: 7
    Dernier message: 18/11/2005, 13h15
  5. Gros soucis avec pgaccess et postgresql
    Par Missvan dans le forum PostgreSQL
    Réponses: 9
    Dernier message: 13/04/2004, 16h16

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo