IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

PL/SQL Oracle Discussion :

Traitement d'un grand nombre d'enregistrements


Sujet :

PL/SQL Oracle

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Membre Expert
    Avatar de elitost
    Homme Profil pro
    Consultant informatique
    Inscrit en
    Septembre 2003
    Messages
    1 985
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 47
    Localisation : France, Moselle (Lorraine)

    Informations professionnelles :
    Activité : Consultant informatique
    Secteur : High Tech - Multimédia et Internet

    Informations forums :
    Inscription : Septembre 2003
    Messages : 1 985
    Par défaut Traitement d'un grand nombre d'enregistrements
    Bonjour,

    j'ai une table d'environ 3 millions d'enregistrements sur laquelle je souhaiterais parcourir tous les éléments pour effectuers des traitements à partir de 2 colonnes.

    Quelle est la meilleures approche en terme de rapidité ?

    Avez vous des exemples de code pour faire ça ?

    Merci d'avance,

  2. #2
    Membre chevronné Avatar de miloux32
    Profil pro
    Inscrit en
    Juillet 2003
    Messages
    545
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Juillet 2003
    Messages : 545
    Par défaut
    Citation Envoyé par elitost Voir le message
    Bonjour,

    j'ai une table d'environ 3 millions d'enregistrements sur laquelle je souhaiterais parcourir tous les éléments pour effectuers des traitements à partir de 2 colonnes.

    Quelle est la meilleures approche en terme de rapidité ?

    Avez vous des exemples de code pour faire ça ?

    Merci d'avance,
    si tu veux parcourir tous les enregistrements y'a pas des masses de possibilités .... tu veux faire quoi comme traitement ?

  3. #3
    Membre Expert
    Avatar de elitost
    Homme Profil pro
    Consultant informatique
    Inscrit en
    Septembre 2003
    Messages
    1 985
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 47
    Localisation : France, Moselle (Lorraine)

    Informations professionnelles :
    Activité : Consultant informatique
    Secteur : High Tech - Multimédia et Internet

    Informations forums :
    Inscription : Septembre 2003
    Messages : 1 985
    Par défaut
    Voilà le code que je souhaite améliorer :

    Code sql : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    DECLARE
      c CLOB;
      n NUMBER:=0;
    BEGIN
     
      FOR i IN (SELECT doc_id,doc_bfile FROM vic) LOOP
        BEGIN
     
          Ctx_Doc.policy_filter('dgt_policy',i.doc_bfile,c);
        EXCEPTION WHEN OTHERS THEN DBMS_OUTPUT.put_line (SQLERRM);
        END;
        UPDATE VIS_DOCUMENTS_T SET doc_clob=c WHERE doc_id=i.doc_id;
        n:=n+1;
        IF MOD(n,500)=0 THEN
          DBMS_OUTPUT.PUT_LINE(n);
          COMMIT;
        END IF;
      END LOOP;
    END;

    Pour le moment, l'instruction SELECT doc_id,doc_bfile FROM vic de la boucle FOR prends pas mal de temps (dépendant bien sur du nombre d'enregistrement dans la table vic )

    Au final, avec ce bout de code, pour 100 000 enregistrements dans la table vic cela a pris environ 5 heures cette nuit.

    En attendant je vais expérimenter les différentes solutions ici :
    http://www.psoug.org/reference/array_processing.html

    Si vous avez d'autres propositions, conseils, etc... je suis preneur

    Merci d'avance

  4. #4
    Expert confirmé Avatar de mnitu
    Homme Profil pro
    Ingénieur développement logiciels
    Inscrit en
    Octobre 2007
    Messages
    5 611
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Marne (Champagne Ardenne)

    Informations professionnelles :
    Activité : Ingénieur développement logiciels
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Octobre 2007
    Messages : 5 611
    Par défaut
    Citation Envoyé par elitost Voir le message
    Voilà le code que je souhaite améliorer :

    Code sql : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    DECLARE
      c CLOB;
      n NUMBER:=0;
    BEGIN
     
      FOR i IN (SELECT doc_id,doc_bfile FROM vic) LOOP
        BEGIN
     
          Ctx_Doc.policy_filter('dgt_policy',i.doc_bfile,c);
        EXCEPTION WHEN OTHERS THEN DBMS_OUTPUT.put_line (SQLERRM);
        END;
        UPDATE VIS_DOCUMENTS_T SET doc_clob=c WHERE doc_id=i.doc_id;
        n:=n+1;
        IF MOD(n,500)=0 THEN
          DBMS_OUTPUT.PUT_LINE(n);
          COMMIT;
        END IF;
      END LOOP;
    END;
    ...
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
     
    SELECT doc_id,doc_bfile FROM vic
    Ca sélectionne tout donc il y a un seul chemin full table (ou index) scan. Ca pourrait s’optimiser par un traitement parallèle.
    Ensuite l'update en boucle c'est mauvais. Il faut le faire une seule fois à la fin.
    Commit en boucle c'est mauvais. Il faut le faire une seul fois à la fin et estimer le besoin d'éspace de rollback.
    When Others non suivi par un Raise c'est le bug numéro 1 de la programmation en PL/SQL.

  5. #5
    Membre Expert
    Avatar de elitost
    Homme Profil pro
    Consultant informatique
    Inscrit en
    Septembre 2003
    Messages
    1 985
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 47
    Localisation : France, Moselle (Lorraine)

    Informations professionnelles :
    Activité : Consultant informatique
    Secteur : High Tech - Multimédia et Internet

    Informations forums :
    Inscription : Septembre 2003
    Messages : 1 985
    Par défaut
    Citation Envoyé par mnitu Voir le message
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
     
    SELECT doc_id,doc_bfile FROM vic
    Ca sélectionne tout donc il y a un seul chemin full table (ou index) scan. Ca pourrait s’optimiser par un traitement parallèle.
    Ensuite l'update en boucle c'est mauvais. Il faut le faire une seule fois à la fin.
    Commit en boucle c'est mauvais. Il faut le faire une seul fois à la fin et estimer le besoin d'éspace de rollback.
    When Others non suivi par un Raise c'est le bug numéro 1 de la programmation en PL/SQL.
    Ok, mais pourrais tu éclairer ma lanterne sur comment faire :
    - Le traitement en parallèle ? je lancerais donc plusieurs procédures avec une plage de données en argument ? (si c'est ça j'ai du code pour le faire)
    - Comment faire l'update en une seule fois alors que j'ai une conversion sur chaque ligne ?
    - Comment estimer le besoin d'espace pour le rollback ?
    - Mon when others n'est pas suivi par un raise pour ne pas interrompre la boucle et juste imprimer l'erreur...aurais tu une autre solution ?

    Merci d'avance

  6. #6
    Expert confirmé Avatar de mnitu
    Homme Profil pro
    Ingénieur développement logiciels
    Inscrit en
    Octobre 2007
    Messages
    5 611
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Marne (Champagne Ardenne)

    Informations professionnelles :
    Activité : Ingénieur développement logiciels
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Octobre 2007
    Messages : 5 611
    Par défaut
    Citation Envoyé par elitost Voir le message
    Ok, mais pourrais tu éclairer ma lanterne sur comment faire :
    - Le traitement en parallèle ? je lancerais donc plusieurs procédures avec une plage de données en argument ? (si c'est ça j'ai du code pour le faire)
    - Comment faire l'update en une seule fois alors que j'ai une conversion sur chaque ligne ?
    ...
    OK. Voilà les idées de base des deux techniques détaillées dans le bouquin de Tom Kyte, Expert Oracle Database Architecture …
    Au départ la procédure a la structure suivante

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
     
    procedure p as
    begin
      for x in (select * from t1) Loop
        traitement complex
        Update ou Insert une autre table t2
      end loop;
    end;
    • Procédure parallel pipelined
      L’idée est d’inverser le traitement via un procedure parallel pipelined qui prend comme paramètre d’entré un curseur. Quelque chose de type
      Code : Sélectionner tout - Visualiser dans une fenêtre à part
      1
      2
      3
      4
      5
      6
      7
       
      insert /* +append */ into t2
        Select *
          from table(parallel_p(cursor(select /* +parallel(t1) */ *
                                        From t1)
                                )
                    )
    • DYP (do yourself parallelisme)
      L’idée est de partitionner la table t1 en N plages des rowids et de les stocker dans une table de travail avec un job_id comme identifiant. Ces N jobs sont programmes via dbms_job pour exécuter une procédure qui a comme paramètre d’entré le job_id. La procédure interroge la table de travail pour récupérer les rowsid associés au job_id et utilise un curseur de type
      Code : Sélectionner tout - Visualiser dans une fenêtre à part
      1
      2
       
      for x in (Select * from t1 where rowid between rowdeb and rowfin)

    Les exemples complètes se trouvent dans le bouquin indiqué et je pense qu’aussi sur le site de Tom Kyte. La documentation d'Oracle devrait fournir elle aussi des examples.

    .../...

  7. #7
    Expert confirmé Avatar de mnitu
    Homme Profil pro
    Ingénieur développement logiciels
    Inscrit en
    Octobre 2007
    Messages
    5 611
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Marne (Champagne Ardenne)

    Informations professionnelles :
    Activité : Ingénieur développement logiciels
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Octobre 2007
    Messages : 5 611
    Par défaut
    Citation Envoyé par elitost Voir le message
    Ok, mais pourrais tu éclairer ma lanterne sur comment faire :
    ...
    - Mon when others n'est pas suivi par un raise pour ne pas interrompre la boucle et juste imprimer l'erreur...aurais tu une autre solution ?

    Merci d'avance
    .../...
    When Others non suivi par un Raise c’est un bug.
    Voilà l’exemple dans ton code.
    Si quelque chose se passe mal dans l’appel de la procédure Ctx_Doc.policy_filter alors un appel à la procedure dbms_output.put_line serait fait en passant comme paramètre le message d’erreur.
    D’abord deux remarques :
    • Remarque 1 : En fonction de la version d’Oracle cette appel peut planter lui aussi parce que rien ne garanti un message d’erreur de moins de 255 caractères ! Donc perdu !
    • Remarque 2 : Il se peut que l’appel de la procédure se fait dans un contexte ou il n’y pas d’output et donc l’anomalie est complètement caché.


    Mais analysons ensemble la suite du traitement. Après avoir appelé la procédure dbms_output.put_line l’exécution du code continu avec la commande update. Cette commande va mettre à jour la table t2 avec la valeur de la variable c de type CLOB qui est en gros non définie. Cella veut dire que suite a ce update dans la table il aura n’importe quoi : soit une valeur d’une autre ligne, soit null soit qui sait quoi.

    J’ai bien plus d’autres arguments contre ce bug. Donc ce que je te propose c’est simple et efficace: supprime-le.
    Pensez que le monde des programmeurs serrait meilleur sans When Others!

Discussions similaires

  1. [MySQL] INSERT ou UPDATE pour un grand nombre d'enregistrements
    Par Phil.Antrope dans le forum Requêtes
    Réponses: 1
    Dernier message: 10/12/2007, 17h24
  2. Réponses: 4
    Dernier message: 05/07/2007, 17h07
  3. [javascript - formulaire] select avec grand nombre d'enregistrements
    Par mussara dans le forum Général JavaScript
    Réponses: 4
    Dernier message: 28/02/2007, 14h20
  4. requete sql sur un grand nombre d enregistrement
    Par marielaure dans le forum Langage SQL
    Réponses: 5
    Dernier message: 13/08/2004, 11h53
  5. Traitement d'un grand nombre de champ
    Par k-lendos dans le forum Langage SQL
    Réponses: 8
    Dernier message: 17/03/2004, 15h13

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo