Précédent   Forum des professionnels en informatique > Bases de données > Langage SQL
Langage SQL Forum d'entraide sur le langage SQL et sur les questions liées à la conception de schéma (DDL). Cours SQL
Partagez cette discussion sur d'autres réseaux sociaux : Viadeo Twitter Google Facebook Digg Delicious MySpace Yahoo
Réponse Proposer ce sujet en actualité
 
Outils de la discussion
Publicité
'
Vieux 11/03/2011, 15h44   #1
Membre Expert
 
Avatar de Bktero
 
Inscription : juin 2009
Messages : 770
Détails du profil
Informations personnelles :
Âge : 24
Localisation : France, Loire Atlantique (Pays de la Loire)

Informations professionnelles :
Secteur : Industrie

Informations forums :
Inscription : juin 2009
Messages : 770
Points : 1 290
Points : 1 290
Par défaut Réel gain de performance lors d'un INNER JOIN ?

Bonjour à tous !

Je travaille depuis quelques mois sur SQL, langage que j'apprends un peu sur le tas (même si j'ai un poly d'un cours fait il y a 5 ans pour me donner les bases ). Je suis amener tous les jours à faire des INNER JOIN entre des tables assez grandes (plus de 70 000 entrées par table). Ces colonnes ont souvent beaucoup de colonnes (environ 30) en comparaison du nombre de champs que j'ai à récupérer pour chacun des tables (en 5). Je me pose donc des questions sur les performances en faisant des INNER JOIN entre des tables "réduites", comparées à des INNER JOIN sur les tables complètes.

Exemple :

Requête 1 :
Code :
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
 
SELECT
    cli.code                            AS codeClient,
    cli.telMobile                       AS telMobile,
    cli.titre                           AS titreClient,
    cli.nom                             AS nomClient,
    cli.prenom                          AS prenomClient,
    ''                                  AS categorieClient,
    to_char(NVL(cli.mtSoldeL, .0))      AS soldeL,
    to_char(NVL(cli.mtSoldeR, .0))      AS soldeR
FROM 
    (SELECT id, lignemarche, code, telMobile, titre, nom, prenom, mtSoldeL, mtSoldeR
            FROM Client
            WHERE ligneMarche IN ( 'REMUS', 'FORFAIT' )
) cli
    INNER JOIN
    (SELECT codeEtapeCourante, idclient AS vetapes_idclient
            FROM vetapes
            WHERE vetapes.codeetapecourante IN ('GPA', 'GPO', 'GPI') )
    ON cli.id = vetapes_idclient
GROUP BY cli.code, cli.telMobile, cli.titre, cli.nom, cli.prenom, cli.mtSoldeL, cli.mtSoldeR

VS

Requête 2 :
Code :
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
 
SELECT
    cli.code                            AS codeClient,
    cli.telMobile                       AS telMobile,
    cli.titre                           AS titreClient,
    cli.nom                             AS nomClient,
    cli.prenom                          AS prenomClient,
    ''                                  AS categorieClient,
    to_char(NVL(cli.mtSoldeL, .0))      AS soldeL,
    to_char(NVL(cli.mtSoldeR, .0))      AS soldeR
FROM 
    Client cli
    INNER JOIN vetapes ON cli.id = vetapes.idclient
WHERE
    cli.ligneMarche IN ( 'REMUS', 'FORFAIT' )
    AND vetapes.codeetapecourante IN ('GPA', 'GPO', 'GPI')
GROUP BY cli.code, cli.telMobile, cli.titre, cli.nom, cli.prenom, cli.mtSoldeL, cli.mtSoldeR
La requête apporte t-elle un réel gain de performance ? J'ai envie de dire "oui", car les INNER JOIN se font sur des tables beaucoup plus petites.

On pourrait aussi penser que "non" car il y a au final 3 requêtes SQL contre 1.

Est ce que les SGBD récupèrent plus rapidement une table entière (client, vetapes) qu'une partie de ces tables (comme fait dans la requête 1) ?


Merci de vos avis éclairés
__________________
Pour les adeptes du langage SMS, allez ici et ramenez la traduction française ^^

Pour vos problèmes d'embarqué, utilisez le forum dédié !
Bktero est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 11/03/2011, 15h58   #2
Modérateur
 
Avatar de CinePhil
 
Homme Philippe Leménager
Ingénieur d'études en informatique
Inscription : août 2006
Messages : 10 998
Détails du profil
Informations personnelles :
Nom : Homme Philippe Leménager
Âge : 48
Localisation : France, Haute Garonne (Midi Pyrénées)

Informations professionnelles :
Activité : Ingénieur d'études en informatique
Secteur : Enseignement

Informations forums :
Inscription : août 2006
Messages : 10 998
Points : 18 262
Points : 18 262
Envoyer un message via MSN à CinePhil
Un moyen de répondre toi même à ta question serait déjà de tester tes requêtes et d'examiner le plan d'exécution de celles-ci.
Peut-être que ton SGBD (présence de NVL : Oracle ?) est assez futé pour se rendre compte tout seul s'il vaut mieux d'abord faire les restrictions puis la jointure ou l'inverse.

Ce que je ne comprends pas dans tes requêtes, c'est l'utilité du GROUP BY étant donné qu'il n'y a pas de fonction de regroupement (SUM, COUNT, AVG...). Un DISTINCT me semblerait suffisant et serait peut-être moins coûteux.
__________________
Philippe Leménager. Ingénieur d'étude à l'École Nationale de Formation Agronomique.
Mon blog sur la conception des BDD, le langage SQL, le PHP avec Zend Framework...
« Ce que l'on conçoit bien s'énonce clairement, et les mots pour le dire arrivent aisément ». (Nicolas Boileau)
À la maison comme au bureau, j'utilise Mandriva Linux ou Mageïa ! Soutenons l'industrie logicielle française !
Linuxiens, comptez-vous !
CinePhil est déconnecté   Envoyer un message privé Réponse avec citation 10
Vieux 11/03/2011, 16h12   #3
Rédacteur/Modérateur

 
Avatar de SQLpro
 
Homme Frédéric BROUARD
Expert SGBDR & SQL
Inscription : mai 2002
Messages : 10 953
Détails du profil
Informations personnelles :
Nom : Homme Frédéric BROUARD
Localisation : France

Informations professionnelles :
Activité : Expert SGBDR & SQL
Secteur : Conseil

Informations forums :
Inscription : mai 2002
Messages : 10 953
Points : 17 773
Points : 17 773
1) de toutes façon un GROUP BY ne fait ni un DISTINC, ni un tri. C'est une erreur de débutant. Un GROUP BY n'a d'intérêt que combiné à un agrégat.
2) c'est du ORACLE (TO_CHAR, TO_NUMBER....)
3) ce qui sera le plus intéressant pour les performances, c'est l'indexation !

A +
__________________
Frédéric Brouard - SQLpro - ARCHITECTE DE DONNÉES - expert SGBDR et langage SQL
Site sur les SGBD relationnels et le langage SQL: http://sqlpro.developpez.com/
Expert Microsoft SQL Server - M.V.P. (Most valuable Professional) MS Corp.
Blog SQL, SQL Server, modélisation données : http://blog.developpez.com/sqlpro
http://www.sqlspot.com : modélisation, conseils, audit, optimisation, formation
* * * * * Enseignant CNAM PACA - ISEN Toulon - CESI Aix en Provence * * * * *
SQLpro est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 14/03/2011, 10h22   #4
Membre Expert
 
Avatar de Bktero
 
Inscription : juin 2009
Messages : 770
Détails du profil
Informations personnelles :
Âge : 24
Localisation : France, Loire Atlantique (Pays de la Loire)

Informations professionnelles :
Secteur : Industrie

Informations forums :
Inscription : juin 2009
Messages : 770
Points : 1 290
Points : 1 290
Bonjour,

Oui, je suis sous Oracle, désolé de ne pas l'avoir précisé

Le GROUP BY n'est pas de moi, j'ai repris le travail d'un collègue. Il me semblait qu'il ne servait pas, merci pour la confirmation.

Je vais essayer de de regarder les temps d'exécution, mais mes bases de tests sont très petites et je n'ai pas accès aux bases de production... Je ne sais pas si les résultats seront donc très significatifs.

Pour ce qui est de l'indexation, je crois qu'elle est déjà activée. Je vais vérifier ça.

Merci
__________________
Pour les adeptes du langage SMS, allez ici et ramenez la traduction française ^^

Pour vos problèmes d'embarqué, utilisez le forum dédié !
Bktero est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 14/03/2011, 11h22   #5
Rédacteur/Modérateur

 
Avatar de SQLpro
 
Homme Frédéric BROUARD
Expert SGBDR & SQL
Inscription : mai 2002
Messages : 10 953
Détails du profil
Informations personnelles :
Nom : Homme Frédéric BROUARD
Localisation : France

Informations professionnelles :
Activité : Expert SGBDR & SQL
Secteur : Conseil

Informations forums :
Inscription : mai 2002
Messages : 10 953
Points : 17 773
Points : 17 773
Une indexation cela se créé en fonction des besoins des requêtes. Faire des essais sur une base bidon ne reflétant pas la volumétrie ni la dispersion des données de production ne sert strictement à rien !

A +
__________________
Frédéric Brouard - SQLpro - ARCHITECTE DE DONNÉES - expert SGBDR et langage SQL
Site sur les SGBD relationnels et le langage SQL: http://sqlpro.developpez.com/
Expert Microsoft SQL Server - M.V.P. (Most valuable Professional) MS Corp.
Blog SQL, SQL Server, modélisation données : http://blog.developpez.com/sqlpro
http://www.sqlspot.com : modélisation, conseils, audit, optimisation, formation
* * * * * Enseignant CNAM PACA - ISEN Toulon - CESI Aix en Provence * * * * *
SQLpro est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 14/03/2011, 11h43   #6
Membre Expert
 
Inscription : janvier 2010
Messages : 1 084
Détails du profil
Informations personnelles :
Localisation : France, Rhône (Rhône Alpes)

Informations forums :
Inscription : janvier 2010
Messages : 1 084
Points : 1 573
Points : 1 573
Citation:
Envoyé par Bktero Voir le message
Bonjour à tous !

La requête apporte t-elle un réel gain de performance ? J'ai envie de dire "oui", car les INNER JOIN se font sur des tables beaucoup plus petites.
Citation:
Envoyé par SQLpro Voir le message
Une indexation cela se créé en fonction des besoins des requêtes.
En créant un index couvrant pour ta requête, le moteur travaillera bien avec une quantité de données réduite(l'index en question), même avec la deuxième requête !
aieeeuuuuu est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 15/03/2011, 20h13   #7
Membre Expert
 
Avatar de Bktero
 
Inscription : juin 2009
Messages : 770
Détails du profil
Informations personnelles :
Âge : 24
Localisation : France, Loire Atlantique (Pays de la Loire)

Informations professionnelles :
Secteur : Industrie

Informations forums :
Inscription : juin 2009
Messages : 770
Points : 1 290
Points : 1 290
Citation:
Envoyé par SQLpro Voir le message
Faire des essais sur une base bidon ne reflétant pas la volumétrie ni la dispersion des données de production ne sert strictement à rien !
Je m'en doutais bien
J'ai testé sur ma base, les temps d'exécution varie du simple ou double, totalement useless ^^

Merci pour vos conseils sur l'indexation, je vais me renseigner sur ça
__________________
Pour les adeptes du langage SMS, allez ici et ramenez la traduction française ^^

Pour vos problèmes d'embarqué, utilisez le forum dédié !
Bktero est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 17/03/2011, 19h37   #8
Rédacteur/Modérateur

 
Avatar de SQLpro
 
Homme Frédéric BROUARD
Expert SGBDR & SQL
Inscription : mai 2002
Messages : 10 953
Détails du profil
Informations personnelles :
Nom : Homme Frédéric BROUARD
Localisation : France

Informations professionnelles :
Activité : Expert SGBDR & SQL
Secteur : Conseil

Informations forums :
Inscription : mai 2002
Messages : 10 953
Points : 17 773
Points : 17 773
a lire : http://sqlpro.developpez.com/cours/quoi-indexer/
Pour savoir comment est fait un index et comment il se fragmente :
http://sqlpro.developpez.com/optimis...eIndexVLDB.pdf
paragraphe 0, 1 et 2

A +
__________________
Frédéric Brouard - SQLpro - ARCHITECTE DE DONNÉES - expert SGBDR et langage SQL
Site sur les SGBD relationnels et le langage SQL: http://sqlpro.developpez.com/
Expert Microsoft SQL Server - M.V.P. (Most valuable Professional) MS Corp.
Blog SQL, SQL Server, modélisation données : http://blog.developpez.com/sqlpro
http://www.sqlspot.com : modélisation, conseils, audit, optimisation, formation
* * * * * Enseignant CNAM PACA - ISEN Toulon - CESI Aix en Provence * * * * *
SQLpro est déconnecté   Envoyer un message privé Réponse avec citation 00
Réponse Proposer ce sujet en actualité
Outils de la discussion



Fuseau horaire GMT +2. Il est actuellement 00h17.


 
 
 
 
Partenaires

Hébergement Web