Comment optimiser cette simple jointure

**if_zen** · 05/08/2008, 19h01

Bonjour à tous !

Voici un schéma de données :

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
5
6
7
8
9
10
11
12
13
 
[employee] -- count : 384398
- id
- idteam
- sinceDate
- idservice
 
[service] -- count : 605
- id
- idcompany
 
[company] -- count : 128
- id

Chaque table a son index défini sur les colonnes ID* (id, idteam, idservice, etc)

Maintenant une requete, qui me parait simple. Je cherche tous les idteam uniques de la table employee dont l'idcompany est 42.

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
5
6
7
 
select E.idteam, min(E.sinceDate)
from employee E
left join service S on (E.idservice = S.id)
where S.idcompany = 42
group by 1
order by 2;

Un explain de la requete sorti par mysql :

table S : key idcompany, rows 108. using where temporary filesort.
table E : key service.id, rows 439. using where.

Ma requete met 28 secondes à s'exécuter, et ce à chaque fois, même le cache ne la garde pas.

Est-ce que quelqu'un aurait une suggestion ? Des variables mysql à optimiser ? Les tables sont en innoDB.

Merci infiniment !

**Chtulus** · 05/08/2008, 21h02

Bonsoir,

Des variables mysql à optimiser ?

En même temps on ne sait rien de tes tables...

Je cherche tous les idteam uniques de la table employee dont l'idcompany est 42.

DISTINCT est très bon pour les uniques...

**Tux++** · 05/08/2008, 21h24

Je cherche tous les idteam uniques de la table employee dont l'idcompany est 42.

Si j'ai bien compris, IDteam est un identifiant, il devrait donc être unique et ne pas avoir de doublons.

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
5
SELECT E.idteam, min(E.sinceDate) as mini
FROM employee E, service S
WHERE E.idservice = S.id
AND S.idcompany = 42
ORDER BY mini

devrait donc fonctionner correctement, mais sans infos suppl...

**Antoun** · 06/08/2008, 07h39

Envoyé par Tux++

Si j'ai bien compris, IDteam est un identifiant, il devrait donc être unique et ne pas avoir de doublons.

En toute logique, sur la table Employee, l'IDteam n'est pas unique puisqu'un équipe est composée de plusieurs employés.

If_zen, tu n'as pas une table Team ?

Envoyé par Tux++

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
5
SELECT E.idteam, min(E.sinceDate) as mini
FROM employee E, service S
WHERE E.idservice = S.id
AND S.idcompany = 42
ORDER BY mini

devrait donc fonctionner correctement, mais sans infos suppl...

Je suis d'accord avec toi sur le principe que la jointure externe ne sert à rien (un employé sans service n'est dans aucune société, donc pas dans la 42) et est sous-performante. Mais je préfèrerais l'écriture normalisée :

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
5
6
SELECT E.idteam, min(E.sinceDate)
FROM employee E
  INNER JOIN service S ON E.idservice = S.id
WHERE S.idcompany = 42
GROUP BY 1
ORDER BY 2;

**if_zen** · 06/08/2008, 10h00

Bonjour à tous et merci pour vos précisions.

Envoyé par Antoun

Je suis d'accord avec toi sur le principe que la jointure externe ne sert à rien (un employé sans service n'est dans aucune société, donc pas dans la 42) et est sous-performante.

Bien vu, ça j'aurais pu y penser.

Envoyé par Antoun

If_zen, tu n'as pas une table Team ?

Je m'étais arrangé pour avoir des noms de table génériques pour que ça parle à tout le monde, mais je n'aurais peut-être pas du

Dans mon cas, team correspondrait simplement à :

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
5
6
 
[team]
- id
- nom
- adresse
- ...

Autre point, tous nos ID sont des bigint(20), j'ai cru lire que ça ne jouait pas en faveur des performances.
D'un point de vue index, serait il judicieux de faire un index sur les sinceDate (DATE) ? A priori la clé utilisé par le requetteur serait de toute façons idService.

Envoyé par If_Zen

table S : key idcompany, rows 108. using where temporary filesort.
table E : key service.id, rows 439. using where.

Cela vous semble-t-il correct ? Moi oui, mais je ne comprend pas les "28" secondes d'exécution du coup.

Envoyé par Chtulus

DISTINCT est très bon pour les uniques...

Mon but était de grouper les résultats par idTeam, donc ils se retrouvent forcément uniques.

J'ai cru comprendre qu'il vous manquait des informations. C'est vrai que j'ai essayé de généraliser en donnant des noms usuels aux tables en essayant de ne garder que les informations nécessaires. S'il vous faut d'autres infos, n'hésitez pas à me demander !
J'aurais aimé factoriser la requete pour en faire une plus simple et plus rapide. Merci à Tux++ et Antoun pour la correction sur la jointure !

But de la requete : retrouver pour une company particulière, l'ensemble de ses team avec la date de participation la plus ancienne de ses employee.

Comment optimiser cette simple jointure

Langage SQL

Discussions similaires

Partager

Partager