IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Requêtes MySQL Discussion :

Optimisation d'une requête ou structure de table


Sujet :

Requêtes MySQL

  1. #1
    Futur Membre du Club
    Inscrit en
    Novembre 2011
    Messages
    7
    Détails du profil
    Informations forums :
    Inscription : Novembre 2011
    Messages : 7
    Points : 5
    Points
    5
    Par défaut Optimisation d'une requête ou structure de table
    Bonjour,

    J'ai une question pour les experts

    J'ai un script en php qui extrait les derniers documents transmis entre quelques centaines de personnes. La table qui contient les documents contient environ 850 000 lignes, ça fait un bon moment (depuis au moins 500 000 entrés dans la table en question) que l'affichage de la page php est lente. J'affiche uniquement les 50 derniers documents avec un système de pagination simple. J'ai inséré une fonction de débugguage qui m'a permis de détecter la cause du ralentissement, la requête de sélection dans cette table est très lente (environ 5 secondes). Même chose sous PHPMyAdmin

    Voici la requête SQL:
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    SELECT documents.id, documents.name, documents.timestamp, 
      categories.name AS category_name, 
      categorys.id AS category_id 
    FROM documents 
    LEFT JOIN categories ON categories.id = documents.category 
    WHERE documents.active=1 
    ORDER BY documents.id DESC 
    LIMIT 50
    J'ai une clé primaire sur le champ documents.id et categories.id, un index sur le champ documents.category et documents.active.

    Avez-vous une idée de comment optimiser ça ?

    N.B, le système tourne sur un core i7 avec 6go RAM, la charge système est très basse.

    Merci d'avance pour votre aide

  2. #2
    Modérateur

    Avatar de CinePhil
    Homme Profil pro
    Ingénieur d'études en informatique
    Inscrit en
    Août 2006
    Messages
    16 799
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 60
    Localisation : France, Haute Garonne (Midi Pyrénées)

    Informations professionnelles :
    Activité : Ingénieur d'études en informatique
    Secteur : Enseignement

    Informations forums :
    Inscription : Août 2006
    Messages : 16 799
    Points : 34 031
    Points
    34 031
    Billets dans le blog
    14
    Par défaut
    Pour commencer, il y a une petite erreur dans ta requête :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    categorys.id AS category_id 
    LEFT JOIN categories
    La table s'appelle categories ou categorys ?

    Dans les deux cas, tu devrais nommer tes tables au singulier.

    On peut voir la structure des tables et le résultat d'un explain de la requête ?
    Philippe Leménager. Ingénieur d'étude à l'École Nationale Supérieure de Formation de l'Enseignement Agricole. Autoentrepreneur.
    Mon ancien blog sur la conception des BDD, le langage SQL, le PHP... et mon nouveau blog sur les mêmes sujets.
    « Ce que l'on conçoit bien s'énonce clairement, et les mots pour le dire arrivent aisément ». (Nicolas Boileau)
    À la maison comme au bureau, j'utilise la suite Linux Mageïa !

  3. #3
    Futur Membre du Club
    Inscrit en
    Novembre 2011
    Messages
    7
    Détails du profil
    Informations forums :
    Inscription : Novembre 2011
    Messages : 7
    Points : 5
    Points
    5
    Par défaut
    Désolé pour l'erreur, c'est qu'il y a une partie du nom de mon site dans le nom des tables et je l'ai retiré avec des fonction search/replace de mon IDE, une erreur c'est glissé

    La requête est bien :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    SELECT documents.id, documents.name, documents.timestamp, 
      categories.name AS category_name, 
      categories.id AS category_id 
    FROM documents 
    LEFT JOIN categories ON categories.id = documents.category 
    WHERE documents.active=1 
    ORDER BY documents.id DESC 
    LIMIT 50
    Voici le résultat de EXPLAIN:
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    EXPLAIN SELECT documents.id, documents.name, documents.timestamp, categories.name AS category_name, categories.id AS category_id
    FROM documents
    LEFT JOIN categories ON categories.id = documents.category
    WHERE documents.active =1
    ORDER BY documents.id DESC 
    LIMIT 50
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    id	select_type	table	type	possible_keys	key	key_len	ref	rows	Extra
    1	SIMPLE	documents	ref	active	active	2	const	866667	Using where; Using filesort
    1	SIMPLE	categories	eq_ref	PRIMARY	PRIMARY	1	dbname.documents.category	1
    Merci encore

  4. #4
    Modérateur

    Avatar de CinePhil
    Homme Profil pro
    Ingénieur d'études en informatique
    Inscrit en
    Août 2006
    Messages
    16 799
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 60
    Localisation : France, Haute Garonne (Midi Pyrénées)

    Informations professionnelles :
    Activité : Ingénieur d'études en informatique
    Secteur : Enseignement

    Informations forums :
    Inscription : Août 2006
    Messages : 16 799
    Points : 34 031
    Points
    34 031
    Billets dans le blog
    14
    Par défaut
    Et la structure des tables (résultat de SHOW CREATE TABLE de chaque table) ?
    Philippe Leménager. Ingénieur d'étude à l'École Nationale Supérieure de Formation de l'Enseignement Agricole. Autoentrepreneur.
    Mon ancien blog sur la conception des BDD, le langage SQL, le PHP... et mon nouveau blog sur les mêmes sujets.
    « Ce que l'on conçoit bien s'énonce clairement, et les mots pour le dire arrivent aisément ». (Nicolas Boileau)
    À la maison comme au bureau, j'utilise la suite Linux Mageïa !

  5. #5
    Futur Membre du Club
    Inscrit en
    Novembre 2011
    Messages
    7
    Détails du profil
    Informations forums :
    Inscription : Novembre 2011
    Messages : 7
    Points : 5
    Points
    5
    Par défaut
    Désolé pour le délai de réponse, il semble que nous ne soyons pas de le même fuseau horaire
    Pour la table documents :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    Table	Create Table
    documents	CREATE TABLE `documents` (
     `id` int(10) unsigned NOT NULL auto_increment,
     `name` varchar(255) NOT NULL default '',
     `description` mediumtext,
     `search` varchar(255) NOT NULL,
     `link` varchar(255) default NULL,
     `active` tinyint(1) default '1',
     `category` tinyint(10) unsigned default NULL,
     `timestamp` bigint(25) NOT NULL,
     `hits` int(11) unsigned NOT NULL default '0',
     PRIMARY KEY  (`id`),
     KEY `active` (`active`),
     KEY `category` (`category`),
     KEY `timestamp` (`timestamp`),
     KEY `hits` (`hits`),
     FULLTEXT KEY `search` (`search`)
    ) ENGINE=MyISAM AUTO_INCREMENT=869047 DEFAULT CHARSET=latin1
    Pour la table des catégories:
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    Table	Create Table
    categories	CREATE TABLE `categories` (
     `id` tinyint(3) unsigned NOT NULL auto_increment,
     `name` varchar(255) default '0',
     `active` tinyint(3) unsigned default '1',
     `nb` int(10) unsigned NOT NULL default '0',
     PRIMARY KEY  (`id`),
     KEY `active` (`active`),
     KEY `parse_error` (`parse_error`),
     KEY `nb` (`nb`)
    ) ENGINE=MyISAM AUTO_INCREMENT=139 DEFAULT CHARSET=latin1
    Merci!

  6. #6
    Futur Membre du Club
    Inscrit en
    Novembre 2011
    Messages
    7
    Détails du profil
    Informations forums :
    Inscription : Novembre 2011
    Messages : 7
    Points : 5
    Points
    5
    Par défaut
    Je n'ai pas encore trouvé de solution, j'ai effectué les optimisations des tables et j'ai aussi regardé les suggestions PHPMyAdmin pour optimiser la structure. J'ai appliqué certaines recommandations tel que passer des champs INT(11) en MEDIUMINT(7) lorsque ça m’apparaissait approprié. Rien y fait, la requête écrite plus haut peut prendre plus de 10 secondes à être effectué la première fois. Ensuite mysql la met en cache et c'est rapide.

  7. #7
    Rédacteur

    Avatar de SQLpro
    Homme Profil pro
    Expert bases de données / SQL / MS SQL Server / Postgresql
    Inscrit en
    Mai 2002
    Messages
    21 768
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Var (Provence Alpes Côte d'Azur)

    Informations professionnelles :
    Activité : Expert bases de données / SQL / MS SQL Server / Postgresql
    Secteur : Conseil

    Informations forums :
    Inscription : Mai 2002
    Messages : 21 768
    Points : 52 719
    Points
    52 719
    Billets dans le blog
    5
    Par défaut
    Déjà il faudrait peut être apprendre un minimum ce qu'est la modélisation des données, car votre clef étrangère category dans la table documents n'a pas le même type de données que celle dans la table des catégories.
    C'est stupide car cela oblige à un transtypage et donc interdit l'utilisation des index.
    Ceci aurait été vu par une modélisation correcte et la donc la mise en place de l'intégrité référentielle. Mais comme MySQL ne permet pas à la fois l'intégrité référentielle et l'indexation textuelle vous êtes baisé !

    Ce n'est pas le moindre des maux de MySQL, qui, contrairement à une légende est un veau en matière de performances....

    A lire sur le sujet : http://blog.developpez.com/sqlpro/p9...udre-aux-yeux/
    Benchmark : http://blog.developpez.com/sqlpro/p9...lles-en-sql-1/
    Indexation, comparaison des SGBDR : blog.developpez.com/sqlpro/p9816/langage-sql-norme/tout-sur-l-index/
    Recherches textuelle comparatif MySQL / SQL server : http://blog.developpez.com/sqlpro/p9...ext-search-no/

    A +
    Frédéric Brouard - SQLpro - ARCHITECTE DE DONNÉES - expert SGBDR et langage SQL
    Le site sur les SGBD relationnels et le langage SQL: http://sqlpro.developpez.com/
    Blog SQL, SQL Server, SGBDR : http://blog.developpez.com/sqlpro
    Expert Microsoft SQL Server - M.V.P. (Most valuable Professional) MS Corp.
    Entreprise SQL SPOT : modélisation, conseils, audit, optimisation, formation...
    * * * * * Expertise SQL Server : http://mssqlserver.fr/ * * * * *

  8. #8
    Modérateur

    Avatar de CinePhil
    Homme Profil pro
    Ingénieur d'études en informatique
    Inscrit en
    Août 2006
    Messages
    16 799
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 60
    Localisation : France, Haute Garonne (Midi Pyrénées)

    Informations professionnelles :
    Activité : Ingénieur d'études en informatique
    Secteur : Enseignement

    Informations forums :
    Inscription : Août 2006
    Messages : 16 799
    Points : 34 031
    Points
    34 031
    Billets dans le blog
    14
    Par défaut
    Une colonne ne devrait pas s'appeler "timestamp" car c'est un mot réservé du langage SQL.

    Les index sur "active" sont inutiles car ce sont des booléens donc seulement 2 valeurs. Le SGBD n'utilisera jamais cet index, il aura plus vite fait de parcourir toute la table.

    category.active devrait, si j'ai bien deviné son utilité, être un booléen, c'est à dire un TINYINT(1).

    Comme a dit SQLPro, les colonnes faisant office de clé étrangère, ici document.category, doivent avoir exactement le même type que la colonne qu'elles référencent.

    Que contiennent les colonnes search et hits ?

    Dans votre requête, le ORDER BY est-il vraiement utile ? Qu'est-ce que ça apporte d'ordonner une liste de documents par son identifiant qui n'a aucune signification ?
    Philippe Leménager. Ingénieur d'étude à l'École Nationale Supérieure de Formation de l'Enseignement Agricole. Autoentrepreneur.
    Mon ancien blog sur la conception des BDD, le langage SQL, le PHP... et mon nouveau blog sur les mêmes sujets.
    « Ce que l'on conçoit bien s'énonce clairement, et les mots pour le dire arrivent aisément ». (Nicolas Boileau)
    À la maison comme au bureau, j'utilise la suite Linux Mageïa !

  9. #9
    Futur Membre du Club
    Inscrit en
    Novembre 2011
    Messages
    7
    Détails du profil
    Informations forums :
    Inscription : Novembre 2011
    Messages : 7
    Points : 5
    Points
    5
    Par défaut
    Merci à vous deux,

    J'ai effectué vos recommandations,

    -le champ timestamp devient added_timestamp

    -les index sur les colonnes active sont supprimés.

    -documents.active et categories.active sont maintenant tous les deux en tinyint(1) unsigned not null default 1

    -les champs documents.category et categories.id ont dorénavant le même type tinyint(3)

    -la colonne search contient un texte épuré tiré du titre du document. Cette colonne est utilisé avec un MATCH standard dans la section de recherche. Le système est efficace.

    -La colonne hits contient le nombre de fois où le document à été vu. C'est utilisé à fin de statistiques pour celui qui publie ses documents.

    -La clause ORDER BY documents.id DESC dans la requête c'est pour classer les résultats des plus récents au plus anciens puisqu'il s'agit de la clé primaire qui est en auto_increment

    Le problème de performance c'est envolé au moment ou l'index des colonnes `active` ont étés retirés

    Merci pour votre aide.

    Si vous avez d'autres suggestions je suis preneur.

    SQLpro, j'ai lu vos liens avec attention, je songeais il y a un bon moment à utiliser Progresql et je le ferai dans un futur proche pour mes prochain projets. Mais je n'envisage pas de changer mysql pour progresql sur les plateformes actives. Par exemple, j'ai un projet utilisant mysql pour en moyenne 300 connexions concurrentes avec plus de 500 000 requêtes par heure, moitié SELECT/UPDATE avec risque assez fort de collisions. Néanmoins le site fonctionne à merveille donc je lui toucherai le moins possible

    Pour ce qui est des index et des systèmes de recherche, j'ai encore beaucoup de lecture à faire

Discussions similaires

  1. [AC-2010] Exporter la structure d'une requête sous forme de table
    Par docjo dans le forum VBA Access
    Réponses: 8
    Dernier message: 16/09/2013, 17h22
  2. Optimisation d'une requête SELECT sur une grosse table
    Par eracius dans le forum Requêtes
    Réponses: 4
    Dernier message: 26/05/2008, 14h51
  3. [DB2] Optimisation d'une requête
    Par ahoyeau dans le forum DB2
    Réponses: 7
    Dernier message: 11/03/2005, 17h54
  4. Encore une requête complexe sur plusieurs tables
    Par DenPro dans le forum Langage SQL
    Réponses: 5
    Dernier message: 09/12/2003, 19h05
  5. A propos d'une requête SQL sur plusieurs tables...
    Par ylebihan dans le forum Langage SQL
    Réponses: 2
    Dernier message: 14/09/2003, 16h26

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo