IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Administration MySQL Discussion :

Quoi indexer ?


Sujet :

Administration MySQL

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Membre à l'essai
    Profil pro
    Inscrit en
    Juillet 2010
    Messages
    4
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Juillet 2010
    Messages : 4
    Par défaut Quoi indexer ?
    Je me pose des questions existentielles sur l'utilité d'indexer certains types de colonnes , même après avoir lu cet article :
    http://sqlpro.developpez.com/cours/quoi-indexer/

    Je vous les donne en vrac et j'attends vos points de vue...

    1) est-il utile de mettre un index sur un champ varchar si l'on sait qu'il n'y aura aucun doublon dans la colonne concernée ?

    2) est-il utile de mettre un index sur des champs de type ENUM ou SET ?

    3) est-il utile de mettre un index sur un champ TINYINT(1) qui ne prend que 1 ou 0 comme valeur ?

    4) est-il utile de mettre un index sur un champ de types TIME ou DATETIME sachant qu'il est impossible d'avoir deux valeurs identiques (même date, même heure à la seconde près) pour cette colonne ?

    5) est-il utile de mettre un index sur un champ numérique représentant une FK dont on sait qu'elle ne prendra que quelques valeurs distinctes (moins de 5 par ex) ?

    Je me place dans un contexte MySQL 5 et avec des index classiques, bien entendu.

    Merci par avance pour vos réponses.

    AV

  2. #2
    Rédacteur

    Avatar de SQLpro
    Homme Profil pro
    Expert bases de données / SQL / MS SQL Server / Postgresql
    Inscrit en
    Mai 2002
    Messages
    22 002
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Var (Provence Alpes Côte d'Azur)

    Informations professionnelles :
    Activité : Expert bases de données / SQL / MS SQL Server / Postgresql
    Secteur : Conseil

    Informations forums :
    Inscription : Mai 2002
    Messages : 22 002
    Billets dans le blog
    6
    Par défaut
    Visiblement vous avez mal lu mon article et confondez ce qu'est un index et ce qu'est une contrainte d'unicité. L'un n'ayant AUCUN rapport avec l'autre !

    Un index est une structure de données spécialement organisée pour accélérer certaines recherches.


    Une contrainte de clef primaire ou une contrainte d'unicité garantie qu'aucune valeur ne sera en double. Il s'agit là de deux contraintes différente. L'une assurant la clef de la relation, l'autre l'unicité des données (mais peut être non renseignée).

    La plupart des SGBDR placent des index sous ce types de contraintes. C'est le seul lien (incertain) qui existe entre les deux.
    On peut dire que l'index est une problématique PHYSIQUE (ais-je besoin de performances ?) et l'autre une problématique logique (dois-je assurer l'unicité ?).

    A +
    Frédéric Brouard - SQLpro - ARCHITECTE DE DONNÉES - expert SGBDR et langage SQL
    Le site sur les SGBD relationnels et le langage SQL: http://sqlpro.developpez.com/
    Blog SQL, SQL Server, SGBDR : http://blog.developpez.com/sqlpro
    Expert Microsoft SQL Server - M.V.P. (Most valuable Professional) MS Corp.
    Entreprise SQL SPOT : modélisation, conseils, audit, optimisation, formation...
    * * * * * Expertise SQL Server : http://mssqlserver.fr/ * * * * *

  3. #3
    Rédacteur/Modérateur

    Avatar de Antoun
    Homme Profil pro
    Architecte décisionnel
    Inscrit en
    Octobre 2006
    Messages
    6 291
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 55
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Architecte décisionnel
    Secteur : Conseil

    Informations forums :
    Inscription : Octobre 2006
    Messages : 6 291
    Par défaut
    1) oui, s'il doit être utilisé en recherche ou en jointure

    2) ça dépend combien il y a de valeurs possibles...

    3) imaginons une colonne Sexe avec 1 = masculin et 0 = féminin ; sur une population classique avec environ 50/50 de sex ratio, la sélectivité de ton index sera d'environ 50%, ce qui est beaucoup trop élevé (en réglage standard, MySQL n'essaie même pas les index de sélectivité supérieure à 30%). Si on prend maintenant une population très déséquilibrée, par exemple l'Armée avec un sex ratio de 95/05 (j'invente), l'index permettra de trouver plus rapidement les femmes (et sera ignoré lors desrecherches sur les hommes).

    4) oui, cf 1)

    5) MySQL crée de toute façon un index des deux côtés de la FK...

  4. #4
    Membre à l'essai
    Profil pro
    Inscrit en
    Juillet 2010
    Messages
    4
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Juillet 2010
    Messages : 4
    Par défaut
    Visiblement vous avez mal lu mon article et confondez ce qu'est un index et ce qu'est une contrainte d'unicité. L'un n'ayant AUCUN rapport avec l'autre !
    Absolument pas... j'ai du mal m'exprimer dans mes questions.
    Je comprends très bien la différence entre les deux et mes questions ne concernent pas les contraintes d'unicité, même si j'ai parlé de doublons. Je me place bien du côté performance et utilité des index.

    @antoun :
    1) si j'ai une requête qui fait WHERE nom = "toto" et que je suis certain qu'il n'y aura jamais deux fois "toto" dans mon champ "nom", l'index peut tout de même être utile ? Dans ce cas, ne serait-ce pas plutôt un index UNIQUE ?

    2) A partir de combien de valeurs cela devient utile ?

    3) Ok, j'avais lu cet exemple, mais parfois il est difficile de connaître la proportion à l'avance... dans ce cas, est-ce que la création de l'index à chaque coup, sans se soucier de cette proportion pourrait être pénalisante ?

    4) Ok, j'ai lu que cela pouvait être utile si on fait une requête between entre deux time ou date time, mais dans le cas d'un WHERE simple, est-ce vraiment intéressant ?

    5) Je me suis mal exprimé, je me plaçais dans un contexte MyIsam en fait, sans véritable FK avec contrainte d'unicité. Dans ce cas l'index est-il quand même créé automatiquement ou bien vaut-il mieux l'ajouter de toutes façons, même si elle ne prend que quelques valeurs ?

  5. #5
    Rédacteur/Modérateur

    Avatar de Antoun
    Homme Profil pro
    Architecte décisionnel
    Inscrit en
    Octobre 2006
    Messages
    6 291
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 55
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Architecte décisionnel
    Secteur : Conseil

    Informations forums :
    Inscription : Octobre 2006
    Messages : 6 291
    Par défaut
    Citation Envoyé par perenorel Voir le message
    @antoun :
    1) si j'ai une requête qui fait WHERE nom = "toto" et que je suis certain qu'il n'y aura jamais deux fois "toto" dans mon champ "nom", l'index peut tout de même être utile ?
    La réponse est la même que pour ta question 3). Ce qui fait l'efficacité d'un index, c'est d'abord sa sélectivité. Si tu as un seul "toto" parmi 3 personnes, ça veut dire une sélectivité de 33%, donc pas terrible (je fais abstraction du fait que pour une table si petite, il n'y a de toute façon pas besoin d'index).

    Si tu as un seul "toto" parmi 10 000 personnes, ton index a une sélectivité de 1/10 000 ; il évitera au SGBD de parcourir les 10 000 lignes de ta table des personnes.
    Citation Envoyé par perenorel Voir le message
    Dans ce cas, ne serait-ce pas plutôt un index UNIQUE ?
    Oui, bien sûr.
    Citation Envoyé par perenorel Voir le message
    2) A partir de combien de valeurs cela devient utile ?
    c'est toujours une question de sélectivité... L'optimiseur de MySQL n'utilise de toute façon pas les index au-dessus de 30% de sélectivité. Donc s'il y a deux ou trois valeurs bien réparties, l'index sera inutile. S'il y a 50% d'hommes, 49,9% de femmes, et 0,1% d'hermaphrodites, l'index sera très utile pour trouver les hermaphrodites...

    Pour le SET, c'est à peu près la même chose, sauf que ce qui va être indexé c'est la combinaison des éléments du SET. Donc avec un SET('a', 'b', 'c'), on a 2^3 = 8 possibilités, soit une sélectivité de 12,5 % si les huit combinaisons sont équiprobables.
    Citation Envoyé par perenorel Voir le message
    3) Ok, j'avais lu cet exemple, mais parfois il est difficile de connaître la proportion à l'avance... dans ce cas, est-ce que la création de l'index à chaque coup, sans se soucier de cette proportion pourrait être pénalisante ?
    "pénalisant" ne veut rien dire si on ne précise pas ce qu'on veut optimiser... un index est toujours pénalisant pour l'espace disque et pour les modifications de données. Pour un SELECT, on s'en remet normalement à l'optimiseur qui décide de passer par l'index ou non...

    Avec un optimiseur parfait, l'index ne serait donc jamais pénalisant pour le SELECT, puisqu'il serait ignoré dans tous les cas où il n'est pas rentable. Du coup, j'aurais tendance à te répondre oui, on crée l'index à chaque fois (sauf si on a des problèmes d'espace disque, si la performance des mises à jour est critique, si l'index est manifestement inutile), non pas parce que l'optimiseur est parfait, mais sans doute parce qu'il connaît son boulot mieux que moi.

    Citation Envoyé par perenorel Voir le message
    4) Ok, j'ai lu que cela pouvait être utile si on fait une requête between entre deux time ou date time, mais dans le cas d'un WHERE simple, est-ce vraiment intéressant ?
    Même réponse. L'index est d'autant plus intéressant qu'on a une bonne sélectivité, et la meilleure sélectivité est atteinte quand les valeurs sont uniques.

    Ceci dit, je ne vois pas en quoi une granularité à la seconde te garantirais l'unicité... c'est une dangereuse ignorance de la loi de Murphy.
    Citation Envoyé par perenorel Voir le message
    5) Je me suis mal exprimé, je me plaçais dans un contexte MyIsam en fait, sans véritable FK avec contrainte d'unicité. Dans ce cas l'index est-il quand même créé automatiquement ou bien vaut-il mieux l'ajouter de toutes façons, même si elle ne prend que quelques valeurs ?
    Non, sur MyISAM aucun index n'est créé... Sur les "quelques valeurs", voire mes réponses sur la sélectivité...

  6. #6
    Rédacteur

    Avatar de SQLpro
    Homme Profil pro
    Expert bases de données / SQL / MS SQL Server / Postgresql
    Inscrit en
    Mai 2002
    Messages
    22 002
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Var (Provence Alpes Côte d'Azur)

    Informations professionnelles :
    Activité : Expert bases de données / SQL / MS SQL Server / Postgresql
    Secteur : Conseil

    Informations forums :
    Inscription : Mai 2002
    Messages : 22 002
    Billets dans le blog
    6
    Par défaut
    Citation Envoyé par Antoun Voir le message
    5) MySQL crée de toute façon un index des deux côtés de la FK...
    Là tu t'avance un peu !!!!!!!!!!

    "
    InnoDB requires indexes on foreign keys and referenced keys so that foreign key checks can be fast and not require a table scan. In the referencing table, there must be an index where the foreign key columns are listed as the first columns in the same order. Such an index is created on the referencing table automatically if it does not exist. (This is in contrast to some older versions, in which indexes had to be created explicitly or the creation of foreign key constraints would fail.) index_name, if given, is used as described previously.
    "

    Lit bien : referencing table et non referenced table

    personnellement je n'ai jamais vu un SGBDR créer des index sur les clefs étrangères !!!!

    A +
    Frédéric Brouard - SQLpro - ARCHITECTE DE DONNÉES - expert SGBDR et langage SQL
    Le site sur les SGBD relationnels et le langage SQL: http://sqlpro.developpez.com/
    Blog SQL, SQL Server, SGBDR : http://blog.developpez.com/sqlpro
    Expert Microsoft SQL Server - M.V.P. (Most valuable Professional) MS Corp.
    Entreprise SQL SPOT : modélisation, conseils, audit, optimisation, formation...
    * * * * * Expertise SQL Server : http://mssqlserver.fr/ * * * * *

  7. #7
    Rédacteur/Modérateur

    Avatar de Antoun
    Homme Profil pro
    Architecte décisionnel
    Inscrit en
    Octobre 2006
    Messages
    6 291
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 55
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Architecte décisionnel
    Secteur : Conseil

    Informations forums :
    Inscription : Octobre 2006
    Messages : 6 291
    Par défaut
    Citation Envoyé par SQLpro Voir le message
    Lit bien : referencing table et non referenced table
    ach ! je m'étais stupidement laissé abuser par la phrase précédente ("InnoDB requires indexes on foreign keys and referenced keys so that foreign key checks can be fast") et je n'avais pas vu le changement d'objet...

    Citation Envoyé par SQLpro Voir le message
    personnellement je n'ai jamais vu un SGBDR créer des index sur les clefs étrangères !!!!
    Certes, mais tu seras d'accord avec moi pour dire que MySQL n'est pas un parangon d'orthodoxie

Discussions similaires

  1. Désactivation manuelle d'un index cluster pour quoi faire ?
    Par dily0403 dans le forum Administration
    Réponses: 4
    Dernier message: 24/10/2008, 22h42
  2. à quoi sert la propiété z-index?
    Par samsso2005 dans le forum Balisage (X)HTML et validation W3C
    Réponses: 1
    Dernier message: 24/05/2006, 18h37
  3. A quoi servent les index dans une BDD ?
    Par Melvine dans le forum Décisions SGBD
    Réponses: 3
    Dernier message: 25/10/2005, 12h14

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo