Précédent   Forum des professionnels en informatique > Bases de données > MS SQL-Server > Développement
Développement Forum d'entraide sur le Transact-SQL, le CLR, les procédures stockées, les triggers, les requêtes SQL
Partagez cette discussion sur d'autres réseaux sociaux : Viadeo Twitter Google Facebook Digg Delicious MySpace Yahoo
Réponse Proposer ce sujet en actualité
 
Outils de la discussion
Publicité
'
Vieux 31/10/2011, 17h26   #1
Membre chevronné
 
Inscription : novembre 2007
Messages : 1 154
Détails du profil
Informations personnelles :
Âge : 50

Informations forums :
Inscription : novembre 2007
Messages : 1 154
Points : 659
Points : 659
Envoyer un message via ICQ à Papy214
Par défaut DISTINCT ou GROUP BY

Bonjour,

Je vais en faire sursauter plus d'un avec ma question mais tant pis
Je compte sur vous pour ne pas trop m'incendier

Quelle est la différence entre DISTINCT et GROUP BY ?

Parce que si je fais

Code :
SELECT DISTINCT texte FROM textes
ou

Code :
SELECT texte FROM textes GROUP BY texte
ça me donne le même résultat.
Papy214 est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 31/10/2011, 21h16   #2
Membre habitué
 
Avatar de tfc3146
 
Homme Robert Labrousse
Développeur décisionnel
Inscription : février 2009
Messages : 79
Détails du profil
Informations personnelles :
Nom : Homme Robert Labrousse
Localisation : France

Informations professionnelles :
Activité : Développeur décisionnel
Secteur : Boutique - Magasin

Informations forums :
Inscription : février 2009
Messages : 79
Points : 134
Points : 134
Bonsoir,

Le "GROUP BY" comme son nom l'indique vous permet de faire une agrégation par champ "textes".
Il est donc possible par exemple de compter le nombre de fois où apparait le champ "textes" :
Code :
1
2
3
 
SELECT texte, COUNT(*)
 FROM textes GROUP BY texte
Dans votre cas, le "GROUP BY" ne s'impose en effet pas car vous n'avez pas la nécessité d'utiliser une fonction d'agrégation (moyenne, maximum, minimum, compter les lignes, ...).
Le "DISTINCT" permet juste de supprimer les doublons sur l'attribut "textes".

En espérant avoir été clair.
__________________
Citation:
C'est en faisant n'importe quoi qu'on devient n'importe qui
Si un message vous a aidé, n'hésitez pas à mettre +1
tfc3146 est déconnecté   Envoyer un message privé Réponse avec citation 10
Vieux 01/11/2011, 11h02   #3
Membre chevronné
 
Inscription : novembre 2007
Messages : 1 154
Détails du profil
Informations personnelles :
Âge : 50

Informations forums :
Inscription : novembre 2007
Messages : 1 154
Points : 659
Points : 659
Envoyer un message via ICQ à Papy214
Ok, donc si je comprends, le DISTINCT est approprié dans tous les cas où on n'utilise pas de fonction d'agrégation.

Merci
Papy214 est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 01/11/2011, 15h45   #4
Modérateur

 
Avatar de elsuket
 
Homme Nicolas Souquet
Administrateur de base de données
Inscription : janvier 2005
Messages : 4 670
Détails du profil
Informations personnelles :
Nom : Homme Nicolas Souquet
Âge : 30
Localisation : Thaïlande

Informations professionnelles :
Activité : Administrateur de base de données
Secteur : High Tech - Éditeur de logiciels

Informations forums :
Inscription : janvier 2005
Messages : 4 670
Points : 8 732
Points : 8 732
Bonjour,

Citation:
Quelle est la différence entre DISTINCT et GROUP BY ?
Avec l'exemple que vous donnez, il est normal que vous obteniez le même résultat.
D'ailleurs le plan d'exécution de ces deux requêtes est strictement le même.

Maintenant GROUP BY est destiné aux calculs d'aggrégats, comme SUM(), COUNT(), AVG(), ..., qui vous sont retournés groupés par une ou plusieurs colonnes ou expressions, à raison d'une ligne par groupe.

En revanche DISTINCT, lui, ne vous retournera jamais que les tuples distincts, par une ou plusieurs colonnes ou expressions. Rien de plus

GROUP BY permet aussi de filtrer les groupes suivant la valeurs d'un agrégat, à l'aide de la clause HAVING.
Vous pouvez donc trouver les machines qui ont eut plus de 100 pannes (HAVING COUNT(*) > 100) sur une période donnée, par exemple.

Notez également que GROUP BY bénéficie de calculs avancés à l'aide des options WITH ROLLUP, WITH CUBE, WITH GROUPING SETS, ...

@++
__________________
En bases de données relationnelles SQL, il n'y a ni tableaux, ni enregistrements, ni champs: il y a des tables, des lignes et des colonnes.
Blog | Profil| Consulter ou télécharger les fichiers d'aide de SQL Server, des versions 2000 à 2012
elsuket est déconnecté   Envoyer un message privé Réponse avec citation 10
Vieux 02/11/2011, 09h48   #5
Membre chevronné
 
Inscription : novembre 2007
Messages : 1 154
Détails du profil
Informations personnelles :
Âge : 50

Informations forums :
Inscription : novembre 2007
Messages : 1 154
Points : 659
Points : 659
Envoyer un message via ICQ à Papy214
Bonjour Nicolas,

A nouveau, merci pour toutes ces précisions.
Je ne vois pas tout de suite à quoi servent "WITH ROLLUP, WITH CUBE, WITH GROUPING SETS" mais je m'y intéresserai.

Par contre, il me vient une question en complément. Quand on utilise une fonction d'agrégation dans un "GROUP BY", est que SQL Server fait 2 fois le calcul, une pour le "SELECT et une pour le "GROUP BY" ?

Papy !
Papy214 est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 02/11/2011, 15h16   #6
Modérateur

 
Avatar de elsuket
 
Homme Nicolas Souquet
Administrateur de base de données
Inscription : janvier 2005
Messages : 4 670
Détails du profil
Informations personnelles :
Nom : Homme Nicolas Souquet
Âge : 30
Localisation : Thaïlande

Informations professionnelles :
Activité : Administrateur de base de données
Secteur : High Tech - Éditeur de logiciels

Informations forums :
Inscription : janvier 2005
Messages : 4 670
Points : 8 732
Points : 8 732
Citation:
A nouveau, merci pour toutes ces précisions.
Avec plaisir

Citation:
Je ne vois pas tout de suite à quoi servent "WITH ROLLUP, WITH CUBE, WITH GROUPING SETS" mais je m'y intéresserai.
WITH ROLLUP et WITH CUBE permettent d'obtenir en sus les valeurs de l’agrégat pour les groupes qui sont constitués par moins de colonnes ou d'expressions que les colonnes ou expressions sur lesquelles l'agrégat est calculé.
Donc par exemple, si nous souhaitons connaître le nombre pannes sur toutes les machines par mois, on obtiendra en sus le total par machine et le total par mois.
En tous les cas, suivant le nombre de colonnes ou d'expressions sur lequel l'agrégat est calculé, le résultat me paraît difficilement exploitable dans un autre contexte que pour des statistiques.
J'aimerai savoir s'il y a des participants à ce forum qui ont utilisé ces clauses dans une application dont le but n'est pas statistique.

WITH GROUPING SETS permet de façon similaire de définir les groupes pour lesquels on veut obtenir un calcul de l'agrégat à l'intérieur de celui-ci.

Citation:
Par contre, il me vient une question en complément. Quand on utilise une fonction d'agrégation dans un "GROUP BY", est que SQL Server fait 2 fois le calcul, une pour le "SELECT et une pour le "GROUP BY" ?
Il y a forcément lecture des données et calcul de l'agrégat à la volée, mais ensuite.
Maintenant si la ou les tables(s) sont correctement indexées, cela ne pose pas de problème.
Si cela en devient un, il faut alors penser aux vues indexées qui sont terriblement efficaces, entre autres et principalement, pour les agrégats.

@++
__________________
En bases de données relationnelles SQL, il n'y a ni tableaux, ni enregistrements, ni champs: il y a des tables, des lignes et des colonnes.
Blog | Profil| Consulter ou télécharger les fichiers d'aide de SQL Server, des versions 2000 à 2012
elsuket est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 02/11/2011, 21h31   #7
Membre chevronné
 
Inscription : novembre 2007
Messages : 1 154
Détails du profil
Informations personnelles :
Âge : 50

Informations forums :
Inscription : novembre 2007
Messages : 1 154
Points : 659
Points : 659
Envoyer un message via ICQ à Papy214
Ces ROLLUP, CUBE et GROUPING SET ne doivent effectivement pas être utilisés souvent.
Il faudra que je cherche quelques exemples "simples" d'utilisation de ces éléments pour me faire une meilleure idée mais au moins j'ai un bon point dé départ.

Les index, je sais que c'est très utile mais je ne pensais que ça pouvait optimiser les fonctions d'agrégation. Je croyais que c'était plutôt pour les tri.

Je vais continuer ma découverte.
Papy214 est déconnecté   Envoyer un message privé Réponse avec citation 00
Réponse Proposer ce sujet en actualité Cette discussion est résolue.
Outils de la discussion



Fuseau horaire GMT +2. Il est actuellement 10h16.


 
 
 
 
Partenaires

Hébergement Web