Regroupement/Optimisation de tables identiques

**lefju cabro** · 28/03/2017, 09h16

Bonjour,

Pour mon premier projet SQL, je dois migrer une base de données DBF en base Firebird 3 sous Delphi. J'ai récupéré la modélisation faîtes sous DBF, certaines tables sont identiques (cf. image ci-dessous) et je pense qu'il doit exister une méthode pour regrouper et optimiser l'ensemble sous FB. Est-ce que je peux externaliser chaque champ code_table et commentaire de toutes les tables ? Si oui, comment représenter l'ensemble ? Comment optimiser les requêtes ?

Merci pour vos conseils

Nom : DB_Test.png
Affichages : 224
Taille : 40,3 Ko

Nom : DB_Test.png
Affichages : 224
Taille : 40,3 Ko

**StringBuilder** · 31/03/2017, 19h14

Sans plus de détails "fonctionnels", c'est un peu compliqué de répondre de manière ferme.

Votre problématique ressemble grandement aux classiques tables "catalogue".

C'est à dire par exemple des couleurs, des unités de mesure, des classifications non hiérachiques, etc.

Souvent, dans les logiciels type "ERP" ou le nombre de ces catalogues n'est pas figé et peu évoluer dans le temps, on trouve des tables "poubelles" avec 3 colonnes : "code catalogue, id, nom".

Ça se traduit par des lenteurs "inexpliquables" (mon cul, c'est tout à fait explicable, c'est juste modélisé comme de la merde) et des limitations (hiérarchie impossible ou uniquement limitée aux catalogues entre eux) ou des abominations (20 colonnes à NULL pour chaque ligne, car "au cas où on sait jamais si on a besoin d'un attribut pour un des catalogues"), etc.

Donc non, 1 entité = 1 table. Même si elle a la même structure.

Comme ça, le jour où une des entités évolue (hiérarchie, ajout d'attributs, de contraintes, etc.) il n'y a pas d'impact sur les autres.

Comme le suggère SQLPro dans d'autres sujet, cela ne vous dispense pas d'une vue qui concatène toutes ces entités à grand coup de UNION ALL pour charger en mémoire (cache) la liste de toutes vos valeurs de catalogues en une seule requête.

**lefju cabro** · 03/04/2017, 09h18

Bonjour StringBuilder,

Merci pour votre message et vos conseils.

Pour expliciter la partie fonctionnelle, chaque table correspond à un élément d'une voiture (roue, volant, porte...) et l'ensemble (table_source) correspond à la voiture complète.

Pour résumer, il vaut mieux "exploser" le plus possible les tables pour une meilleure optimisation même si on prend plus de place sur le disque (à cause de la multiplication des champs type varChar(255)).

**StringBuilder** · 03/04/2017, 10h17

Envoyé par lefju cabro

Bonjour StringBuilder,

Merci pour votre message et vos conseils.

De rien, on est là pour ça

Envoyé par lefju cabro

Pour expliciter la partie fonctionnelle, chaque table correspond à un élément d'une voiture (roue, volant, porte...) et l'ensemble (table_source) correspond à la voiture complète.

Ok, donc on est bien dans un cas où "demain" votre modèle pourra évoluer : la roue peut avoir différentes jantes, de différents matériaux, diamètre, largeur, etc.
Idem pour le volant qui peut avoir différentes finitions, diamètres, etc. Potentiellement, la porte aura des options, etc.
=> Donc il est beaucoup plus sage d'avoir une table par attribut plutôt qu'une table poubelle qui contient tout : car si demain on doit stocker les options de la porte est les dimensions de la roue dans la même table, on va multiplier les colonnes "poubelle" (null pour 99% des lignes, et d'un d'un type "générique" afin de permettre n'importe quelle valeur de n'importe quel attribut).

Envoyé par lefju cabro

Pour résumer, il vaut mieux "exploser" le plus possible les tables pour une meilleure optimisation même si on prend plus de place sur le disque (à cause de la multiplication des champs type varChar(255)).

Oui, en revanche, contrairement à ce que vous croyez, ça prend moins de place d'avoir N petites tables sans colonnes inutiles et des type des données adaptés aux besoin plutôt qu'une table avec 30 colonnes nulles et des DECIMAL(40) pour stocker un booléen (ou un varchar(255) pour stocker l'indice de vitesse du pneu)

**StringBuilder** · 03/04/2017, 10h26

PS: J'avais pas fait gaffe à vos colonnes "commentaire" en varchar(255).

Préférez le type "varchar(max)" car autant il permet de contenir BEAUCOUP plus de caractères (2 ^ 31-1 caractères soit 2 147 483 647 - 2 Go -) sans grosse perte de place, mais ces colonnes spéciales peuvent être stockées dans un fichier de données séparé, ce qui permet de monter en charge de façon bien plus robuste et évite de polluer les données avec du commentaire qui n'est pas utilisé dans 90% des requêtes.

=> Si je cherche toutes les voitures qui ont des jantes allu de 17", je me moque de savoir que Ghyslène a demandé au livreur de poser les jantes du le quai de chargement A...

**lefju cabro** · 04/04/2017, 13h52

Merci pour votre complément.

Préférez le type "varchar(max)"

OK

ces colonnes spéciales peuvent être stockées dans un fichier de données séparé, ce qui permet de monter en charge de façon bien plus robuste

Comment faire pour créer ces fichiers séparés

? On ne parle pas de BLOB ?

évite de polluer les données avec du commentaire qui n'est pas utilisé dans 90% des requêtes

Si on ne sélectionne pas la colonne commentaire (qui ne sera pas souvent utilisée), les requêtes seront robustes/rapides même si on ne place pas le champ commentaire dans une fichier séparé ?

**StringBuilder** · 04/04/2017, 14h27

Oui, un varchar(max) est considéré comme un LOB.

De ce fait, fichier séparé ou non, les données ne sont pas stockées dans la ligne elle-même : ça accélèrera de toute façon vos requêtes.

Le mieux étant tout de même de créer un fichier dédié aux LOB :

Code sql :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
5
6
7
8
9
10
11
12
 
CREATE TABLE [dbo].[LOBTest](
 
[c1] [int] IDENTITY(1,1) NOT NULL,
 
[c2] [char](8000) NULL,
 
[c3] [varchar](max) NULL
 
) ON [Filegroup1]
 
  TEXTIMAGE_ON [LOBFilegroup]

=> Dans cet exemple, la table est stockée dans le filegroup "Filegroup1" et la colonne c3 dans le filegroup "logfilegroup".

Ceci permet de séparer sur des disques physiques différents notamment.

**aieeeuuuuu** · 04/04/2017, 16h21

Bonjour,

Envoyé par StringBuilder

Oui, un varchar(max) est considéré comme un LOB.

De ce fait, fichier séparé ou non, les données ne sont pas stockées dans la ligne elle-même

Sauf erreur de ma part, un varchar(max) sera stocké en ligne tant... qu'il tiendra dans la ligne. En d'autre termes, un varchar(max) contenant quelques caractères sera stocké en ligne, puis déplacé uniquement si la ligne dépasse 8ko (par exemple lors d'un update).
Si un nouvel update diminue de nouveau la taille du varchar, il ne sera pas réintégré lors de la mise à jour (mais le sera lors d'une reconstruction de l'index cluster ou heap).

**SQLpro** · 05/04/2017, 11h41

Envoyé par aieeeuuuuu

Bonjour,
Sauf erreur de ma part, un varchar(max) sera stocké en ligne tant... qu'il tiendra dans la ligne. En d'autre termes, un varchar(max) contenant quelques caractères sera stocké en ligne, puis déplacé uniquement si la ligne dépasse 8ko (par exemple lors d'un update).
Si un nouvel update diminue de nouveau la taille du varchar, il ne sera pas réintégré lors de la mise à jour (mais le sera lors d'une reconstruction de l'index cluster ou heap).

Oui et non et c'est spécifique à SQL Server.

Lorsque vous créez une table dans SQL Server vous pouvez préciser dans quel espace de stockage les données y seront mises. Pour les LOBS (BLOB, CLOB, NCLOB, XML, et données de SIG) vous pouvez spécifier un espace de stockage différent des données relationnels, avec la directive TEXTIMAGE_ON, hélas rarement utilisée.
Comme cela on ne mélange pas données relationnelles et LOBS.

A +

Regroupement/Optimisation de tables identiques

Langage SQL

Discussions similaires

Partager

Partager