Bonjour à tous,
Je suis actuellement en formation Méthode et Techniques des S.I.G (Système d'Informations Géographiques) et dans le cadre de cette formation, j'apprends la création de MCD et MLD avec la méthode MERISE, et dans le cadre d'un projet personnel je souhaite me créer une base de données portant sur la NBA comme je l'ai marqué dans le titre. Je travaille avec le logiciel JMerise.
Comme données de départ j'ai récupéré 3 fichiers que j'ai trouvé :
- player_data(nom,année de début,année de fin,position,taille,poids,date de naissance,college )
- players( nom,taille,poids,college,ville de naissance,état de naissance)
-season_stats(année,nom du joueur,position, age,équipe,et beaucoup de champs de stats )
Pour que vous puissiez avoir une vue d'ensemble des données de départ j'ai limité les stats et les joueurs aux deux premières années des fichiers à savoir 1950 et 1951.
Voici le fichier
nba_players_stats_mod.rar
Je voudrais ensuite intégrer des fichiers avec les coordonnées et les limites des états afin de pouvoir m'entraîner aux requêtes SQL sur Postgre et Postgis. Je ne pense pas avoir de soucis avec cette étape. Les villes apparaîtront sous forme de point sur la carte,ou éventuellement de polygones.
Si je poste ici c'est que lors de la réalisation du MCD je me suis posé plusieurs questions et j'aimerais avoir votre avis sur la meilleure facon de le réaliser :
-Les statistiques sont rangées par années et un même joueur peut apparaître plusieurs fois dans les stats d'une année avec une équipe différentes. Du coup comment organiser les relations entre les entités joueurs, stats et équipes et les années ( j'y reviens plus bas ). C'est vraiment ce point la sur lequel j'ai le plus de mal et je ne sais pas vraiment quelle serait la meilleure organisation
- Lorsqu'un joueur a joué dans plusieurs équipes il y a une ligne avec l'ensemble de ses stats ( si il a joué 15 matchs avec l'équipe A et 12 avec l'équipe B il y aura 27 matchs dans TOT ). Du coup comment intégrer cette colonne TOT, est-ce qu'il faut la considérer comme une équipe ou tout simplement ne pas la prendre
- Comment intégrer les différentes années comprises dans le MCD,est ce qu'on les met directement dans les stats tel quel, ou créer une table par année,mais du coup vu que le fichier commence en 1950, cela ferait énormément de tables.
- Quant aux statistiques elles même il y a souvent une colonne qui est le résumé de deux autres (par exemple FG% et le pourcentage entre les FG réussi(FG) et les FG tentés (FGA). Est ce pertinent afin de limiter le nombre de champs dans la colonne stats d'en faire une entité à part et de la relier à l'entité stats.
Voila les différents modèles que j'ai créé, j'attends vos avis.
Dans celui ci les joueurs et les équipes ne sont pas reliées directement entre elles mais elle le sont par l'entité stats.
Et dans celui ci sur lequel je travaille actuellement les stats sont dans une relation entre les joueurs et les équipes .
J'attends vos avis et comme je l'ai dit plus haut le point qui me pose le plus problème c'est comment bien lier les 4 entités principales( ou 3 si les années ne sont pas une entité) joueurs, équipes et stats.
Merci d'avance
Partager