Bonjour,
Je possèdes environ 1to de fichiers binaire de données stocks Ticks (trades and quotes).
Pour faire simple ce sont des informations de prix des actions.
une journée pour une action est environ de 100,000 lignes par symboles (certains symbole dépasse le millions).
j'ai a peu près 5,000 symboles.
Je cherche à mettre une partie des ces informations en base SQLServer, je démarre sur une version 2016 RC1 afin de profiter des columnstore cluster index, mais je pense que la version 2014 doit permettre de faire la même chose.
Je vois 4 façons de gérer les données (les champs sont simplifiés),
solution 1: tout dans la même table en donnant une priorité au symbole
SymbolId (int)
DateAndTime (Datetime)
Price (real)
Quantity (int)
+ permet de faire du traitement analytique
- insertion lente de façon quotidienne
solution 2: tout dans la même table en donnant une priorité à la date
DateAndTime (Datetime)
SymbolId (int)
Price (real)
Quantity (int)
+ permet de faire du traitement analytique
- requétes lentes pour un même symbole puisque l'on est trié par date
solution 3: une table par symbol
DateAndTime (Datetime)
Price (real)
Quantity (int)
+ rapide en insertion et en requete (si symbol unique)
- analyse compliqué en fonction des besoin
solution 4: une table par date
SymbolId (int)
Price (real)
Quantity (int)
+ rapide en insertion et en requete (si date unique)
- analyse compliqué en fonction des besoin
Partager