Bonjour à tous,
Ne connaissant pas du tout les bases noSQL, je viens vers vous afin de m'aider dans mes choix de conception sur une base de donnée.
Mon projet consiste à récupérer un grand nombre de données de navigation (non-structurable via un système SQL classique au vue de la disparité des informations) pour chacun de mes utilisateurs (identifiable via un id unique connu).
- Le nombre d'utilisateurs va ce compter en millions
- le nombre d'infos va peser plusieurs Go de données.
- Cette base sera surtout utilisée pour du select afin d'obtenir toute les actions sur un internaute, y définir son comportement via d'autres algo, etc..
La solution qui me parait la plus adapté à ce problème est l'utilisation de mongoDB, j'ai donc regarder un peu la doc mais n'ayant pas l'habitude de ce genre de structure je suis parti sur deux possibilités de conception :
- Créer une collection par utilisateur, et utiliser cette collection pour y stocker un fichier à chaque donnée de navigation
- Créer une seul collection et créer un fichier par utilisateur dans cette collection (mais la taille du fichier risque d’être élevé, et l'ajout/édition d'infos me force à recalculer tout le fichier).
Je ne connait pas les limites et autres soucis potentiels liée à ces volumes sur une base de ce type, j'aimerai donc des avis.
En espérant avoir été assez clair
Partager