Bonjour à tous,
j'expérimente les technos du Big Data et je constate qu'après avoir ingérer différentes sources de données, il va vite devenir difficile de retrouver mes petits.
Du coup j'ai mis en place une arborescence du genre : Data_brutes\[SOURCE]\[Nom de la table]
J'aimerai savoir s'il y a des choses à éviter et à faire pour s'y retrouver et organiser un datalake?
Merci de vos retours.
A+