Bonjour,

je viens vers vous pour avoir vos avis et surtout vos retours d’expériences.

j'entends souvent dire que les jointures sont a proscrire dans le monde hadoop avec hive ou spark.

Cependant, je suis sur un projet ou je dois reprendre une partie de mon DWH de Teradata vers hadoop. Donc, j'aurai certainement un nombre assez important de jointure à faire sur une volumétrie importante.

Des conseils à me donner ?


Merci d'avance.