Bonsoir,

Y'a t il quelqu'un qui a des benchmarks pour Apache Spark avec Hive?

C'est pour gérer un datawarehouse qui vas recevoir environ 250 000 000 de lignes par jour. A terme, la base devrait avoir une taille d'environ 50To.

Merci d'avance.