Bonjour,

Je démarre sur Hadoop (Horton) et travaille plus spécifiquement sur les mécanismes de HIVE, entre autres :
- le format des fichiers / leur structure / leurs apports
- l'implémentation des jointures par MapReduce / TEZ, etc.
- les mécanismes "optimisant" par exemple l'usage de la vectorisation
etc. etc. etc. :-)

Je me pose bien des questions dont une, et bien qu'il y ait myriade d'articles sur ces sujets, je n'ai jamais lu une réponse satisfaisante.

Comment faites-vous pour mesurer l'efficacité d'une requête ?
J'entends par là, étant donné qu'il est quasi impossible de donner un temps d'exécution pour une requête HIVE (cela dépend de trop de choses), comment estimer de manière intrinsèque qu'une requête n'est pas bien optimisé ?

Si vous avez quelques idées sur le sujet... ;-)

Merci².