Bonjour,

je tente d'utiliser hadoop via ce manager (Cloudera free Manager 4) mais j'ai beaucoup de difficulté à administrer le cluster.

Dans ce manager, par exemple, il n'y a pas de sqoop installé de base, ou alors hive n'est pas directement accessible.

La difficulté principale, c'est que la suite d'outils hadoop est très (trop) complexe et j'ai du mal à trouver une doc complète et bien expliquée.

J'ai donc installé ma machine ubuntu, téléchargé et installé de cloudera free manager, et tout semble ok.

Mais lorsque je me rend sur l'interface beeswax, la, c'est mle début des soucis, j'ai un permission denied lorsque je tente une requete hive.

La solution 'bricolage' a été de créer le meme user sur la machine, puisque lors du lancement de l'interface beeswax on nous demande de définir un user, mais ca parait bizarre qu'il ne soit pas créé auto???

Puis j'ai installé sqoop et la j'arrive à exécuter un list tables, mais lors d'un import, le map reduce se fige à 0% 0% et aucune erreur levée.

J'ai tenté de changer le jdk, de changer d'user, je ne comprend pas et n'ayant pas d'erreurs c'est comme chercher une aiguille dans une botte de foin.

Bref, j'ai plusieurs question:

1/ Vous, comment administrez vous votre cluster hadoop???
2/ Avez vous rencontré ce genre de problèmes?

Je vous remercie d'avance

PS : je précise d'avance que l'utilisation du nosql est bien préconisée dans mon cas, puisqu'il s'agit de stockage et de traitement de plusieurs téra octets de données.