IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Hadoop & co Discussion :

Opinions pour un projet Hadoop


Sujet :

Hadoop & co

  1. #1
    Membre confirmé
    Avatar de Dam2227
    Inscrit en
    Juin 2007
    Messages
    343
    Détails du profil
    Informations personnelles :
    Âge : 39

    Informations forums :
    Inscription : Juin 2007
    Messages : 343
    Points : 487
    Points
    487
    Par défaut Opinions pour un projet Hadoop
    Bonjour

    J'ai une question sur Hadoop. J'ai en tête l'idée d'analyser des données en ligne en utilisant Hadoop et en parallélisant les tâches. En gros, je voudrais uploader un dossier comprenant plein de fichiers, les envoyer vers divers ordinateurs pour analyse (en utilisant Amazon Web Service par exemple), où chaque ordinateurs exécutera une tâche, puis récupérer les données. Là où je voudrais votre opinion, c'est que la tâche à accomplir n'est pas juste compter des mots, mais exécuter un fit relativement complexe des données. En gros, je veux utiliser Hadoop pour des faire des maths(une tâche complexe sur plusieurs milliers de lignes de code) sur plein de données. Est-ce une bonne idée? Est-ce possible d'implémenter ce genre de tâches en utilisant Hadoop, où est-ce que vous avez des alternatives plus adaptées à mon problème? D'autres idées?

    Merci pour votre aide!
    Matlab 7.14.0.739 (R2012a)
    C/C++, python, R, SQL, Pig, MR

    Ma philosophie: Ne rien faire, mais le faire bien.

  2. #2
    Membre régulier
    Inscrit en
    Novembre 2006
    Messages
    40
    Détails du profil
    Informations forums :
    Inscription : Novembre 2006
    Messages : 40
    Points : 117
    Points
    117
    Par défaut
    De maniere générale, l'utilisation d'hadoop se justifie si les traitement traitent + de 5 TO de données. Si c'est pour faire un map reduce sur un contenu de quelques Gigas, les performances seront meilleures si tu éclates toi même ton traitement sur plusieurs machines.

    Sachant que le débug d'un map reduce n'est pas a la portée de tout le monde, et les outils actuels ne permettent pas de débugger correctement.

  3. #3
    Membre confirmé
    Avatar de Dam2227
    Inscrit en
    Juin 2007
    Messages
    343
    Détails du profil
    Informations personnelles :
    Âge : 39

    Informations forums :
    Inscription : Juin 2007
    Messages : 343
    Points : 487
    Points
    487
    Par défaut
    Je ne m'attend pas a ce que ce soit facile, mais si c'est possible, c'est le principal.

    Merci pour la réponse!
    Matlab 7.14.0.739 (R2012a)
    C/C++, python, R, SQL, Pig, MR

    Ma philosophie: Ne rien faire, mais le faire bien.

Discussions similaires

  1. Assistance pour un projet logiciel perso
    Par sincère dans le forum Bases de données
    Réponses: 3
    Dernier message: 01/11/2004, 13h10
  2. Choix d'un SGBDR pour mon projet: Interbase?
    Par super16 dans le forum Décisions SGBD
    Réponses: 1
    Dernier message: 09/07/2004, 08h15

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo