IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Big Data Discussion :

se former sur le big data , clusters, etc avec un petit PC


Sujet :

Big Data

  1. #1
    Membre averti Avatar de mapmip
    Profil pro
    ulla
    Inscrit en
    Juillet 2006
    Messages
    1 315
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations professionnelles :
    Activité : ulla

    Informations forums :
    Inscription : Juillet 2006
    Messages : 1 315
    Points : 345
    Points
    345
    Par défaut se former sur le big data , clusters, etc avec un petit PC
    bonjour,

    je souhaite me former sur le big data, hadoop, l'architecture distribuée, les clusters, etc
    sur mon petit PC. Est-ce possible ?

    Merci d'avance

  2. #2
    Membre habitué
    Homme Profil pro
    Inscrit en
    Octobre 2007
    Messages
    190
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations forums :
    Inscription : Octobre 2007
    Messages : 190
    Points : 182
    Points
    182
    Par défaut
    Citation Envoyé par mapmip Voir le message
    bonjour,

    je souhaite me former sur le big data, hadoop, l'architecture distribuée, les clusters, etc
    sur mon petit PC. Est-ce possible ?

    Merci d'avance
    cela dépend de votre config pc.

    pour hadoop 2, il faut un minimum de 8GB ram en windows ou linux,
    pour hadoop 1, on peut faire avec 4GB, mais c'est une galère, j'imagine même pas. l'hdfs peut être, le map reduce, j'en doute.


    maintenant il y a des bons tuto sur developpez.com que vous pouvez suivre, mais il faut linux sur pc ou via virtualbox/vmware.
    vous pouvez commencer par un simple node, hadoop est très très gourmand en ressource

    ils sont bien fait, la distrib cloudera facilite l'installation., c'est l'hadoop 2

    http://mbaron.developpez.com/tutorie...fs-map-reduce/

    http://mbaron.developpez.com/tutorie...cloudera-cdh5/

    http://mbaron.developpez.com/tutorie...cloudera-cdh5/


    alternative, pour un premier contact, vous pouvez commencer par l'installation de virtual box ou vmware selon les gouts et le ressenti.

    moi j'ai installé virtualbox

    https://www.virtualbox.org/

    puis d'une version sandbox des deux distribution

    cloudera

    http://www.cloudera.com/content/clou...cdh-5-4-x.html

    hortonworks

    http://hortonworks.com/products/hort...ndbox/#install

    sandbox 2.2.4 c'est hadoop 2
    sandbox 1.3 hadoop 1

    Moi je passe par apache hadoop, je fais tout à la main sur un vrai cluster, ainsi que son ecosysteme module par module, c'est comme ca que j'apprends, après
    quand je regarderai les distrib cloudera,hortonworks,mapr, ca sera plus facile.

    JP

  3. #3
    Membre averti
    Homme Profil pro
    Consultant en Business Intelligence
    Inscrit en
    Mai 2015
    Messages
    107
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Consultant en Business Intelligence
    Secteur : Conseil

    Informations forums :
    Inscription : Mai 2015
    Messages : 107
    Points : 348
    Points
    348
    Par défaut
    Salut,

    Monter un cluster Hadoop sur un petit pc n'est pas possible.

    Pour pouvoir étudier/se former dans un environnement Hadoop clusterisé, il te faudra au minumulm 3 machines virtuelles : une maître et deux esclaves.

    Imaginons que chaque VM prenne 4Go de RAM, on arrive donc à 12Go (sans compter la VM Maitre où on serait plus autour de 8Go).
    De plus, il faudra pas mal d'espace disque afin de ne pas se trouver à court au fil du temps.

    Après, tu peux très bien te former sur une seul VM qui aura tout les rôles, mais dans ce cas tu ne pourras pas te confronter à une architecture distribuée.
    Et même dans ce cas, il te faudra au minimum 8Go de mémoire sur ta machine.
    Je l'ai déjà fait avec une machine 4Go, et je confirme, c'est une galère et très inconfortable.

  4. #4
    Membre averti Avatar de mapmip
    Profil pro
    ulla
    Inscrit en
    Juillet 2006
    Messages
    1 315
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations professionnelles :
    Activité : ulla

    Informations forums :
    Inscription : Juillet 2006
    Messages : 1 315
    Points : 345
    Points
    345
    Par défaut
    en gros le big data c'est pour les big porte monnaies

  5. #5
    Membre averti
    Homme Profil pro
    Consultant en Business Intelligence
    Inscrit en
    Mai 2015
    Messages
    107
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Consultant en Business Intelligence
    Secteur : Conseil

    Informations forums :
    Inscription : Mai 2015
    Messages : 107
    Points : 348
    Points
    348
    Par défaut
    Tout dépend en fait...

    Quelle est ta config?

    Après tu as la solution Amazon Web Services : http://aws.amazon.com/fr/ qui te permet de monter un cluster sans trop dépenser.
    Et surtout tu as des offres où tu ne payes que ce que tu consommes, c'est à dire que si tu éteint tes machines, tu ne payes pas (attention de bien lire les conditions tarifaire quand même).

    C'est un calcul à faire mais je pense que c'est toujours moins cher que de se racheter une nouvelle machine performante, du moins à court terme.

  6. #6
    Membre éclairé Avatar de bstevy
    Homme Profil pro
    Solutions Architect
    Inscrit en
    Mai 2009
    Messages
    552
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 38
    Localisation : Japon

    Informations professionnelles :
    Activité : Solutions Architect
    Secteur : Finance

    Informations forums :
    Inscription : Mai 2009
    Messages : 552
    Points : 870
    Points
    870
    Par défaut
    Citation Envoyé par mapmip Voir le message
    en gros le big data c'est pour les big porte monnaies
    Non, c'est pas vraiment ca... le principe, c'est justement de pouvoir stocker la donnée sur des simples disque dur par cher, et d'en avoir plein de petit qui d'un point de vue d'une entreprise ne coute rien par rapport à d'enorme serveur ultra performant...

    Mais apres, c'est sur qu'il faut au moins qlq serveur car on parle de donnée n'entrant normalement pas sur un petit volume... de ce fait ton "petit pc" n'est pas censé avoir de big data car il est trop petit pour ne serait ce que stocker la donnée...

  7. #7
    Membre averti
    Homme Profil pro
    Consultant en Business Intelligence
    Inscrit en
    Mai 2015
    Messages
    107
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Consultant en Business Intelligence
    Secteur : Conseil

    Informations forums :
    Inscription : Mai 2015
    Messages : 107
    Points : 348
    Points
    348
    Par défaut
    Et sans compter le fait que les parties traitement de données/fonctionnement du cluster peuvent être couteuses en terme de mémoire.

  8. #8
    Membre expérimenté

    Homme Profil pro
    Auditeur informatique
    Inscrit en
    Novembre 2014
    Messages
    815
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 40
    Localisation : Tunisie

    Informations professionnelles :
    Activité : Auditeur informatique
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Novembre 2014
    Messages : 815
    Points : 1 350
    Points
    1 350
    Billets dans le blog
    2
    Par défaut
    Citation Envoyé par Moctezuma Voir le message
    Et sans compter le fait que les parties traitement de données/fonctionnement du cluster peuvent être couteuses en terme de mémoire.
    super merci bien

  9. #9
    Nouveau membre du Club
    Homme Profil pro
    Ingénieur Études et Développement
    Inscrit en
    Décembre 2011
    Messages
    23
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Maroc

    Informations professionnelles :
    Activité : Ingénieur Études et Développement
    Secteur : High Tech - Électronique et micro-électronique

    Informations forums :
    Inscription : Décembre 2011
    Messages : 23
    Points : 30
    Points
    30
    Par défaut
    Pour tout résumer tu peut faire du Big Data sur ta machine en utilisant un solution virtuel comme Cloudera si tu veux, mais ça dépend de ta CONFIG !!! si tu as un PC puissant i7 (comme ASUS) qui supporte par exemple 16 Go de RAM, 1 To en Disque.....etc tu peux faire du Big Data donc tout dépend de ta machine. BIG DATA = BIG CONFIGURATION

Discussions similaires

  1. Participez à l’enquête 2015 menée par CXP et BARC sur le big data
    Par actusas dans le forum Forum général SAS
    Réponses: 0
    Dernier message: 19/01/2015, 09h41
  2. Réponses: 3
    Dernier message: 27/05/2009, 08h59

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo