Souvent qualifiée de
Big Data, l'explosion des données qui a accompagné la révolution d'Internet ces dernières années a provoqué un changement profond dans la société, marquant l'entrée dans un nouveau monde «
Numérique » dont l'un des piliers technologiques est
Hadoop.
Ce livre a pour objectif d'aider le lecteur à saisir les principes qui sont à la base d'Hadoop et de ses composants, de l'aider à monter en compétences sur Hadoop et également d'attirer son attention sur toutes les opportunités offertes par le
Numérique. Il s'adresse à toute personne (consultants, data scientists, chargés d'études, étudiants, responsables techniques…) impliquée dans l'utilisation des données. Des compétences de base dans le domaine des
bases de données, de la
programmation et du
SQL sont un prérequis nécessaire pour la bonne lecture du livre.
Les premiers chapitres présentent l'
architecture de l'infrastructure d'Hadoop, son fonctionnement et le
MapReduce. Ensuite, l'auteur présente les principes du
stockage des données et montre la relation entre ces principes, le
HDFS et
Hadoop. Les chapitres qui suivent traitent des évolutions d'Hadoop avec un accent particulier sur le
YARN. Dans un chapitre dédié, l'auteur traite également l'
intégration du SQL dans Hadoop. Par la suite, il expose les problématiques du
streaming, présente les principes du
traitement en streaming et en
temps réel, et montre comment
Storm implémente ces principes. Enfin, le livre se termine par un chapitre sur les différentes
distributions Hadoop et un chapitre sur la
transition Numérique.
Pour faciliter la compréhension des principes exposés, chaque chapitre s'achève par un rappel des points clés. Un questionnaire permet également au lecteur de vérifier et consolider ses acquis.
Partager