Big Data & Streaming
Le Traitement Streaming et temps réel des données en Big Data



Le Big Data est désormais bien établi ! Il a atteint son paroxysme ces dernières années avec les objets connectés, l'intégration des capteurs dans les objet de la vie courante (voiture, réfrigérateur, télévision, etc.). Ces objets produisent des données en streaming. Beaucoup de cas d'usage et de modèles économiques s'appuient aujourd'hui sur des données générées en streaming. Cet ouvrage est un manuel didactique qui a pour but de vous aider à développer les compétences de base nécessaires pour valoriser les données produites en streaming.

Il vous aidera à atteindre trois objectifs majeurs :

comprendre les concepts et notions indispensables pour aborder avec aisance la gestion des données streaming, notamment la sémantique de livraison des messages (Exactement-Une Fois, Au-Moins-Une-Fois, Au-PlusUne-Fois), la sémantique de traitement, le domaine temporel, l’idempotence, le persistance anticipée de messages (Write Ahead Logging), la sémantique de résultat, les bus d’événements, les systèmes de messageries Publish/Subscribe, le fenêtrage, le micro-batch, les états, les modèles de collecte de données streaming, la cohérence streaming, la diffusion atomique, etc.
appréhender et mettre en œuvre les architectures nécessaires pour ingérer efficacement les données générées en streaming, notamment le Data Lake, les bus d'événements, les architectures Lambda, les architectures kappa, et les architectures hybrides ;
apprendre les technologies de l'écosystème Hadoop dédiées à l’ingestion et au traitement des données produites en streaming, notamment Apache Kafka, Spark Streaming, Flume, Apache Samza, Apache Storm et S4.

L'ouvrage est un kit d’apprentissage technique. Il a été rédigé uniquement à l’endroit de cinq types de profls :

Le consultant ou freelance, qui veut aiguiser ses compétences BI/Big Data, en y rajoutant l’aspect streaming ;
Le Data Scientist, qui veut développer des modèles de "Machine Learning streaming" ;
L’architecte, qui veut comprendre les architectures des systèmes streaming et comment celles-ci s’intègrent dans le SI global d’une entreprise ;
Le développeur, qui souhaite développer des applications streaming à large échelle ;
et le Manager, qui veut développer une vision holistique sur la façon de capitaliser les données des projets streaming ;

Pour faciliter la compréhension de l ouvrage, chaque chapitre s achève par un rappel des points clés et un guide d étude qui permettent au lecteur de consolider ses acquis. En bonus pour vous, l'ouvrage est offert avec une mini-formation gratuite composée de 3 sessions de cours -vidéo sur le streaming librement téléchargeable sur le site web suivant : https://www.data-transitionnumerique...tion_streaming

[Lire la suite]