Big Data : Google lance Cloud Dataproc en version bêta
Un nouveau service pour exécuter des clusters Spark et Hadoop en 90 secondes

Nom : kcinha1_pksnfisuvnhhvwmcpgilfaofghpfbat0i7eyklji3f1sqcyhryzs1b5loue1yas2048.jpg
Affichages : 3790
Taille : 288,4 Ko

Google vient d'annoncer l’ajout d’un nouveau service Cloud dédié au Big Data et baptisé Cloud Dataproc. Ce dernier, actuellement en version bêta, devrait favoriser une meilleure gestion des clusters Spark et Hadoop à partir ​​de machines virtuelles. C’est un service similaire à Cloud Dataflow, car permettant aux utilisateurs d'orchestrer leurs pipelines de données sur la plateforme de Google.

Greg DeMichillie, responsable de la gestion des produits sur la plateforme Cloud de Google, affirme qu'avec ce nouveau service les utilisateurs seront en mesure d'exécuter des clusters Hadoop en moins de 90 secondes (démarrage, arrêt et redimensionnement), soit nettement plus rapide que les autres services. Cela dit, les utilisateurs pourront ainsi configurer des clusters ad-hoc en cas de besoin ; Google se chargera de l'administration de ces derniers.

Le nouveau service Cloud Dataproc serait pratiquement compatible avec tous les produits virtuels existants et basés sur Hadoop, cela parce qu'il utilise le cluster standard Spark et la distribution Hadoop.

La firme de Mountain view soutient aussi que Cloud Dataproc est intégré au reste de ses services Cloud notamment BigQuery, Cloud Storage , Cloud Bigtable, Cloud Logging ou Cloud Monitoring.

Greg DeMichillie reconnaît que certaines personnes veulent avoir un contrôle total sur leur pipeline de données et l'architecture de traitement ; ces derniers sont ainsi plus animés par le désir de vouloir exécuter et gérer leurs propres machines virtuelles. Selon lui, les utilisateurs du nouveau service Cloud Dataproc n'auront pas de difficultés à mettre en place leurs propres infrastructures.

Google précise que sa nouvel offre Cloud Dataproc est proposée à un prix très accessible, soit 1 cent par CPU virtuelle ; incluant les frais relatifs à l'utilisations des ressources de sa plateforme Cloud. La facturation est également effectuée par minute avec une durée minimale de 10 minutes.

Source : Google Cloud

Et vous ?

Que pensez-vous de ce nouveau service ?
Allez-vous l'essayer ?