Microsoft développe des outils basés sur Hadoop
Pour le traitement de gros volumes de données dans Windows Azure et Windows Server



Le support d’Hadoop, le framework java libre basé sur Map reduce, destiné aux applications distribuées et à la gestion intensive des données, permettant le traitement de données évolutif pour le stockage et le traitement par lots de très grandes quantités de données (Big Data) est de plus en plus présent dans les produits de Microsoft.

La firme avait déjà publié deux connecteurs pour lier Apache Hadoop à SQL Server Denali et SQL Server Parallel Data Warehouse, permettant ainsi de gérer des pétaoctets de données à travers de milliers de nœuds dans le SGBD.

L’éditeur vient d’annoncer lors de la conférence PASS Summit 2011 de Seattle, une collaboration avec HortonWorks, un cabinet de conseil sur Hadoop, faisant partie de la communauté chargée du développement de la plateforme, pour mettre sur pied des outils Apache Hadoop pour Windows Server et la plateforme Cloud Windows Azure.

Avec ces outils, Microsoft cherche à fournir à ses clients une autre option pour la manipulation des gros volumes de données et le stockage et l’accès à des données non structurées.

Microsoft espère livrer une première CTP (Community Technolgy Preview) du service basé sur Hadoop pour Windows Azure d’ici la fin de cette année, et pour Windows Server dans le courant de l’année 2012.

La version pour Windows Server pourra travailler avec les outils de Business Intelligence de Microsoft parmi lesquels PowerPivot, Excel et PowerView (nouvelle fonctionnalité d’analyse des données faisant partie de SQL Server Denali, connu sous le nom de code « Crescent »).

La société a par ailleurs déclaré qu’elle va travailler en étroite collaboration avec la communauté en charge du développement d’Hadoop et apporter ses contributions pour faire évoluer la plateforme.


Microsoft a également profité de cet événement pour présenter une nouvelle technologie baptisée « Data Explorer », pouvant se connecter au MarketPlace de Windows Azure pour permettre aux développeurs de créer des ensembles de données plus riches, qui peuvent être commercialisés ou publiés gratuitement. La première CTP de « Data Explorer » sera disponible via SQL Azure Labs avant la fin de cette année.


Source : Blog technet


Et vous ?

Qu'en pensez-vous ?