Azure Data Lake Analytics sera bientôt disponible en préversion
avec le nouveau langage de requête U-SQL

Microsoft a annoncé l’imminence du lancement d’Azure Data Lake Analytics, un nouveau service Cloud pour exécuter des requêtes afin d’analyser les données sur les serveurs SQL dans Azure, Azure SQL Database et Azure SQL Data Warehouse. Ce service, dont la préversion sera disponible un peu plus tard dans l’année, fait appel au langage de requête U-SQL, un langage qui « unifie les avantages de SQL à la puissance expressive du code utilisateur ».

Pourquoi ce nouveau langage ? « Nous savons que beaucoup de développeurs et de data scientistes ont de la peine à profiter du big data en se servant des technologies et des outils existants. Des solutions orientées code offrent une grande puissance mais exigent des investissements importants pour pouvoir les maîtriser, tandis que les outils basés sur SQL rendent les débuts plus faciles mais les extensions sont difficiles. Nous avons fait face aux mêmes problèmes chez Microsoft, c’est la raison pour laquelle nous avons introduit, U-SQL, un nouveau langage de requête qui unifie la facilité d'utilisation de SQL avec la puissance expressive de C# » explique T.K. Ranga Rengarajan, Corporate Vice President. Data Platform, Cloud & Enterprise.

Azure Data Lake Store, qui sera également disponible en préversion au courant de cette année, est un système de stockage qui est compatible avec les applications et outils HDFS. « Le Data Lake Store fournit un référentiel unique où vous pourrez facilement capturer vos données indépendamment de leur taille, type ou vitesse sans avoir à forcer des changements dans votre application pendant le processus. Dans le store, les données peuvent être partagées en toute sécurité pour collaboration et sont accessibles pour traitement et analyse par des outils et applications HDFS » avance Rengarajan.

Microsoft propose également aux développeurs Azure Data Lake Tool pour Visual Studio, qui fournit un environnement de développement intégré pour pouvoir simplifier considérablement la création, le débogage et l’optimisation du traitement et de l’analyse indépendamment de l’échelle.

Microsoft a également annoncé la disponibilité générale de la gestion des clusters sur Linux depuis Azure HDInsight, une distribution Hadoop proposée sur le cloud dont l’architecture a été pensée de manière à gérer un volume quelconque de données pouvant passer à la demande de quelques téraoctets à plusieurs pétaoctets.

« Les clusters HDInsight utilisant Linux peuvent désormais être plus facilement créés depuis le portail Azure Management sous la section Data + Analytics. Il suffit de sélectionner Ubuntu depuis le menu déroulant affichant les systèmes d’exploitation et également choisir le type de cluster que vous voulez créer », a expliqué Scott Guthrie, vice-président exécutif Cloud and Enterprise chez Microsoft.


« Les clusters HDInsight Linux peuvent être gérés par Apache Ambari. Ambari offre la possibilité de personnaliser les paramètres de configuration de votre cluster Hadoop tout en vous donnant une vue unifiée de la performance et de l’état de votre cluster, et en proposant des services de surveillance et d’alerte au sein du cluster HDInsight » poursuit Guthrie.

Source : blog Technet, blog Scott Guthrie

Voir Aussi

le Forum Windows Azure

la Rubrique Windows Azure (Cours, Tutoriels, FAQ, etc.)