Build 2021 : Microsoft dévoile les améliorations apportées à Power BI et Cosmos DB,
Y compris respectivement des agrégations automatiques et une option "serverless"

Alors que Microsoft Build ce cette année n’apporte pas de nouvelles révolutionnaires en soi sur le front des données et de l'analytique, elle a une liste impressionnante d'annonces autour de nouvelles fonctionnalités et de nouveaux niveaux de service pour ses offres de BI et de bases de données dans le cloud. Microsoft a, entre autres, introduit la possibilité pour les flux de données de Power BI (la suite d’analyses et de rapports de données) de gérer les sources de données en continu, à commencer par Azure IoT Hub et Azure Event Hubs. En ce qui concerne, les bases de données, Microsoft a beaucoup de nouvelles autour de Cosmos DB, Redmond mettant son option "serverless" en disponibilité générale et lançant des émulateurs et des gratuités pour les développeurs.

Améliorations concernant Power BI : données en streaming et agrégations automatiques

Dans le cadre de la possibilité pour les flux de données de Power BI de gérer les sources de données en continu, l'équipe Microsoft promet qu'elle rendra les données en continu et les analyses en temps réel aussi accessibles que les données par lots et les analyses conventionnelles. Et ce, non seulement pour les spécialistes de la BI et les ingénieurs de données, mais aussi pour les utilisateurs professionnels. Et comme Event Hubs peut fonctionner dans un mode compatible avec Apache Kafka, on peut se demander si cette caractéristique fonctionnera avec cette plateforme open source de streaming d'événements.

La fonction des agrégations automatiques est une autre amélioration intéressante apportée à Power BI. Pour apprécier cette fonction, il faut connaître la fonction d'agrégation de base qui la sous-tend. La fonction de base vous permet de précalculer des agrégations sur vos mesures, ce qui permet d'obtenir des performances supérieures, notamment par rapport aux sources de données pour lesquelles Power BI est connecté via DirectQuery, qui récupère les données de la source de données back-end.

Avec les agrégations, Power BI peut éviter d'aller jusqu'au back-end pour des données communes résumées, et réserver cette approche à des ensembles relativement petits de données détaillées. Le problème avec les agrégations est qu'elles doivent être conçues lorsqu'un utilisateur modélise les données que Power BI va interroger. La bonne nouvelle est que la fonction d'agrégation automatique les construira automatiquement, sur la base des modèles de requête observés, avec un algorithme qui s'améliore au fur et à mesure qu'il recueille de telles observations.

Microsoft rend disponibles dès juillet prochain les versions previews des flux de données en streaming et des agrégations automatiques, et tous deux seront exclusifs à Power BI Premium. Étant donné que la version Premium est désormais disponible par utilisateur pour un supplément de 10 $ par mois par rapport à Power BI Pro, ces fonctionnalités seront accessibles à un plus grand nombre de clients.

Pendant ce temps, une autre fonctionnalité Premium, les pipelines de déploiement de Power BI, obtient des API d'automatisation orientées vers les développeurs qui permettent à des outils tels que Azure DevOps, GitHub et Azure Pipelines d'automatiser le déploiement de ressources Power BI. Les API d'automatisation sont disponibles dès maintenant, d’après Microsoft. Il s'agit d'un grand nombre de fonctionnalités réservées à la catégorie Premium.

Nom : c01.png
Affichages : 96316
Taille : 46,2 Ko

Entre-temps, Microsoft publie une nouvelle fonctionnalité très intéressante qui permet d'intégrer des rapports Power BI dans des carnets Jupyter, sous la forme d'un package Python open source. Et elle est compatible avec Power BI Pro, y compris la version disponible en essai gratuit.

Amélioration pour Cosmos DB : une option "serverless", plus de gratuité et un émulateur pour Linux

L’événement virtuel de Microsoft fait la promotion des nouveaux services de données Azure, notamment Azure Cosmos DB, ce que Microsoft appelle sa base de données "à l'échelle de la planète". Cosmos DB, qui est la base de données NoSQL gérée, à grande échelle et multimodèle de Microsoft, va encore plus loin dans sa démarche "cloud-native", en mettant son option "serverless" en disponibilité générale, pour toutes les nombreuses API de Cosmos.

Une version "serverless" de Cosmos DB permet aux clients de l'utiliser sans avoir à provisionner des clusters de taille explicite, ce qui en fait une solution idéale pour ce que Microsoft appelle les "modèles de trafic en pics". Même pour les clients qui sont à l'aise avec le dimensionnement des clusters, l'option sans serveur fournira essentiellement un dimensionnement automatique sans maintenance. Le credo du serverless, après tout, est de déléguer au service la responsabilité de distribuer les ressources dont vous avez besoin, quand vous en avez besoin.

L’équipe Microsoft apporte également à Cosmos DB un grand nombre de fonctionnalités que les professionnels des bases de données relationnelles de longue date pourront apprécier. Il s'agit notamment d'un cache intégré, de contrôles d'accès basés sur les rôles (RBAC) et de "Always Encrypted", une fonctionnalité empruntée à SQL Server et Azure SQL Database qui chiffre entièrement les données d'une application avant même qu'elles ne soient enregistrées dans la base de données.

Le service de cache intégré est particulièrement intéressant, car il ne se contente pas d'améliorer les performances, il permet également de réaliser des économies, en réduisant ostensiblement les lectures complètes de la base de données. Selon Microsoft, le cache permet de réduire les coûts et d'améliorer les performances pour les charges de travail à lecture intensive jusqu'à 96 % et 300 %, respectivement.

Cosmos DB étend également son volet gratuit. Cette nouvelle offre permet aux développeurs de bénéficier d'un débit provisionné de 1 000 RU/s (unités de requête par seconde) et de 25 Go de stockage gratuit par mois. En parlant de gratuité, Microsoft propose depuis quelque temps déjà un émulateur Cosmos DB, qui permet aux développeurs d'exécuter leur code sur une instance Cosmos DB fonctionnelle, sans avoir à payer un abonnement Azure. Le problème était que cet émulateur ne fonctionnait que sur les machines Windows, mais Microsoft annonce maintenant une version Linux de l'émulateur, qui fonctionne également sur Mac.

Nom : c02.png
Affichages : 3245
Taille : 73,4 Ko

L'émulateur a été une demande répétée de la communauté et permet aux développeurs de jouer avec la technologie. Pourquoi cette longue attente ? « La ligne de fond », a déclaré Raghu Ramakrishnan, directeur technologique d'Azure Data. « Nous avions tout simplement beaucoup de choses à faire ». Dans un choix entre cette solution et Synapse Link, c'est cette dernière qui l'a emporté.

Toujours dans le monde des bases de données relationnelles, une offre gratuite de 12 mois pour Azure Database for PostgreSQL et Azure Database for MySQL Flexible Server, disponible en juin, offrira jusqu'à 750 heures par mois gratuites pendant les 12 premiers mois avec un compte Azure gratuit. En outre, pour Azure Database for PostgreSQL – Hyperscale (Citus), un nouveau niveau de base, en version preview, offrira des capacités d'entrée de gamme, sur la base d'un déploiement à un seul nœud.

Bien que tout ce qui est appelé "hyperscale" et qui est basé sur un seul nœud semble pour le moins anormal, il est probablement préférable de penser à cela de la même manière qu'à l'émulateur de Cosmos DB – comme un point final de travail pour développer et tester le code. La différence est qu'il peut être mis en production sur place, puisque Microsoft offre la possibilité d'ajouter des nœuds de travail et de les faire évoluer par la suite.

Microsoft continue d'ajouter de nouvelles fonctionnalités à Cosmos DB, ce qui souligne son importance pour Azure. Le suivi des fonctionnalités de l'API MongoDB garantit que les applications peuvent passer facilement de l'environnement sur site à l'environnement cloud, en évoluant selon les besoins. La prise en charge des liens vers Azure Synapse fait tomber les barrières entre les données opérationnelles et analytiques, ce qui permet aux développeurs et aux scientifiques de Cosmos DB de tirer le meilleur parti de leurs données.

Sources : Microsoft Build 2021, Power BI, Cosmos DB

Et vous ?

Que pensez-vous des améliorations apportées à Power BI et Cosmos DB ?

Voir aussi :

Azure Open Source Week : découvrez les grands axes de collaboration et contributions de Microsoft au niveau mondial, du 7 au 11 juin prochain en ligne
Microsoft annonce la disponibilité de l'expérience .NET Hot Reload dans Visual Studio 2019 version 16.11 (Preview 1), et via les outils de ligne de commande dans .NET 6 (Preview 4)
La recherche simplifiée : intégration native d'Elastic Search avec le Cloud Microsoft Azure, en avant-première