Microsoft annonce la préversion publique de l'outil d'évaluation des agents Microsoft 365 Copilot, qui aide les développeurs à mesurer et à améliorer la qualité des agents créés avec Microsoft 365 Copilot
Microsoft a annoncé la préversion publique de l'outil d'évaluation des agnets de Microsoft 365 Copilot. L'outil CLI « Agent Evaluations » aide les développeurs à mesurer et à améliorer la qualité des agents qu'ils créent avec Microsoft 365 Copilot. Cette version constitue une étape vers l’intégration d’une évaluation rigoureuse et reproductible dans le processus de développement de Microsoft 365 Copilot, parallèlement aux travaux plus généraux menés sur l’ensemble de la plateforme, de Work IQ à la création d’agents avec le Microsoft 365 Agents Toolkit.
Début mai 2026, Microsoft a annoncé la préversion publique de l'outil d'évaluation des agnets de Microsoft 365 Copilot. L'outil CLI « Agent Evaluations » aide les développeurs à mesurer et à améliorer la qualité des agents qu'ils créent pour Microsoft 365 Copilot. Cet outil fournit une interface de ligne de commande qui envoie des invites à un agent déployé, capture les réponses et les note à l'aide des modèles LLM Azure OpenAI. Il génère des rapports structurés que les développeurs peuvent utiliser dans leur boucle de développement interne et dans leurs pipelines CI/CD.
Cette version constitue une étape vers l’intégration d’une évaluation rigoureuse et reproductible dans le processus de développement de Microsoft 365 Copilot, parallèlement aux travaux plus généraux menés sur l’ensemble de la plateforme, de Work IQ à la création d’agents avec le Microsoft 365 Agents Toolkit.
Pourquoi les évaluations sont-elles importantes aujourd’hui ?
Selon Microsoft, sa mission est de permettre aux partenaires, aux éditeurs de logiciels indépendants (ISV) et aux développeurs d'entreprise d'étendre Microsoft 365 Copilot avec des agents, des actions et des connaissances personnalisés, afin que Copilot puisse raisonner à partir de n'importe quelle donnée et agir sur n'importe quel système.
À mesure que les agents passent du stade de la démonstration à celui des workflows métier essentiels, les exigences en matière de livraison augmentent en conséquence. Les clients attendent des agents précis, fiables et cohérents face à l'ensemble des invites réelles qu'ils reçoivent. Pour répondre à ces attentes, les tests manuels ne suffisent pas. Il faut un cadre d’évaluation objectif, reproductible et intégré au flux de travail des développeurs. L’outil Agent Evaluations est conçu pour rendre cela possible.
Contenu de la préversion publique
La préversion publique intègre le cycle d’évaluation complet dans un flux de travail simple en ligne de commande. L’interface CLI est conçue pour s’intégrer naturellement à la manière dont les développeurs Microsoft 365 créent déjà des agents. Les développeurs peuvent invoquer l’interface CLI pour évaluer des agents déclaratifs directement dans le Microsoft 365 Agents Toolkit.
- L’outil prend en charge l’évaluation de conversations à un ou plusieurs tours afin de permettre de tester la manière dont un agent conserve le contexte, gère les relances et accomplit des tâches de bout en bout, à l’image de la façon dont les utilisateurs réels interagissent avec lui.
- L'outil offre une expérience simple pour sélectionner l'agent sur lequel effectuer une évaluation. Le sélecteur d'agent interactif garantit que les équipes de test, aux côtés des équipes de développement, peuvent évaluer les agents.
- Les réponses sont ensuite notées automatiquement par rapport à des évaluateurs tels que Coherence, Groundedness (basé sur un LLM) ou ExactMatch /PartialMatch (basé sur du code), et d'autres évaluateurs.
- Les résultats sont présentés dans un rapport sous forme de tableau de bord HTML. Les développeurs peuvent utiliser ce tableau de bord comme un artefact partageable qui capture des preuves objectives de la qualité des agents tout au long de leur boucle interne, de leurs revues de code et de leurs pipelines CI/CD.
Vous pouvez également accéder à la fonctionnalité d'évaluation où que vous codiez avec vos agents de codage.
L'outil en préversion est gratuit à installer pendant la préversion publique. Vous aurez besoin d'une licence Microsoft 365 Copilot, d'un agent déployé sur votre tenant, de Node.js 24.12.0 ou une version ultérieure, de l'autorisation de l'administrateur pour exécuter l'outil sur votre tenant, et d'un point de terminaison Azure OpenAI pour les évaluateurs LLM-judge. Demandez à votre administrateur d'activer l'outil pour votre tenant dès aujourd'hui.
Source : Annonce de Microsoft
Et vous ?
Pensez-vous que cette annonce est crédible ou pertinente ?
Quel est votre avis sur le sujet ?
Voir aussi :
Microsoft annonce la version 1.0 de Microsoft Agent Framework pour .NET et Python, offrant une orchestration multi-agents de niveau entreprise et la prise en charge de modèles d'IA multi-fournisseurs
Microsoft précise que l'IA Copilot est destinée uniquement à des fins de divertissement, que son utilisation se fait à vos propres risques et qu'il ne faut pas s'y fier pour prendre des décisions importantes
Mistral AI mise sur la « création d'IA sur mesure » et annonce Mistral Forge, une plateforme permettant aux entreprises de créer des modèles personnalisés entraînés à partir de leurs propres données










Pensez-vous que cette annonce est crédible ou pertinente ?
Répondre avec citation
Partager