Alibaba dévoile Qwen3.7-Max, son dernier modèle d'IA destiné à la génération de code, à l'automatisation des flux de travail et à l'exécution autonome, qui surpasserait déjà GPT-5.2 et Grok-4.20
Alibaba a lancé Qwen3.7-Max, son tout dernier modèle de base propriétaire destiné aux applications avancées pilotées par des agents. Ce modèle est conçu pour un déploiement flexible dans la génération de code, l’automatisation des flux de travail bureautiques et le raisonnement continu sur des centaines, voire des milliers d’étapes séquentielles. Le modèle est capable de gérer des tâches allant de simples prototypes front-end à des projets d’ingénierie complexes impliquant de multiples fichiers. Au-delà du développement logiciel, Qwen3.7-Max s’intègre à des plateformes d’orchestration multi-agents et de contrôle géré, ce qui lui permet d’automatiser la rédaction de rapports, de mener des analyses de données approfondies et de créer des visualisations prêtes à être publiées.
Alibaba Cloud est une entreprise spécialisée dans le cloud computing, filiale du groupe Alibaba. Alibaba Cloud fournit des services de cloud computing aux entreprises en ligne ainsi qu'à l'écosystème de commerce électronique d'Alibaba. Qwen est une famille de grands modèles de langage développés par Alibaba Cloud. De nombreux modèles Qwen sont distribués sous la licence libre et open source Apache 2.0, la licence Qwen à code source disponible ou la licence de recherche Qwen à usage non commercial ; d'autres modèles Qwen propriétaires sont fournis par Alibaba Cloud.
Récemment, Alibaba a lancé Qwen3.7-Max, son tout dernier modèle de base propriétaire destiné aux applications avancées pilotées par des agents. Ce modèle est conçu pour un déploiement flexible dans la génération de code, l’automatisation des flux de travail bureautiques et le raisonnement continu sur des centaines, voire des milliers d’étapes séquentielles. À la suite de l’annonce de ce modèle, Alibaba a mis en avant les atouts de Qwen3.7-Max en tant qu’agent de codage.
Le modèle est capable de gérer des tâches allant de simples prototypes front-end à des projets d’ingénierie complexes impliquant de multiples fichiers. Il fonctionne de manière cohérente sur les frameworks de déploiement d’agents les plus courants, notamment Claude Code, OpenClaw et Qwen Code. Cela en fait un outil viable pour les développeurs à la recherche d’une large compatibilité et de performances stables.
Au-delà du développement logiciel, Qwen3.7-Max s’intègre à des plateformes d’orchestration multi-agents et de contrôle géré, ce qui lui permet d’automatiser la rédaction de rapports, de mener des analyses de données approfondies et de créer des visualisations prêtes à être publiées. Sa compatibilité native avec les harnais d'agents courants lui permet de planifier et d'exécuter de manière autonome des projets de grande envergure. Grâce à des sessions soutenues de plusieurs heures et à des milliers d'appels d'outils itératifs, le modèle peut fournir en quelques heures des résultats qui nécessitaient auparavant des semaines de travail d'une équipe spécialisée.
Qwen3.7-Max sera accessible via Alibaba Cloud Model Studio. Les utilisateurs peuvent intégrer le modèle aux frameworks d'agents et d'assistants de codage existants pour une application immédiate dans les environnements d'entreprise et de développement.
Voici l'annonce d'Alibaba :
Alibaba annonce une mise à niveau complète de son infrastructure d'IA pour l'ère des agents
Alibaba a annoncé aujourd’hui une mise à niveau complète de sa pile IA — couvrant l’infrastructure cloud, les services de modèles, les puces IA et les modèles de base — afin de permettre à ses clients de créer, déployer et faire évoluer des agents IA avec plus d’efficacité, de fiabilité et de performances.
Dévoilé lors de l’Alibaba Cloud Summit, Qwen3.7-Max est le tout dernier grand modèle linguistique d’Alibaba, conçu pour le codage agentique avancé, le raisonnement complexe et l’exécution de tâches à long terme. Qwen3.7-Max sera bientôt disponible pour les développeurs et les entreprises du monde entier.
Pour répondre à la demande croissante en matière de calcul et de charge de travail IA à l'ère des agents, Alibaba Cloud a également mis à niveau son infrastructure et ses services de modèles. Parmi les lancements clés, citons le serveur Panjiu AL128 Supernode, conçu pour permettre une inférence d'agents évolutive et un entraînement de modèles à grande échelle, ainsi qu'une mise à jour d'optimisation au sein de la plateforme de services de modèles d'Alibaba qui affine en permanence les performances des modèles.
De plus, T-Head, la filiale d'Alibaba spécialisée dans la conception de semi-conducteurs, a présenté le Zhenwu M890, son tout dernier processeur d'entraînement et d'inférence IA, doté d'une mémoire haute capacité, d'une bande passante inter-puces robuste et d'une prise en charge native de la précision FP4.
Qwen 3.7-Max : un modèle de base polyvalent pour l'ère des agents
Conçu comme une base robuste pour les agents IA, Qwen 3.7-Max gère de manière transparente la génération et le débogage de code, l'automatisation des flux de travail bureautiques et les tâches complexes en plusieurs étapes nécessitant des centaines ou des milliers d'actions.
Le modèle offre des capacités d'agent exceptionnelles dans divers domaines. En tant qu'assistant de codage de pointe, il prend en charge des tâches de codage allant du prototypage rapide de front-end à l'ingénierie logicielle complexe impliquant plusieurs fichiers. Pour améliorer la productivité au bureau, il orchestre de manière fiable des flux de travail multi-agents afin de mener à bien des opérations sophistiquées. Notamment, Qwen 3.7-Max peut exécuter de manière autonome des tâches d'agent à long terme, en maintenant un fonctionnement continu pendant jusqu'à 35 heures et en gérant plus de 1 000 appels d'outils sans dégradation des performances.
Profondément optimisé pour les principaux frameworks d’agents, notamment OpenClaw, Hermes Agent, Claude Code, Qwen Paw et Qoder, il sert de base fiable pour différents systèmes d’agents. Le modèle obtient des résultats de premier plan dans les principaux benchmarks en matière de codage, d’agents polyvalents, de capacités générales et de multilinguisme, ce qui le rend compétitif face aux modèles de pointe. Il sera bientôt accessible aux développeurs du monde entier via la plateforme de services de modèles d’Alibaba, Model Studio.
Informatique intelligente de nouvelle génération et services de modèles améliorés
Afin de permettre une inférence d'agents IA évolutive et un entraînement de modèles à grande échelle, Alibaba Cloud a lancé le serveur Panjiu AL128 Supernode, équipé du processeur IA Zhenwu M890 et de la puce réseau ICN Switch 1.0. En intégrant étroitement 128 accélérateurs IA au sein d’un seul rack, le système offre une bande passante par rack de l’ordre du pétaoctet par seconde (PB/s), améliorant considérablement le traitement des requêtes simultanées à grande échelle provenant des agents.
Le Panjiu AL128 est désormais disponible sur Model Studio pour le marché chinois (ou « Bailian »), permettant aux entreprises chinoises de répondre efficacement aux demandes de formation et d’inférence dans tous les secteurs.
Pour optimiser les performances, Bailian a introduit Agentic RL, un mécanisme d’apprentissage par renforcement alimenté par le retour d’expérience de l’exécution des agents, afin de favoriser l’itération continue des modèles. Bailian intègre également des capacités de gouvernance de sécurité, garantissant que les agents fonctionnant de manière autonome restent toujours dans les limites définies.
Dernières puces et pile logicielle de T-Head pour l'entraînement et l'inférence IA
Le dernier accélérateur IA de T-Head, le Zhenwu M890, offre des performances trois fois supérieures à celles de son prédécesseur, le Zhenwu 810E. Le Zhenwu M890 dispose de 144 gigaoctets (Go) de mémoire GPU et d'une bande passante inter-puces de 800 Go par seconde. La puce prend en charge nativement plusieurs formats de précision des données, allant du FP32 (virgule flottante 32 bits) au FP4 (virgule flottante 4 bits), permettant ainsi à la fois l'entraînement de modèles à haute précision et l'inférence de modèles à très faible précision. Ces capacités le rendent particulièrement bien adapté aux charges de travail complexes de l'IA agentique, qui exigent une mémoire de travail étendue pour la conservation du contexte, une communication à haut débit pour la coordination multi-agents et un calcul à faible précision pour maintenir une exécution rapide tout en réduisant les coûts. La puce repose sur l'architecture de calcul parallèle propriétaire de T-Head et utilise son protocole d'interconnexion ICN (Inter-Chip Network) personnalisé.
Parallèlement à cet accélérateur, T-Head a dévoilé l'ICN Switch 1.0, une puce de commutation dédiée conçue pour créer des réseaux évolutifs à large bande passante et à faible latence destinés aux clusters de calcul. Elle offre une bande passante agrégée pouvant atteindre 25,6 Tbps et permet une communication à latence extrêmement faible et sans congestion. En associant le Zhenwu M890 à la puce ICN Switch 1.0, il permet une interconnexion à pleine bande passante entre 64 accélérateurs, ce qui améliore considérablement l'efficacité et la stabilité de calcul de l'informatique intelligente à grande échelle. T-Head a également dévoilé sa pile logicielle propriétaire, T-Head SAIL™, afin de libérer tout le potentiel de calcul de ses puces.
T-Head a réussi à imposer ses puces IA propriétaires à l'échelle industrielle, avec plus de 560 000 unités Zhenwu livrées à ce jour. Plus de 400 clients externes issus de 20 secteurs d'activité, dont des constructeurs automobiles de premier plan et des sociétés de services financiers, ont déployé ces puces pour optimiser leurs opérations intelligentes.
Source : Annonce d'Alibaba
Et vous ?
Pensez-vous que cette annonce est crédible ou pertinente ?
Quel est votre avis sur le sujet ?
Voir aussi :
Codage agentique, raisonnement préservé, un million de tokens : Qwen3.6-35B-A3B redessine le plafond de l'IA open source pour les devs, malgré plusieurs départs d'ingénieurs clés qui ont quitté le projet
Google lance Gemini 3.5 Flash, son modèle d'IA le plus performant pour la programmation, la création d'agents IA autonomes, la gestion de projets de recherche ou le développement de systèmes d'exploitation
Anthropic écrase GPT-5.4 avec le lancement de Claude Opus 4.7, un modèle d'IA moins risqué et moins puissant que Mythos, mais nettement plus efficace que la version 4.6







Pensez-vous que cette annonce est crédible ou pertinente ?
Répondre avec citation
Partager