La start-up chinoise Moonshot AI lance Kimi K2.6, un modèle open source surpassant Claude et GPT-5.4, doté d'une exécution à long terme, d'essaims d'agents et de capacités de codage IA de bout en bout

Moonshot AI a lancé son dernier modèle phare, Kimi K2.6, introduisant des fonctionnalités de codage avancées, une exécution à long terme et un système collaboratif d'essaims d'agents. Cette version apporte des gains significatifs dans les tâches de codage qui requièrent de la persistance et de la généralisation, avec des performances fiables sur Rust, Go et Python, ainsi que pour des tâches allant du front-end au DevOps et à l'optimisation des performances. S'appuyant sur ces compétences en codage, Kimi K2.6 peut convertir de simples instructions génératives textuelles en interfaces front-end complètes, générant des mises en page au design soigné, des éléments interactifs et des animations riches telles que des effets déclenchés par le défilement.

Moonshot AI est une entreprise spécialisée dans l'intelligence artificielle (IA) basée à Pékin, en Chine. Elle a été qualifiée par les investisseurs de l'une des entreprises « AI Tiger » de Chine, en raison de son orientation vers le développement de grands modèles de langage. Kimi est un chatbot d'intelligence artificielle (IA) et une série de grands modèles de langage développés par la société chinoise Moonshot AI. Sa première version, sortie en 2023, était connue pour prendre en charge jusqu'à 128 000 tokens de contexte. Kimi K2, un modèle à poids ouvert sorti en juillet 2025, a affiché de solides performances lors des tests de référence en codage.

Récemment, Moonshot AI a lancé son dernier modèle phare, Kimi K2.6, introduisant des fonctionnalités de codage avancées, une exécution à long terme et un système collaboratif d'essaims d'agents. Cette version apporte des gains significatifs dans les tâches de codage qui requièrent de la persistance et de la généralisation, avec des performances fiables sur Rust, Go et Python, ainsi que pour des tâches allant du front-end au DevOps et à l'optimisation des performances. Dans sa suite de tests interne Kimi Code Bench, Kimi K2.6 affiche des améliorations notables par rapport à son prédécesseur, Kimi K2.5.

S'appuyant sur ces compétences en codage, Kimi K2.6 peut convertir de simples instructions génératives textuelles en interfaces front-end complètes, générant des mises en page au design soigné, des éléments interactifs et des animations riches telles que des effets déclenchés par le défilement. Le modèle maîtrise également les outils de génération d'images et de vidéos, permettant la création de ressources visuelles cohérentes et de sections « hero » raffinées. De plus, Kimi K2.6 s'étend à des workflows full-stack simples, automatisant les processus courants, de l'authentification et l'interaction utilisateur aux opérations de base de données légères telles que la gestion de session et la journalisation des transactions.


La mise à niveau Agent Swarm apporte un bond en avant qualitatif, coordonnant de manière autonome plusieurs agents spécialisés pour des tâches telles que la recherche, l'analyse de documents, la recherche approfondie et la génération parallèle de contenu multiformat. Ce système de composition peut produire des documents, des sites web, des diapositives et des feuilles de calcul en une seule exécution. Ces technologies alimentent des agents autonomes fonctionnant 24 h/24 et 7 j/7, tels qu’OpenClaw et Hermes, avec des améliorations continues en matière de fiabilité, d’interprétation des API et de sécurité à long terme. Kimi K2.6 est désormais disponible via Kimi.com, l’application Kimi, l’API et Kimi Code.

En mars dernier, Cursor a présenté son nouvel agent de codage Composer 2, décrit comme très performant et compétitif. La société a mis en avant ses capacités avancées pour les tâches de programmation, sans indiquer clairement qu’il reposait sur une base externe. Aucune mention n'était faite d'un quelconque modèle tiers dans l'annonce officielle. À la suite d'investigations menées par des utilisateurs, Cursor a reconnu que son modèle avait été construit à partir de Kimi K2.5 de Moonshot AI. Cette dépendance n’avait pas été explicitement mentionnée lors du lancement, ce qui a suscité des interrogations sur la transparence de la communication.

Voici la présentation de Kimi K2.6 :

Kimi K2.6 : faire progresser le codage open source

Nous mettons en open source notre dernier modèle, Kimi K2.6, qui intègre des capacités de pointe en matière de codage, d'exécution à long terme et de gestion d'essaims d'agents. Kimi K2.6 est désormais disponible via Kimi.com, l'application Kimi, l'API et Kimi Code.

Nom : 1.jpg
Affichages : 37849
Taille : 70,7 Ko

Codage à long terme ​

Kimi K2.6 affiche de nettes améliorations dans les tâches de codage à long terme, avec une généralisation fiable à travers les langages de programmation (par exemple, Rust, Go et Python) et les tâches (par exemple, front-end, devops et optimisation des performances). Sur Kimi Code Bench, notre benchmark interne de codage couvrant diverses tâches complexes de bout en bout, Kimi K2.6 démontre des améliorations significatives par rapport à Kimi K2.5.

Nom : 2.jpg
Affichages : 8149
Taille : 15,6 Ko

Kimi K2.6 fait preuve d’une grande capacité de codage à long terme dans des tâches d’ingénierie complexes :

Kimi K2.6 a réussi à télécharger et à déployer le modèle Qwen3.5-0.8B localement sur un Mac. En implémentant et en optimisant l’inférence du modèle dans Zig — un langage de programmation très spécialisé —, il a démontré une généralisation hors distribution exceptionnelle. Avec plus de 4 000 appels d'outils, plus de 12 heures d'exécution continue et 14 itérations, Kimi K2.6 a considérablement amélioré le débit, passant d'environ 15 à environ 193 tokens/seconde, pour finalement atteindre des vitesses environ 20 % plus rapides que LM Studio.

Nom : 3.jpg
Affichages : 8181
Taille : 47,7 Ko

Kimi K2.6 a entièrement remanié de manière autonome exchange-core, un moteur de mise en correspondance financière open source vieux de 8 ans. Au cours d'une exécution de 13 heures, le modèle a itéré à travers 12 stratégies d'optimisation, lançant plus de 1 000 appels d'outils pour modifier avec précision plus de 4 000 lignes de code. Agissant en tant qu'architecte de systèmes expert, Kimi K2.6 a analysé les graphiques de consommation CPU et d'allocation pour identifier les goulots d'étranglement cachés et a audacieusement reconfiguré la topologie des threads du cœur (de 4ME+2RE à 2ME+1RE). Bien que le moteur fonctionnait déjà près de ses limites de performance, Kimi K2.6 a permis d'obtenir un bond de 185 % du débit moyen (passant de 0,43 à 1,24 MT/s) et un gain de 133 % du débit de performance (passant de 1,23 à 2,86 MT/s).

Nom : 4.jpg
Affichages : 7013
Taille : 51,6 Ko

Lors des tests bêta, K2.6 affiche de bonnes performances sur des tâches de codage à long terme dans le cadre d'évaluations en entreprise.

Conception axée sur le codage

Grâce à ses solides capacités de codage, Kimi K2.6 peut transformer de simples invites en interfaces front-end complètes, en générant des mises en page structurées avec des choix de conception réfléchis, tels que des sections « hero » esthétiques, ainsi que des éléments interactifs et des animations riches, y compris des effets déclenchés par le défilement. Grâce à sa grande maîtrise des outils de génération d'images et de vidéos, Kimi K2.6 prend en charge la création de ressources visuellement cohérentes et contribue à des sections « hero » de meilleure qualité et plus percutantes.

De plus, Kimi K2.6 va au-delà du développement front-end statique pour s'étendre à des workflows full-stack simples, couvrant l'authentification, l'interaction utilisateur et les opérations sur les bases de données pour des cas d'utilisation légers tels que la journalisation des transactions ou la gestion des sessions.

Nous avons mis en place un banc d'essai interne Kimi Design Bench, organisé en quatre catégories : tâches de saisie visuelle, construction de pages d'accueil, développement d'applications full-stack et programmation créative générale. Par rapport à Google AI Studio, Kimi K2.6 affiche des résultats prometteurs et obtient de bonnes performances dans toutes ces catégories.

Nom : 5.jpg
Affichages : 7021
Taille : 23,6 Ko

Essaims d'agents, version améliorée ​

Une évolutivité horizontale, pas seulement verticale. Un essaim d'agents décompose dynamiquement les tâches en sous-tâches hétérogènes exécutées simultanément par des agents spécialisés dans un domaine spécifique et créés automatiquement.

S'appuyant sur la version préliminaire de recherche K2.5 Agent Swarm, Kimi K2.6 Agent Swarm marque un bond en avant qualitatif dans l'expérience des essaims d'agents. Il coordonne de manière transparente des agents hétérogènes afin de combiner des compétences complémentaires : une recherche étendue associée à une recherche approfondie, une analyse de documents à grande échelle fusionnée avec la rédaction de textes longs, et la génération de contenu multiformat exécutée en parallèle. Cette intelligence compositionnelle permet à l'essaim de fournir des résultats de bout en bout — couvrant des documents, des sites web, des diapositives et des feuilles de calcul — au cours d'une seule exécution autonome.

L'architecture s'étend horizontalement jusqu'à 300 sous-agents exécutant simultanément 4 000 étapes coordonnées, ce qui représente une expansion considérable par rapport aux 100 sous-agents et 1 500 étapes de la version K2.5. Cette parallélisation massive réduit fondamentalement la latence de bout en bout tout en améliorant considérablement la qualité des résultats et en repoussant les limites opérationnelles des essaims d'agents.

Elle permet également de transformer n'importe quel fichier de haute qualité, tel que des PDF, des feuilles de calcul, des diapositives et des documents Word, en compétences. Kimi K2.6 capture et conserve l'ADN structurel et stylistique des documents, vous permettant de reproduire la même qualité et le même format dans vos tâches futures.

Agents proactifs ​

K2.6 affiche de solides performances dans les agents autonomes et proactifs tels qu'OpenClaw et Hermes, qui fonctionnent sur plusieurs applications avec une exécution continue, 24 heures sur 24 et 7 jours sur 7.

Contrairement aux simples interactions par chat, ces workflows exigent que l'IA gère de manière proactive les plannings, exécute du code et orchestre des opérations multiplateformes en tant qu'agent d'arrière-plan persistant.

Notre équipe d'infrastructure RL a utilisé un agent basé sur K2.6 qui a fonctionné de manière autonome pendant 5 jours, gérant la surveillance, la réponse aux incidents et les opérations système, démontrant ainsi un contexte persistant, une gestion multithread des tâches et une exécution en cycle complet, de l'alerte à la résolution.

Kimi K2.6 apporte des améliorations mesurables en termes de fiabilité en conditions réelles : une interprétation plus précise des API, des performances à long terme plus stables et une meilleure prise en compte de la sécurité lors de tâches de recherche prolongées.

Les gains de performance sont quantifiés par notre Claw Bench interne, la suite d'évaluation couvrant cinq domaines : tâches de codage, intégration de l'écosystème de messagerie instantanée, recherche et analyse d'informations, gestion des tâches planifiées et utilisation de la mémoire. Sur l'ensemble des indicateurs, Kimi K2.6 surpasse largement Kimi K2.5 en termes de taux d'achèvement des tâches et de précision d'invocation des outils, en particulier dans les flux de travail nécessitant un fonctionnement autonome soutenu sans supervision humaine.

Nom : 6.jpg
Affichages : 6968
Taille : 14,5 Ko

Apportez vos propres agents ​

S'appuyant sur les solides capacités d'orchestration de Kimi K2.6, Kimi K2.6 étend vos agents proactifs aux Claw Groups en tant qu'aperçu de recherche — une nouvelle incarnation de l'architecture Agent Swarm.

Les Claw Groups s'inscrivent dans un écosystème ouvert et hétérogène : plusieurs agents et humains opèrent en véritables collaborateurs. Les utilisateurs peuvent intégrer des agents depuis n'importe quel appareil, exécutant n'importe quel modèle, chacun disposant de ses propres boîtes à outils spécialisées, compétences et contextes de mémoire persistante. Qu'ils soient déployés sur des ordinateurs portables locaux, des appareils mobiles ou des instances cloud, ces agents diversifiés s'intègrent de manière transparente dans un espace opérationnel partagé.

Au centre de cet essaim, Kimi K2.6 fait office de coordinateur adaptatif. Il associe dynamiquement les tâches aux agents en fonction de leurs profils de compétences spécifiques et des outils disponibles, en optimisant l'adéquation des capacités. Lorsqu'un agent rencontre un échec ou se bloque, le coordinateur détecte l'interruption, réattribue automatiquement la tâche ou régénère des sous-tâches, et gère activement le cycle de vie complet des livrables — de l'initiation à la validation, jusqu'à l'achèvement.

Nous tenons également à remercier les agents alimentés par K2.6 au sein de Claw Groups — nous avons testé notre propre équipe marketing d'agents en affinant les workflows homme-agent dans la pratique. Grâce à Claw Groups, nous menons de bout en bout des campagnes de production et de lancement de contenu, avec la collaboration d’agents spécialisés tels que les créateurs de démos, les créateurs de benchmarks, les agents des réseaux sociaux et les créateurs de vidéos. K2.6 coordonne le processus, permettant aux agents de partager des résultats intermédiaires et de transformer des idées en livrables cohérents et complets.

Nous dépassons le stade où l'on se contente de poser une question à l'IA ou de lui confier une tâche, pour entrer dans une phase où l'humain et l'IA collaborent en véritables partenaires, unissant leurs forces pour résoudre des problèmes ensemble. Claw Groups incarne nos derniers efforts en vue d'un avenir où les frontières entre « mon agent », « ton agent » et « notre équipe » s'estompent naturellement pour former un système collaboratif.

Source : Annonce de Kimi K2.6

Et vous ?

Pensez-vous que cette annonce est crédible ou pertinente ?
Quel est votre avis sur le sujet ?

Voir aussi :

Plus fort que ChatGPT-5 d'OpenAI et Claude 4.5 d'Anthropic ? La Chine lance Kimi K2.5 et Kimi Code en open source et mise sur « Parallel Agent Swarm » pour orchestrer un essaim de 100 IA spécialisées

Anthropic accuse DeepSeek et d'autres laboratoires chinois d'IA d'utiliser Claude pour extraire illicitement les capacités de Claude afin d'améliorer leurs propres modèles à l'aide de 24 000 comptes frauduleux

Les autorités chinoises ont pris des mesures pour empêcher les entreprises publiques et les agences gouvernementales d'utiliser les applications d'IA agentique OpenClaw pour des raisons de sécurité