La Superintelligence Lab de Meta dévoile son premier modèle d'IA public, Muse Spark, qui affiche d'excellents résultats aux tests de référence, mais présente des « lacunes » dans les systèmes agentiques

Meta a franchi une nouvelle étape dans sa stratégie en matière d’IA avec le lancement de Muse Spark, le premier modèle de la famille Muse développé par Meta Superintelligence Labs. Avec ce modèle, l’entreprise vise à jeter les bases de ce qu’elle décrit comme une « superintelligence personnelle ». En termes de performances, Meta affirme que Muse Spark est compétitif dans les domaines de l'analyse visuelle, du raisonnement et des applications de santé. Dans le même temps, des évaluations indépendantes montrent que le modèle n'est pas encore au sommet dans tous les domaines. Une nouvelle fonctionnalité importante est le mode « Contemplating », qui permet à plusieurs agents IA de travailler en parallèle sur un même problème.

Meta Superintelligence Labs (MSL) est une division américaine spécialisée dans l'intelligence artificielle (IA) de Meta Platforms, dont le siège se trouve à Menlo Park, en Californie. Cette division se consacre à la recherche et au développement dans le domaine de la superintelligence artificielle. La Superintelligence Lab résulte des efforts de Meta pour renforcer sa position dans le paysage de l'IA. En janvier 2025, Meta avait annoncé son intention d'investir davantage dans l'IA, sans se laisser décourager par les avancées de la startup chinoise DeepSeek. Le PDG Mark Zuckerberg a confirmé ces dépenses ambitieuses, soulignant que cet investissement est crucial pour la stratégie de croissance de Meta. Il a notamment décrit 2025 comme une "année décisive pour l'IA", soulignant l'engagement de l'entreprise à améliorer son infrastructure et ses capacités.

Cependant, ce n'est que récemment que Meta a franchi une nouvelle étape dans sa stratégie en matière d’IA avec le lancement de Muse Spark, le premier modèle de la famille Muse développé par Meta Superintelligence Labs. Avec ce modèle, l’entreprise vise à jeter les bases de ce qu’elle décrit comme une « superintelligence personnelle », une forme d’intelligence artificielle qui non seulement répond aux questions, mais réfléchit aussi activement aux côtés des utilisateurs, les comprend et les aide dans leur vie quotidienne. Muse Spark arrive à un moment crucial pour Meta. En effet, il s'agit du premier modèle d'IA dévoilé par l'entreprise depuis environ un an, après des attentes non satisfaites concernant les modèles Llama 4. À ce titre, ce lancement représente non seulement une avancée technologique, mais aussi un effort pour se reconnecter avec le peloton de tête du marché de l'IA.

Ce modèle se distingue par le fait qu’il a été conçu dès le départ comme un modèle de raisonnement multimodal. Muse Spark peut combiner du texte, des images et d’autres types de données, et prend également en charge l’utilisation d’outils externes ainsi que le déploiement simultané de plusieurs agents IA. Meta positionne ainsi ce système comme la prochaine étape vers une IA capable d’effectuer de manière autonome des tâches complexes et de mieux comprendre le contexte.

Le lancement de Muse Spark marque également une refonte plus large de l'approche de Meta en matière d'IA. Selon l'entreprise, des travaux ont été menés ces derniers mois sur une nouvelle pile technique conçue pour évoluer plus efficacement, allant de l'architecture et de l'entraînement des modèles à des infrastructures telles que le centre de données Hyperion. Meta affirme pouvoir atteindre des performances comparables avec une puissance de calcul nettement inférieure à celle des modèles précédents.


Meta investit massivement dans son équipe de superintelligence

Ce bond technologique implique des investissements substantiels. En 2025, Meta a constitué une nouvelle équipe dédiée à la superintelligence pour rattraper ses concurrents, notamment grâce à un investissement de plusieurs milliards de dollars dans Scale AI et à la nomination d'Alex Wang au poste de PDG. Selon différents rapports, certains ingénieurs ont été attirés par des rémunérations exceptionnellement élevées, ce qui souligne la priorité stratégique accordée par l'entreprise à l'IA.

Les fichiers de visa H-1B déposés par Meta auprès des autorités fédérales américaines viennent d'exposer, chiffres à l'appui, l'ampleur des rémunérations pratiquées par le géant de Menlo Park pour attirer et retenir les talents de l'IA. Des ingénieurs logiciels à six chiffres jusqu'aux chercheurs en superintelligence à neuf chiffres, la fourchette révèle une industrie dont les standards salariaux sont devenus sans précédent dans l'histoire du secteur technologique.

En termes de performances, Meta affirme que Muse Spark est compétitif dans les domaines de l'analyse visuelle, du raisonnement et des applications de santé. Dans le même temps, des évaluations indépendantes montrent que le modèle n'est pas encore au sommet dans tous les domaines. D'après des benchmarks externes, Muse Spark affiche de solides performances en compréhension linguistique et visuelle, mais reste à la traîne par rapport à ses concurrents en programmation et en raisonnement abstrait complexe. Dans un classement général établi par la plateforme d'évaluation Artificial Analysis, le modèle occupe la quatrième place ex æquo.

Une nouvelle fonctionnalité importante est le mode « Contemplating », qui permet à plusieurs agents IA de travailler en parallèle sur un même problème. Cette approche vise à permettre une analyse plus approfondie sans augmenter significativement le temps de réponse. Meta y voit un moyen de rivaliser avec les modes de raisonnement avancés d’autres systèmes d’IA de premier plan.

Meta se concentre sur les applications pratiques de l’IA

Les applications envisagées par Meta vont au-delà des interfaces de chat traditionnelles. Muse Spark peut analyser des images, reconnaître des objets et aider les utilisateurs dans des tâches pratiques. Le modèle joue également un rôle dans le domaine de la santé, par exemple en extrayant des informations nutritionnelles à partir d’images ou en expliquant des processus corporels. À cette fin, Meta a collaboré avec de nombreux médecins afin d’améliorer la qualité de ses réponses.

Parallèlement, ce lancement donne un aperçu plus précis de la manière dont Meta prévoit de monétiser l’IA. L’entreprise fait allusion à des intégrations e-commerce, permettant aux utilisateurs de consulter et d’acheter des produits directement dans le chatbot. De plus, Meta s’attache fortement à renforcer l’engagement au sein de son écosystème existant, qui compte désormais des milliards d’utilisateurs.

Le déploiement de Muse Spark se fait par étapes. Dans un premier temps, le modèle sera disponible via l'application et le site web Meta AI, puis il remplacera les modèles Llama existants sur des plateformes telles que WhatsApp, Instagram et Facebook dans les semaines à venir. Il est à noter que Meta ne communique pas de détails sur l'échelle du modèle et s'écarte de sa stratégie d'ouverture antérieure en ne mettant à disposition qu'un aperçu limité de l'API pour certains partenaires sélectionnés.

Dans la course pour dominer le secteur de l’IA, Mark Zuckerberg a placé la superintelligence artificielle comme est un pilier stratégique de Meta. En juillet 2025, afin de soutenir l’entraînement de ses futurs modèles d’IA, Meta a commencé à ériger des tentes industrielles pour accueillir des serveurs surchauffés, faute de data centers construits à temps. Une initiative qui montrait que Meta souhaite développer plus rapidement ses capacités d'IA après avoir pris du retard sur des concurrents comme OpenAI, xAI et Google. Reste maintenant à voir les performances de Muse Spark pour juger si cette initiative est une absurdité ou un coup de génie.


Voici l'annonce de Meta :

Présentation de Muse Spark : vers une superintelligence personnelle

Aujourd’hui, nous sommes ravis de vous présenter Muse Spark, le premier modèle de la famille Muse développé par Meta Superintelligence Labs. Muse Spark est un modèle de raisonnement multimodal natif prenant en charge l’utilisation d’outils, le raisonnement visuel et l’orchestration multi-agents.

Muse Spark marque la première étape de notre stratégie d’expansion et constitue le premier fruit d’une refonte complète de nos efforts en matière d’IA. Pour soutenir cette expansion, nous réalisons des investissements stratégiques sur l'ensemble de la pile, de la recherche et de l'entraînement des modèles à l'infrastructure, y compris le centre de données Hyperion.

Dans cet article, nous allons d'abord explorer les nouvelles capacités et applications de Muse Spark. Après ces résultats, nous jetterons un œil en coulisses sur les axes d'expansion qui guident nos progrès vers la superintelligence personnelle.

Muse Spark est disponible dès aujourd'hui sur meta.ai et dans l'application Meta AI. Nous ouvrons un aperçu privé de l'API à certains utilisateurs.

Capacités pour une superintelligence personnelle

Muse Spark offre des performances compétitives dans les domaines de la perception multimodale, du raisonnement, de la santé et des tâches agentiques. Nous continuons d'investir dans les domaines où des écarts de performance subsistent, tels que les systèmes agentiques à long terme et les workflows de codage.

Avec des modèles plus volumineux en cours de développement, ces résultats démontrent que notre pile évolue efficacement.

Nom : 1.jpg
Affichages : 4725
Taille : 116,1 Ko

Nous lançons également le mode Contemplating, qui coordonne plusieurs agents raisonnant en parallèle. Cela permet à Muse Spark de rivaliser avec les modes de raisonnement extrêmes de modèles de pointe tels que Gemini Deep Think et GPT Pro. Le mode Contemplating apporte des améliorations significatives en termes de capacités pour les tâches difficiles, atteignant 58 % au test Humanity’s Last Exam et 38 % au test FrontierScience Research.

Nom : 0.jpg
Affichages : 215
Taille : 26,1 Ko

Applications

Muse Spark est la première étape vers une superintelligence personnelle qui comprend votre monde. De l’analyse de votre environnement immédiat au soutien de votre bien-être, les capacités de raisonnement avancées de Muse Spark permettent des cas d’utilisation puissants et hautement personnalisés.

- Multimodal. Muse Spark a été entièrement conçu pour intégrer des informations visuelles à travers différents domaines et outils. Il affiche d’excellentes performances sur les questions visuelles en sciences, technologie, ingénierie et mathématiques (STEM), la reconnaissance d’entités et la localisation. Ces capacités s’associent pour permettre des expériences interactives telles que la création de mini-jeux ludiques ou le dépannage de vos appareils ménagers grâce à des annotations dynamiques.

- Santé. L'une des principales applications de la superintelligence personnelle consiste à aider les gens à mieux connaître et à améliorer leur santé. Afin d'améliorer les capacités de raisonnement de Muse Spark en matière de santé, nous avons collaboré avec plus de 1 000 médecins pour sélectionner des données d'entraînement permettant d'obtenir des réponses plus factuelles et plus complètes. Muse Spark peut générer des affichages interactifs qui décortiquent et expliquent des informations de santé telles que la composition nutritionnelle de divers aliments ou les muscles sollicités pendant l'exercice.

Axes de mise à l'échelle

Pour construire une superintelligence personnelle, les capacités de notre modèle doivent évoluer de manière prévisible et efficace. Ci-dessous, nous expliquons comment nous étudions et suivons les propriétés de mise à l'échelle de Muse Spark selon trois axes : le pré-entraînement, l'apprentissage par renforcement et le raisonnement en temps réel.

- Pré-entraînement. La phase de pré-entraînement est celle où Muse Spark acquiert ses capacités fondamentales de compréhension multimodale, de raisonnement et de codage — les fondations sur lesquelles s'appuient l'apprentissage par renforcement et le calcul en temps réel.

Au cours des neuf derniers mois, nous avons repensé notre pile de pré-entraînement en apportant des améliorations à l'architecture du modèle, à l'optimisation et à la curation des données. Ensemble, ces avancées augmentent la capacité que nous pouvons extraire de chaque unité de calcul. Pour évaluer rigoureusement notre nouvelle approche, nous avons ajusté une loi d'évolutivité à une série de petits modèles et comparé les FLOPs de formation nécessaires pour atteindre un niveau de performance spécifique. Les résultats sont clairs : nous pouvons atteindre les mêmes capacités avec une puissance de calcul inférieure d'un ordre de grandeur à celle de notre modèle précédent, Llama 4 Maverick. Cette amélioration rend également Muse Spark nettement plus efficace que les principaux modèles de base disponibles à des fins de comparaison.

Nom : 2.jpg
Affichages : 213
Taille : 25,7 Ko

- Apprentissage par renforcement. Après le pré-entraînement, l'apprentissage par renforcement (RL) exploite la puissance de calcul pour amplifier de manière évolutive les capacités du modèle. Même si le RL à grande échelle est notoirement sujet à l'instabilité, notre nouvelle pile offre des gains fluides et prévisibles.

Les graphiques ci-dessous montrent les avantages de l'évolutivité de la puissance de calcul RL (mesurée en étapes) pour Muse Spark. À gauche, on observe une croissance log-linéaire de pass@1 et pass@16 (au moins un succès sur 16 tentatives) sur les données d'entraînement. Cela indique que l'apprentissage par renforcement améliore la fiabilité du modèle sans compromettre la diversité du raisonnement. À droite, la croissance de la précision sur un ensemble d'évaluation réservé établit que les gains issus de l'apprentissage par renforcement se généralisent de manière prévisible : Muse Spark s'améliore progressivement sur des tâches qui n'ont pas été rencontrées lors de l'entraînement.

Nom : 3.jpg
Affichages : 205
Taille : 27,9 Ko

- Raisonnement au moment du test. L'apprentissage par renforcement (RL) forme nos modèles à « réfléchir » avant de répondre — un processus appelé « raisonnement au moment du test ». Pour mettre cette fonctionnalité à la disposition de milliards d'utilisateurs, il est nécessaire d'utiliser efficacement les jetons de raisonnement. Pour y parvenir, nous nous appuyons sur deux leviers clés : des pénalités de temps de réflexion pour optimiser l'utilisation des jetons, et une orchestration multi-agents qui améliore les performances sans ralentir les temps de réponse.

Afin d'offrir un maximum d'intelligence par jeton, notre apprentissage par renforcement maximise l'exactitude tout en imposant une pénalité sur le temps de réflexion. Sur un sous-ensemble d'évaluations telles que l'AIME, cela provoque une transition de phase. Après une période initiale où le modèle s'améliore en réfléchissant plus longtemps, la pénalité de durée entraîne une compression de la réflexion : Muse Spark compresse son raisonnement pour résoudre les problèmes en utilisant nettement moins de jetons. Après cette compression, le modèle étend à nouveau ses solutions pour atteindre de meilleures performances.

Pour consacrer plus de temps de test au raisonnement sans augmenter considérablement la latence, nous pouvons faire évoluer le nombre d'agents parallèles qui collaborent pour résoudre des problèmes complexes. La figure ci-dessous illustre les avantages de cette approche. Alors que la mise à l'échelle standard en temps de test consiste à faire réfléchir un seul agent plus longtemps, la mise à l'échelle de Muse Spark avec une réflexion multi-agents permet d'obtenir des performances supérieures avec une latence comparable.

Nom : 4.jpg
Affichages : 207
Taille : 23,8 Ko

Sécurité

Muse Spark dispose de vastes capacités de raisonnement dans des domaines scientifiques à double usage ; nous avons donc mené des évaluations de sécurité approfondies avant son déploiement. Notre processus suit le cadre Advanced AI Scaling Framework mis à jour, qui définit les modèles de menace, les protocoles d'évaluation et les seuils de déploiement pour nos modèles les plus avancés. Nous avons évalué Muse Spark avant et après l'application de mesures d'atténuation des risques dans les catégories de risques de pointe, l'alignement comportemental et la robustesse face aux attaques adversaires.

Nous avons constaté que Muse Spark fait preuve d'un comportement de refus marqué dans les domaines à haut risque tels que les armes biologiques et chimiques, grâce au filtrage des données de pré-entraînement, à un post-entraînement axé sur la sécurité et à des garde-fous au niveau du système. Dans les domaines de la cybersécurité et de la perte de contrôle, Muse Spark ne présente pas la capacité d'autonomie ni les tendances dangereuses nécessaires pour concrétiser des scénarios de menace. Nos évaluations montrent que Muse Spark se situe dans des marges de sécurité pour toutes les catégories de risques de pointe que nous avons mesurées, compte tenu de son contexte de déploiement. Les résultats complets seront disponibles dans notre prochain rapport sur la sécurité et la préparation.

Nom : 5.jpg
Affichages : 203
Taille : 26,4 Ko

Lors d'évaluations menées par des tiers à un stade proche du lancement, Apollo Research a constaté que Muse Spark présentait le taux de conscience de l'évaluation le plus élevé parmi les modèles qu'ils ont observés. Le modèle a fréquemment identifié des scénarios comme des « pièges d'alignement » et a estimé qu'il devait se comporter honnêtement puisqu'il était en cours d'évaluation. Cela est important car les modèles qui reconnaissent les contextes d'évaluation peuvent se comporter différemment lors des tests par rapport au déploiement. Cependant, ces résultats ne confirment pas que la conscience de l'évaluation modifie directement le comportement, et notre propre enquête de suivi a trouvé des preuves initiales indiquant que la conscience de l'évaluation pourrait affecter le comportement du modèle sur un petit sous-ensemble d'évaluations d'alignement, toutes sans rapport avec des capacités ou des propensions dangereuses affectant les décisions de lancement du modèle. Nous avons conclu que cela ne constituait pas un obstacle à la mise en service, bien que cela mérite des recherches supplémentaires. Pour en savoir plus, consultez notre prochain rapport sur la sécurité et la préparation.

Conclusion

Avec Muse Spark, nous sommes sur une trajectoire de mise à l'échelle prévisible et efficace. Nous sommes impatients de partager bientôt des modèles de plus en plus performants sur la voie de la superintelligence personnelle.

Source : Annonce de Meta

Et vous ?

Pensez-vous que cette annonce est crédible ou pertinente ?
Quel est votre avis sur le sujet ?

Voir aussi :

Meta licencie 700 personnes moins de 24 heures après avoir annoncé un plan de rémunération allant jusqu'à 2,7 milliards de dollars pour chacun de ses six cadres supérieurs, l'entreprise mise tout sur l'IA

Meta a truqué les tests pour donner l'impression que son nouveau modèle d'IA Llama 4 est meilleur que la concurrence, ce qui remet davantage en cause la pertinence des résultats des benchmarks de l'IA

Le laboratoire d'IA de Meta frappé par des conflits internes avec des cadres chevronnés au sujet des ressources, de la bureaucratie et des différences culturelles, menaçant la poussée vers la superintelligence