DeepSeek dévoile un aperçu de son modèle V4 tant attendu, qui offre un contexte d'un million de jetons et d'excellents résultats en matière de codage, mettant la pression sur l'ensemble du marché de l'IA
DeepSeek a lancé DeepSeek V4 Pro et DeepSeek V4 Flash, sa première mise à jour majeure de modèle depuis plus d'un an. Les nouveaux modèles V4 introduisent une fenêtre contextuelle pouvant atteindre 1 million de jetons, ce qui permet de maintenir une meilleure cohérence dans les conversations et les documents plus longs, à moindre coût. DeepSeek V4 reste open source, ce qui permet aux utilisateurs d'inspecter, d'adapter ou de modifier le code. Son précédent modèle R1 avait bouleversé les marchés grâce à ses performances élevées à moindre coût. La concurrence chinoise croissante a intensifié la pression sur les stratégies mondiales en matière de dépenses dans l'IA.
DeepSeek est une entreprise chinoise spécialisée dans l'intelligence artificielle (IA) qui développe des grands modèles de langage (LLM). La société a lancé un chatbot éponyme parallèlement à son modèle DeepSeek-R1 en janvier 2025. DeepSeek-R1 fournissait des réponses comparables à celles d'autres LLM contemporains, tels que le GPT-4 et l'o1 d'OpenAI. Son coût de formation aurait été nettement inférieur à celui d'autres LLM. La société affirme avoir formé son modèle V3 pour 6 millions de dollars, soit bien moins que les 100 millions de dollars qu'a coûté le GPT-4 d'OpenAI en 2023, et en utilisant environ un dixième de la puissance de calcul consommée par le modèle comparable de Meta, Llama 3.1. Le succès de DeepSeek face à des rivaux plus importants et mieux établis a été qualifié de « bouleversement de l'IA ».
Récemment, DeepSeek a lancé DeepSeek V4 Pro et DeepSeek V4 Flash, sa première mise à jour majeure de modèle depuis plus d'un an. Les nouveaux modèles V4 introduisent une fenêtre contextuelle pouvant atteindre 1 million de jetons, ce qui permet de maintenir une meilleure cohérence dans les conversations et les documents plus longs, à moindre coût. DeepSeek V4 reste open source, ce qui permet aux utilisateurs d'inspecter, d'adapter ou de modifier le code. V4 Pro est destiné à des tâches agentiques plus complexes en plusieurs étapes. DeepSeek affirme qu'il rivalise avec les principaux modèles propriétaires en matière de raisonnement et qu'il n'est devancé que par Gemini 3.1 Pro de Google en termes de connaissance du monde. V4 Flash est la variante plus rapide, offrant des réponses plus rapides tout en restant proche de V4 Pro pour les tâches agentiques plus simples.
Cette sortie intervient également dans un contexte de surveillance accrue. L'utilisation de DeepSeek a été interdite par les agences fédérales américaines et sur les appareils gouvernementaux pour des raisons de sécurité nationale, tandis que la Corée du Sud a temporairement suspendu les téléchargements pour des raisons de confidentialité avant de rétablir la disponibilité par la suite.
DeepSeek dévoile une version préliminaire de son modèle V4 tant attendu
La start-up chinoise spécialisée dans l'IA DeepSeek a publié une version préliminaire de son très attendu modèle V4, permettant aux utilisateurs de tester ses nouvelles capacités et fonctionnalités. Cette sortie intervient plus d'un an après que la société basée à Hangzhou a présenté son modèle de raisonnement R1, qui a bouleversé les marchés technologiques mondiaux en raison de ses performances surprenantes et de sa rentabilité.
À l'instar des précédentes versions de DeepSeek, cette dernière mise à jour est open source, ce qui permet aux développeurs de télécharger le code, de l'exécuter localement et, dans la plupart des cas, de le modifier. Le modèle est disponible en versions « pro » et « flash », en fonction de la taille, DeepSeek affirmant que le V4 offre des performances supérieures à celles de ses concurrents nationaux, notamment dans les tâches basées sur des agents, le traitement des connaissances et l'inférence.
« L'aperçu de la V4 de DeepSeek est une véritable prouesse », offrant des coûts d'inférence inférieurs à ceux des modèles précédents, a déclaré Neil Shah, vice-président de la recherche chez Counterpoint Research. Les coûts d'inférence désignent les dépenses informatiques et financières liées à l'exécution d'un modèle d'IA entraîné pour générer des résultats. DeepSeek a également indiqué que la V4 a été optimisée pour être utilisée avec des outils d'agents populaires tels que Claude Code d'Anthropic et OpenClaw. Selon Wei Sun, analyste principal en IA chez Counterpoint, le profil de référence de la V4 suggère qu’elle pourrait offrir « d’excellentes capacités d’agent à un coût nettement inférieur ».
DeepSeek va-t-il à nouveau surprendre le monde ?
Fondée en 2023, DeepSeek s’est fait remarquer fin 2024 avec son modèle V3 gratuit et open source, qui, selon l’entreprise, avait été entraîné avec des puces moins puissantes et à un coût bien inférieur à celui des modèles développés par des sociétés telles qu’OpenAI et Google. Quelques semaines plus tard, en janvier 2025, l’entreprise a lancé un modèle de raisonnement, R1, qui a atteint des performances similaires ou surpassé bon nombre des principaux modèles de langage (LLM) mondiaux.
Le modèle R1 avait alarmé les investisseurs lorsque DeepSeek avait révélé qu’il n’avait fallu que deux mois, et moins de 6 millions de dollars, pour le développer à l’aide de puces Nvidia de moindre capacité. Cela avait remis en question la suprématie des États-Unis en matière d’IA ainsi que les dépenses colossales des géants de la tech dans les infrastructures d’IA. Depuis lors, DeepSeek a publié une série de mises à jour de ses modèles, mais aucune n’a eu l’impact de R1.
Le lancement de V4 n’aura probablement pas le même impact sur le marché que celui de R1, car les traders ont déjà intégré dans leurs prévisions le fait que l’IA chinoise est compétitive et moins coûteuse à utiliser, a déclaré Ivan Su, analyste actions senior chez Morningstar. Cependant, le dernier positionnement de DeepSeek place d’autres modèles open source chinois en tant que concurrents directs, a ajouté Su. « C'est un cadre qui n'existait pas avec R1, et cela suffit à montrer à quel point la concurrence nationale s'est intensifiée », a-t-il ajouté.
Depuis la sortie de R1, DeepSeek a dû faire face à une concurrence accrue dans le secteur chinois de l'IA en plein essor, des acteurs comme Alibaba et ByteDance ayant également lancé de nouveaux modèles cette année. Les actions de plusieurs autres acteurs chinois de l’IA étaient en baisse à la Bourse de Hong Kong. MiniMax et Knowledge Atlas Technology, également connu sous le nom de Zhipu, ont chacune chuté d’environ 8 %, tandis que le développeur Manycore Tech, basé à Hangzhou, a plongé de 9 %.
Quelles puces ont servi à entraîner le V4 ?
Une question majeure entourant la sortie du modèle V4 de DeepSeek est de savoir quelles puces ont été utilisées pour l’entraîner et le prendre en charge. Le géant technologique chinois Huawei a confirmé vendredi que son dernier cluster de calcul IA, équipé de ses processeurs Ascend AI, peut prendre en charge le modèle V4 de DeepSeek. Cependant, on ignore encore dans quelle mesure les puces de Huawei ont été utilisées pour l'entraînement, par rapport à celles du leader américain des puces IA, Nvidia. Les développeurs chinois se sont vu interdire l'achat direct des puces IA les plus avancées de Nvidia en raison des contrôles à l'exportation sans cesse changeants de Washington.
Dans le même temps, Pékin a intensifié ses efforts pour développer son industrie nationale des puces et aurait incité les entreprises technologiques chinoises à adopter des alternatives nationales proposées par des fabricants de puces tels que Huawei. Wei Sun, de Counterpoint, a déclaré que la capacité de V4 à fonctionner en mode natif sur des puces locales pourrait avoir des implications considérables, aidant Pékin à renforcer sa souveraineté en matière d’IA et à réduire davantage sa dépendance vis-à-vis de Nvidia. « Cela finira également par accélérer les développements mondiaux en matière d’IA », a-t-elle ajouté.
Après l'annonce par DeepSeek de la sortie de V4, les actions des fabricants chinois de puces sous contrat ont progressé à Hong Kong, SMIC et Hua Hong Semiconductor enregistrant respectivement une hausse de 9 % et 15 %. Depuis fin décembre 2025, les modèles d'IA open source chinois ont considérablement étendu leur présence à l'échelle mondiale, leur taux d'adoption passant de 13 % à près de 30 % de l'utilisation totale en 2025, principalement grâce à Qwen et DeepSeek. Cette tendance a été documentée dans le rapport "State of AI" d'OpenRouter, qui a analysé plus de 100 000 milliards de jetons sur plus de 300 modèles, révélant ainsi le passage d'une domination propriétaire à une concurrence pluraliste et open source à l'échelle mondiale.
Source : Annonce de DeepSeek V4
Et vous ?
Pensez-vous que cette étude est crédible ou pertinente ?
Quel est votre avis sur le sujet ?
Voir aussi :
DeepSeek, la start-up chinoise spécialisée dans l'IA qui a fait perdre près de 600 milliards $ à Nvidia en une seule journée avec le lancement de son modèle R1, s'apprête à dévoiler son prochain modèle d'IA
Le mystérieux modèle d'IA « Hunter Alpha », que l'on croyait être DeepSeek V4, s'avère être une création de Xiaomi, doté de caractéristiques techniques impressionnantes avec 1 000 milliards de paramètres
Les États-Unis accusent la Chine de voler leur IA « à l'échelle industrielle » via la technique de distillation : Pékin dénonce une « calomnie » et DeepSeek, visé implicitement, publie son modèle V4







Pensez-vous que cette étude est crédible ou pertinente ?
Répondre avec citation
Partager