DeepSeek, la start-up chinoise spécialisée dans l'IA, s'apprête à dévoiler son prochain modèle d'IA

**Bruno** · 14/05/2025, 09h39

DeepSeek met fin au mythe du contrôle de l'IA par la Silicon Valley, son modèle R1, développé à moindre coût,
et son succès fulgurant aux États-Unis ébranlent les certitudes du secteur

L’apparition de DeepSeek a fait voler en éclats le mythe d’un monopole technologique américain sur l’intelligence artificielle. En moins de deux ans, cette entreprise chinoise a réussi à réduire considérablement l’écart qui la séparait des géants américains de l’IA, notamment grâce à une stratégie open source audacieuse. DeepSeek est devenue l'application gratuite la plus téléchargée aux États-Unis une semaine seulement après son lancement.

L'émergence de l'application chinoise d'intelligence artificielle DeepSeek a choqué les marchés financiers et incité le président américain Donald Trump à la qualifier de « signal d'alarme » pour l'industrie technologique américaine. L'affirmation de DeepSeek selon laquelle son modèle d'intelligence artificielle R1 a été fabriqué pour une fraction du coût de ses concurrents a soulevé des questions sur l'avenir de l'ensemble du secteur et a fait chuter la valeur de certaines des plus grandes entreprises du monde.

Nom : Deepseek.PNG
Affichages : 37990
Taille : 125,5 Ko

Le 20 janvier, DeepSeek a dévoilé R1, un modèle d’IA aussi performant que la dernière version de ChatGPT, mais développé pour une fraction du coût. Mis gratuitement à disposition, avec ses plans publiés en ligne, R1 est immédiatement devenu un objet de fascination. Marc Andreessen l’a décrit comme le « moment Spoutnik de l’IA », et TechCrunch a titré sur « la première crise de panique de la Silicon Valley en 2025 ».

Sam Altman, PDG d’OpenAI, n’a pas hésité à saluer les performances de DeepSeek, qu’il a qualifié de « modèle impressionnant » dans une publication sur X le 28 janvier. Il s’est particulièrement attardé sur l’efficacité du modèle au regard de son coût de développement : moins de 6 millions de dollars, un chiffre dérisoire comparé aux milliards investis par les leaders du secteur comme OpenAI. Ce commentaire, venant de l’un des pionniers de l’intelligence artificielle moderne, souligne à quel point la startup chinoise a bousculé l’ordre établi.

Satya Nadella, PDG de Microsoft, a lui aussi exprimé son admiration pour DeepSeek, affirmant qu’il représente désormais le nouveau « critère de réussite » en matière d’IA pour la firme de Redmond. Ce qui l’a particulièrement frappé, c’est la capacité d’une équipe de seulement 200 personnes à développer une solution IA qui s’est hissée au sommet de l’App Store. Cette réussite spectaculaire remet en question les méthodes traditionnelles de l’industrie, souvent dépendantes d’effectifs massifs et de budgets faramineux.

Nadella a souligné que ce qui rend DeepSeek remarquable n’est pas seulement sa dimension technique, mais surtout sa capacité à transformer un projet open source en un produit concret, massivement adopté par le grand public. Pour lui, cela fixe une nouvelle barre à atteindre dans le domaine de l’IA. Selon les données de la plateforme [aitools.xyz], DeepSeek est actuellement l’outil d’IA connaissant la plus forte croissance au monde, dépassant même ChatGPT en nombre de visites mensuelles sur son site.

La Chine défie la domination technologique américaine avec DeepSeek

Alors que les entreprises américaines ont investi des milliards pour concevoir des modèles d’IA, l’efficacité de DeepSeek a jeté un doute profond sur la pertinence de ces dépenses. Selon certaines sources, le coût total de R1 équivaudrait au salaire annuel d’un cadre supérieur de Google. En une semaine, l’application s’est hissée en tête des classements sur iPhone et Android.

Ce bouleversement est survenu peu après la sortie du livre de Parmy Olson, en septembre 2024. À cette époque, le domaine de l’IA semblait dominé par Sam Altman (OpenAI) et Demis Hassabis (Google DeepMind), qui visaient à créer une intelligence générale artificielle (AGI) capable de résoudre des problèmes globaux. Pourtant, deux ans après ChatGPT, les bénéfices réels de l’IA pour l’humanité restaient incertains, alors même que la valeur boursière cumulée des six plus grandes entreprises technologiques avait bondi de 8 000 milliards de dollars.

La semaine dernière, DeepSeek, alors âgée d’à peine un an, a confirmé son potentiel révolutionnaire en annonçant que R1 avait été développé pour seulement 5,6 millions de dollars en puissance de calcul. À titre de comparaison, les géants américains déboursent des centaines de millions, voire des milliards, pour des modèles similaires.

La réaction des marchés ne s’est pas fait attendre. Le lundi suivant, le Nasdaq a reculé de 3,1 %, le S&P 500 de 1,5 %, tandis que le Dow Jones, soutenu par les valeurs de la santé et de la consommation, a progressé de 0,7 %. Les pertes auraient été plus lourdes encore sans ce léger rebond. Dans ce climat de nervosité, Meta annonçait un budget de plus de 65 milliards de dollars pour son développement IA en 2025. Sam Altman évoquait des besoins en investissements de plusieurs milliers de milliards pour produire les puces indispensables aux centres de données.

Marc Andreessen, fervent soutien de Donald Trump et investisseur technologique influent, n’a pas mâché ses mots. Il a qualifié l’innovation de DeepSeek de « percée parmi les plus impressionnantes » qu’il ait jamais observées. Cette prouesse prend une dimension encore plus spectaculaire dans le contexte des restrictions américaines imposées à la Chine sur les puces avancées pour des raisons de sécurité nationale. Malgré l’absence d’accès aux meilleures puces, DeepSeek a réussi à bâtir un modèle performant à faible coût avec du matériel considéré comme obsolète par les standards occidentaux.

Le choc s’est propagé sur les marchés technologiques. Lundi, Nvidia a perdu près de 17 %, soit 588,8 milliards de dollars en capitalisation boursière, la plus forte perte journalière jamais enregistrée, éclipsant le précédent record de Meta. Pour remettre les choses en perspective, cette chute dépasse la valeur totale de presque toutes les entreprises, à l’exception de treize dans le monde.

Avant la baisse, Nvidia était l’entreprise cotée la plus valorisée au monde. En une journée, elle est descendue à la troisième place, derrière Apple et Microsoft. D'autres géants, comme Meta et Alphabet, ont également enregistré des pertes marquées, tout comme les fournisseurs de puces concurrents (Marvell, Broadcom, Micron, TSMC) et les entreprises d’infrastructure comme Oracle et Vertiv.

Les valeurs technologiques, qui composent environ 45 % du S&P 500, ont entraîné l’ensemble du marché dans leur sillage. Selon Keith Lerner, analyste chez Truist, l’avance américaine dans l’IA avait soutenu cette surperformance. DeepSeek a ravivé des interrogations majeures : les investissements massifs consentis étaient-ils judicieux ou excessifs ?

Alors que s’ouvre la saison des résultats trimestriels des grandes entreprises technologiques, les analystes redoutent des réactions boursières erratiques. En attendant, l’intérêt des investisseurs se tourne vers la Chine, où certaines entreprises d’IA apparaissent sous-évaluées. Charu Chanana, stratégiste chez Saxo, y voit une opportunité : « L’essor de DeepSeek pourrait raviver l’intérêt pour les entreprises chinoises d’IA, dont les valorisations pâtissent de la géopolitique et de la faible demande mondiale. »

Les effets ne se sont pas limités à la tech. Les entreprises énergétiques, portées par les besoins des centres de données en électricité, ont aussi été ébranlées. Constellation Energy, promoteur de la relance de la centrale de Three Mile Island, a chuté de 21 %, Vistra de 28 %, et GE Vernova de 21 %. Le gaz naturel et le pétrole ont également reculé, tout comme les cryptomonnaies, dont le bitcoin.

Reste une question cruciale : tout cela est-il bien réel ? Une seule prouesse technique peut-elle menacer la domination technologique américaine ? Les analystes restent prudents. Le modèle R1, bien que bluffant, reste un outil grand public, comparable à ChatGPT. Il ne s’est pas encore imposé dans des domaines industriels à forte valeur ajoutée, qui nécessitent des investissements massifs en infrastructures.

Michael Block, stratège chez Third Seven Capital, appelle à la patience : « Le temps dira si DeepSeek est une menace sérieuse. Les marchés ont peut-être été trop complaisants dans cette phase Trump 2.0, et certains attendaient une excuse pour se retirer. Ils l’ont trouvée. » Malgré la pression, les États-Unis conservent un atout majeur : leur capacité à attirer talents et capitaux. « L’Amérique reste le terrain le plus fertile pour la première IA capable de s’auto-améliorer », conclut Giuseppe Sette, président de Reflexivity.

DeepSeek, entre admiration technologique et soupçons de cyber-surveillance

DeepSeek est perçu par ses partisans comme bien plus qu’un simple modèle : c’est un véritable mouvement. Dans un paysage dominé par des entités fermées comme Google, OpenAI ou Anthropic, l’approche radicalement ouverte de DeepSeek, basée sur la transparence, la collaboration et l’accessibilité, évoque les débuts de Linux. À la différence près qu’ici, la révolution ne prend pas des décennies, mais seulement quelques mois.

Le succès fulgurant de DeepSeek n’a pas seulement capté l’attention des géants technologiques ; il a aussi provoqué des remous au sein des institutions américaines. Un rapport récent du Congrès accuse l’entreprise d’être une menace sérieuse pour la sécurité nationale, l’accusant de siphonner les données des utilisateurs américains et de s’appuyer sur des technologies « volées » aux États-Unis. Le document va jusqu’à décrire DeepSeek comme un outil de surveillance au service du Parti communiste chinois, destiné à contourner les lois américaines et à espionner la population.

Face à ces accusations, Microsoft a interdit à ses employés d’utiliser l’application DeepSeek, invoquant des risques liés à la sécurité des données et à la propagande potentielle. L’entreprise a également décidé de ne pas intégrer l’application dans sa boutique officielle, illustrant ainsi le durcissement de l’attitude américaine à l’égard des plateformes technologiques venues de Chine, dans un climat de tensions géopolitiques croissantes.

Devant le Sénat américain, Brad Smith, vice-président du conseil d’administration de Microsoft, a renforcé cette position en affirmant que DeepSeek stockait les données utilisateurs sur des serveurs chinois, ce qui pose des risques évidents au regard des lois locales sur le renseignement. Il a également mis en garde contre les biais ou la désinformation que le modèle pourrait diffuser. Bien que Microsoft ait brièvement hébergé le modèle R1 sur Azure, cela n’a été fait qu’après une évaluation rigoureuse visant à éliminer les contenus problématiques.

Et vous ?

Quel est votre avis sur le sujet ?

Pensez-vous que DeepSeek sera en mesure de poursuivre son ascension au cours des prochains mois ?

Les régulateurs américains et européens vont-ils imposer des restrictions à DeepSeek, comme ils l'ont fait pour Huawei ou TikTok ?

L'open source peut-il permettre à DeepSeek de maintenir une avance technologique, ou cela risque-t-il de favoriser ses concurrents (y compris américains) qui pourront réutiliser ses innovations ?

Voir aussi :

Sam Altman, PDG d'OpenAI, a qualifié DeepSeek de « modèle impressionnant », après que la sortie de DeepSeek R1 a provoqué une onde de choc dans la communauté de l'IA

Satya Nadella affirme que DeepSeek est le nouveau « critère de réussite » de Microsoft en matière d'IA et érige en modèle l'approche de la startup chinoise, qui a ébranlé Wall Street avec son modèle R1

Le chatbot chinois DeepSeek dépasse ChatGPT d'OpenAI en termes de nouvelles visites mensuelles, avec 524 millions de nouvelles visites en février 2025 et devient l'outil d'IA à la croissance la plus rapide

Microsoft interdit l'application DeepSeek à ses employés, évoquant des problèmes de sécurité des données et de propagande, tout en confirmant que Deepseek ne sera plus listé dans son magasin d'applications

**RenarddeFeu** · 15/05/2025, 01h25

Deepseek est très bien, beaucoup moins obséquieux et avec une logorrhée moins affirmée que ses concurrents.

**Alex** · 19/09/2025, 13h27

Le développeur chinois d'IA DeepSeek n'a dépensé que 294 000 dollars pour former son modèle R1, soit beaucoup moins que ce qui a été rapporté pour ses concurrents américains.

Le développeur chinois d'intelligence artificielle DeepSeek a annoncé que son modèle R1 avait été formé pour un coût de 294 000 dollars, soit un montant nettement inférieur aux coûts de formation cités par ses concurrents américains, tels que OpenAI et Nvidia. Un rapport a révélé que le modèle R1 de DeepSeek utilisait 512 puces Nvidia H800, acquises après que les restrictions américaines à l'exportation aient limité l'accès à des puces IA plus puissantes pour le marché chinois. DeepSeek a défendu sa méthodologie de formation, affirmant que toute similitude avec les modèles d'OpenAI était fortuite et attribuable à l'utilisation de pages web explorées, qui incluaient par inadvertance du contenu généré par OpenAI, plutôt qu'à une tentative délibérée de reproduire des modèles existants.

L’apparition de DeepSeek a fait voler en éclats le mythe d’un monopole technologique américain sur l’intelligence artificielle (IA). En moins de deux ans, cette entreprise chinoise a réussi à réduire considérablement l’écart qui la séparait des géants américains de l’IA, notamment grâce à une stratégie open source audacieuse. DeepSeek est devenue l'application gratuite la plus téléchargée aux États-Unis une semaine seulement après son lancement. L'entreprise a affirmé que R1 avait été développé pour seulement 5,6 millions de dollars en puissance de calcul, une fraction du coût de ses concurrents.

Puis en août, DeepSeek a minutieusement orchestré le lancement de son modèle V3.1. Il est intervenu quelques semaines seulement après la publication de GPT-5 par OpenAI et de Claude 4.1 par Anthropic, deux modèles considérés comme l’avant-garde des capacités de l’IA. En égalant leurs performances tout en restant open source, DeepSeek remet en cause les fondements mêmes du modèle économique qui soutient le leadership américain dans le domaine de l'IA. Alors que GPT-5 s'est ridiculisé auprès des utilisateurs, ceux-ci pourraient se tourner massivement vers DeepSeek V3.1. Encore une fois, il a été construit pour une fraction du coût de ses rivaux, en utilisant beaucoup moins de puces Nvidia.

Récemment, un article publié dans la revue scientifique Nature a révélé que le développeur chinois d'IA DeepSeek a dépensé 294 000 dollars pour former son modèle R1, un montant bien inférieur à celui annoncé par ses concurrents américains. Pour rappel, la publication par DeepSeek en janvier de ce qu'elle a présenté comme des systèmes d'IA à moindre coût a incité les investisseurs mondiaux à se débarrasser de leurs actions technologiques, craignant que les nouveaux modèles ne menacent la domination des leaders de l'IA, notamment Nvidia.

Depuis lors, la société et son fondateur Liang Wenfeng ont largement disparu de la scène publique, à l'exception de quelques mises à jour sur de nouveaux produits. L'article de Nature, qui cite Liang parmi les coauteurs, indique que le modèle R1 de DeepSeek, axé sur le raisonnement, a coûté 294 000 dollars à former et a utilisé 512 puces Nvidia H800. Une version précédente de l'article publiée en janvier ne contenait pas cette information.

Nom : 1.jpg
Affichages : 61014
Taille : 27,2 Ko

Les coûts de formation des grands modèles de langage qui alimentent les chatbots IA correspondent aux dépenses engagées pour faire fonctionner un cluster de puissantes puces pendant des semaines ou des mois afin de traiter de grandes quantités de texte et de code. Sam Altman, PDG du géant américain de l'IA OpenAI, a déclaré en 2023 que la formation des modèles fondamentaux avait coûté « bien plus » que 100 millions de dollars, bien que son entreprise n'ait fourni aucun chiffre détaillé pour aucune de ses versions.

Certaines déclarations de DeepSeek concernant ses coûts de développement et la technologie utilisée ont été remises en question par des entreprises et des responsables américains. Les puces H800 mentionnées ont été conçues par Nvidia pour le marché chinois après que les États-Unis ont interdit à l'entreprise d'exporter ses puces IA H100 et A100, plus puissantes, vers la Chine en octobre 2022.

Des responsables américains ont déclaré en juin que DeepSeek avait accès à de « grandes quantités » de puces H100 qui avaient été achetées après la mise en place des contrôles à l'exportation américains. Nvidia a déclaré à l'époque que DeepSeek avait utilisé des puces H800 acquises légalement, et non des puces H100. Dans un document d'information complémentaire accompagnant l'article de Nature, l'entreprise a reconnu pour la première fois qu'elle possédait des puces A100 et a déclaré les avoir utilisées dans les phases préparatoires du développement.

« Dans le cadre de nos recherches sur DeepSeek-R1, nous avons utilisé les GPU A100 pour préparer les expériences avec un modèle plus petit », ont écrit les chercheurs. Après cette phase initiale, R1 a été entraîné pendant 80 heures au total sur le cluster de 512 puces H800, ont-ils ajouté. Un rapport a précédemment révélé que l'une des raisons pour lesquelles DeepSeek avait réussi à attirer les esprits les plus brillants de Chine était qu'il s'agissait de l'une des rares entreprises nationales à exploiter un cluster de supercalculateurs A100.

DeepSeek a également répondu pour la première fois, bien que de manière indirecte, aux affirmations d'un haut conseiller de la Maison Blanche et d'autres personnalités américaines du domaine de l'IA qui avaient déclaré en janvier qu'elle avait délibérément « distillé » les modèles d'OpenAI pour les intégrer aux siens. DeepSeek a toujours défendu la distillation comme permettant d'obtenir de meilleures performances des modèles tout en étant beaucoup moins coûteuse à former et à exploiter, ce qui permet un accès plus large aux technologies basées sur l'IA en raison des besoins en ressources énergétiques importants de ces modèles.

Ce terme désigne une technique par laquelle un système d'IA apprend d'un autre système d'IA, ce qui permet au nouveau modèle de bénéficier des investissements en temps et en puissance de calcul qui ont été consacrés à la construction du modèle précédent, mais sans les coûts associés. DeepSeek a déclaré en janvier avoir utilisé le modèle d'IA open source Llama de Meta pour certaines versions distillées de ses propres modèles.

DeepSeek a déclaré dans Nature que les données d'entraînement de son modèle V3 reposaient sur des pages web explorées qui contenaient « un nombre important de réponses générées par le modèle OpenAI, ce qui peut conduire le modèle de base à acquérir indirectement des connaissances provenant d'autres modèles puissants ». Mais l'entreprise a précisé que cela n'était pas intentionnel, mais plutôt fortuit.

Nom : 2.jpg
Affichages : 12836
Taille : 43,0 Ko

Le pipeline multi-étapes de DeepSeek-R1

Les prouesses techniques de la startup chinoise DeepSeek ont forcé Microsoft à repenser son approche en matière d'IA. DeepSeek a montré qu'il est possible de développer des modèles d'IA de pointe à faible coût. Microsoft en a tiré des leçons et le PDG Satya Nadella a déclaré en mars dernier que DeepSeek est le nouveau « critère de réussite » de la firme de Redmond en matière d'IA. Satya Nadella a été impressionné par la manière dont une équipe de 200 personnes seulement a construit un produit d'IA qui est devenu l'application numéro un de l'App Store.

En outre, un défenseur de l’open source décrit DeepSeek en affirmant : « Ce n’est pas juste un modèle, c’est un mouvement ». Dans un climat où l’IA est dominée par des géants comme OpenAI, Google, et Anthropic, l’apparition de DeepSeek est perçue comme une réplique communautaire, radicalement différente par sa philosophie : ouverture, collaboration, transparence. Ce modèle, issu d’un projet chinois au départ peu connu, a rapidement attiré l’attention pour sa capacité à rivaliser avec les modèles propriétaires, tout en restant totalement ouvert.

Source : Article dans la revue scientifique Nature

Et vous ?

Pensez-vous que ce rapport est crédible ou pertinent ?

Quel est votre avis sur le sujet ?

Voir aussi :

SemiAnalysis affirme que DeepSeek a dépensé plus de 500 millions de dollars en puces Nvidia malgré les allégations au sujet d'une IA à bas prix, suscitant des interrogations sur la transparence de DeepSeek

DeepSeek échoue à tous les tests de sécurité : il est beaucoup plus facile de tromper DeepSeek pour qu'il fournisse des informations nuisibles que ses rivaux tels que ChatGPT, affirment les chercheurs de Cisco

Les modèles de langages coûtent 10 fois plus cher à développer dans certaines langues que dans d'autres, d'après l'analyse d'une chercheuse en IA

**Anthony** · 06/01/2026, 17h37

Jensen Huang, PDG de Nvidia, n'a que de l'admiration pour DeepSeek, la start-up chinoise d'IA qui a fait perdre près de 600 milliards de dollars à la valeur boursière de son entreprise en une seule journée

Jensen Huang, PDG de Nvidia, a publiquement fait l'éloge de DeepSeek, la start-up chinoise spécialisée dans l'intelligence artificielle (IA) dont le modèle de raisonnement à faible coût a déclenché un bouleversement historique du secteur technologique l'année dernière. S'exprimant lors du CES 2026 à Las Vegas, Huang a rendu hommage à DeepSeek pour avoir accéléré la transition mondiale vers l'IA open source, près d'un an après que son modèle R1 ait fait perdre près de 600 milliards de dollars à la valeur boursière de Nvidia, en une seule journée, et contraint les investisseurs à réévaluer la rentabilité du développement à grande échelle de l'IA.

Nvidia Corporation est une entreprise technologique américaine dont le siège social est situé à Santa Clara, en Californie. Fondée en 1993 par Jensen Huang, Chris Malachowsky et Curtis Priem, elle développe des processeurs graphiques (GPU), des systèmes sur puce (SoC) et des interfaces de programmation d'applications (API) pour la science des données, le calcul haute performance, les jeux vidéo et les applications mobiles et automobiles. Nvidia est considérée comme une entreprise de la Big Tech.

Jen-Hsun Huang, communément anglicisé sous le nom de Jensen Huang, est un homme d'affaires, ingénieur électricien et philanthrope taïwanais et américain, fondateur, président et directeur général (PDG) de Nvidia, la plus grande entreprise mondiale en termes de capitalisation boursière. En décembre 2025, Forbes estimait sa fortune à 152 milliards de dollars américains, ce qui fait de Jensen Huang la huitième personne la plus riche au monde.

Le PDG de Nvidia, Jensen Huang, n'a que de l'admiration pour DeepSeek, la start-up chinoise spécialisée dans l'IA qui a fait perdre près de 600 milliards de dollars à la valeur boursière de son entreprise en une seule journée en janvier 2025. S'exprimant lors du Consumer Electronics Show (CES) à Las Vegas le 5 janvier 2026, Jensen Huang a rendu hommage à DeepSeek pour avoir « activé » une transition mondiale vers l'IA open source, qualifiant le travail de l'entreprise de « vraiment très passionnant » et déclarant que Nvidia en était « très satisfaite ».

Ces éloges s'inscrivent dans un contexte marqué par l'irruption spectaculaire de DeepSeek sur la scène mondiale de l'IA. Grâce à son modèle R1 open source, développé à moindre coût, la start-up chinoise a mis fin au mythe du contrôle de l'IA par la Silicon Valley. Une avancée qui a soulevé des questions sur l'avenir du secteur dans son ensemble et a fait chuter la valeur de certaines des plus grandes entreprises mondiales.

La reconnaissance exprimée par le PDG de Nvidia intervient près d'un an après que le modèle R1 de DeepSeek ait semé la panique parmi les investisseurs en janvier 2025. La start-up chinoise affirmait avoir développé un modèle d'IA compétitif en utilisant seulement 2 048 anciennes puces H800 de Nvidia, pour un coût inférieur à 6 millions de dollars et en seulement deux mois. À titre de comparaison, les entreprises américaines dépensaient des dizaines de millions de dollars pour acquérir des milliers de puces Nvidia parmi les plus avancées afin d'obtenir des résultats similaires.

La nouvelle a déclenché un bain de sang à Wall Street. Le 27 janvier 2025, l'action Nvidia a chuté de 17 % et le fabricant de puces a perdu environ 593 milliards de dollars, une perte record en une seule journée pour une entreprise américaine. La vague de ventes s'est propagée dans tout le secteur technologique, les actions des fabricants de puces et des entreprises liées à l'IA s'effondrant, les investisseurs se demandant soudainement si les dépenses massives des géants de la technologie dans l'IA avaient encore un sens.

Jensen Huang affirme que DeepSeek a donné un coup d'accélérateur au mouvement open source

Jensen Huang a toujours défendu les réalisations de DeepSeek, arguant que le marché s'était trompé. Lors du CES 2026, il a réaffirmé cette position, déclarant que le modèle R1 de DeepSeek « avait surpris le monde entier » et contribuait à révolutionner le développement de l'IA à l'échelle mondiale.

« Nous avons assisté à l'avènement de DeepSeek R1, le premier modèle ouvert qui soit un système de raisonnement », a déclaré Jensen Huang à l'auditoire. Il a souligné que les modèles open source comblent rapidement leur retard en termes de performances par rapport aux modèles propriétaires « de pointe » d'entreprises telles qu'OpenAI et Google.

Jensen Huang a souligné que les développeurs chinois, soumis aux restrictions américaines sur les exportations de puces, avaient prouvé que les avancées en matière d'IA ne nécessitaient pas nécessairement des ressources informatiques illimitées. DeepSeek avait stocké des puces H800, une génération assez ancienne, avant l'interdiction d'exportation américaine de 2023, démontrant ainsi qu'une ingénierie intelligente pouvait compenser les limites matérielles.

Au lendemain du chaos qui a secoué les marchés en janvier dernier, Jensen Huang avait fait valoir que les modèles de raisonnement de DeepSeek nécessiteraient en réalité « 100 fois plus de puissance de calcul » que les IA sans raisonnement, laissant présager une augmentation de la demande en puces. Mais DeepSeek semble déterminé à prouver le contraire. La start-up a démarré l'année 2026 avec un article technique proposant de repenser l'architecture fondamentale de l'entraînement de l'IA, une méthode appelée « Manifold-Constrained Hyper-Connections » (hyperconnexions contraintes par manifold) visant à rendre les modèles encore plus rentables tout en suivant le rythme de ses concurrents américains mieux financés.

Nvidia mise gros sur les puces de nouvelle génération

Malgré les perturbations causées par DeepSeek, Nvidia reste optimiste quant à l'avenir de l'IA. Lors du CES, Jensen Huang a dévoilé la plateforme Vera Rubin de nouvelle génération de l'entreprise, qui, selon lui, offrirait une puissance de calcul cinq fois supérieure à celle des produits précédents et serait désormais en « pleine production ».

Les nouveaux serveurs phares contiendront 72 processeurs graphiques et 36 processeurs centraux, capables de se connecter à des « pods » équipés de plus de 1 000 puces Rubin. Jensen Huang a déclaré que la demande des clients chinois pour les puces H200 de Nvidia restait « forte », même si l'entreprise est soumise aux contrôles à l'exportation américains.

L'action Nvidia s'est largement remise de la chute de janvier, confirmant la vision à long terme de Jensen Huang selon laquelle les dépenses en infrastructures d'IA continueront d'augmenter, indépendamment des progrès réalisés en matière d'efficacité.

Alors que Jensen Huang fait l'éloge de DeepSeek, l’ascension de la start-up chinoise alimente un débat plus large sur l’avenir de l’intelligence artificielle. Pour certains défenseurs du logiciel libre, DeepSeek ne se limite pas à un simple LLM ; il s'apparente à un mouvement comparable à l’émergence de Linux face à Microsoft dans les années 1990. En contestant la domination des grands acteurs américains de l'IA, la philosophie d'ouverture, de collaboration et de transparence défendue par DeepSeek ravive les interrogations sur l'équilibre futur entre innovation ouverte et modèles propriétaires.

Source : Jensen Huang lors du Consumer Electronics Show à Las Vegas

Et vous ?

Quel est votre avis sur le sujet ?

Trouvez-vous la position de Jensen Huang concernant DeepSeek crédible ou pertinente ?

Voir aussi :

Le développeur chinois d'IA DeepSeek n'a dépensé que 294 000 dollars pour former son modèle R1, soit beaucoup moins que ce qui a été rapporté pour ses concurrents américains

« La Chine va remporter la course à l'IA » en raison de la réglementation excessive des USA, tandis que la Chine bénéficie de coûts moins élevés pour les développeurs locaux, a déclaré le PDG de Nvidia

L'adoption mondiale des modèles d'IA open source chinois a presque triplé, passant de 13 % à environ 30 % de l'utilisation totale en 2025, sous l'impulsion de DeepSeek et de Qwen d'Alibaba

DeepSeek V3.1 : la nouvelle IA chinoise offre des performances remarquables pour un coût 68 fois inférieur à celui de Claude 4 Opus, le modèle suscite un engouement massif dans le sillage du fiasco GPT-5

**Alex** · 02/03/2026, 10h52

DeepSeek, la start-up chinoise spécialisée dans l'IA qui a fait perdre près de 600 milliards $ à Nvidia en une seule journée avec le lancement de son modèle R1, s'apprête à dévoiler son prochain modèle d'IA

DeepSeek s'apprêterait à dévoiler son prochain modèle d'IA. Selon un article du Financial Times, la société se prépare à lancer son prochain modèle majeur, le V4. Contrairement aux versions précédentes, V4 devrait être « multimodal », ce qui signifie qu'il ne se contentera pas de traiter du texte, mais qu'il sera également capable de comprendre et de générer des images et des vidéos, à l'instar de Google Gemini 3.0. DeepSeek aurait optimisé V4 pour qu'il fonctionne sur du matériel fabriqué en Chine par des entreprises telles que Huawei et Cambricon.

DeepSeek est une entreprise chinoise spécialisée dans l'intelligence artificielle (IA) qui développe des grands modèles de langage (LLM). DeepSeek a été fondée en juillet 2023 et en a lancé un chatbot éponyme parallèlement à son modèle DeepSeek-R1 janvier 2025. Publié sous licence MIT, DeepSeek-R1 fournit des réponses comparables à celles d'autres modèle, tels que GPT-4 et o1 d'OpenAI. Son coût de formation serait nettement inférieur à celui des autres LLM. La société affirme avoir formé son modèle V3 pour 6 millions de dollars, soit bien moins que les 100 millions de dollars qu'a coûté le GPT-4 d'OpenAI en 2023, et en utilisant environ un dixième de la puissance de calcul consommée par le modèle comparable de Meta, Llama 3.1.

L’apparition de DeepSeek a fait voler en éclats le mythe d’un monopole technologique américain sur l’intelligence artificielle. En moins de deux ans, cette entreprise chinoise a réussi à réduire considérablement l’écart qui la séparait des géants américains de l’IA, notamment grâce à une stratégie open source audacieuse. DeepSeek est devenue l'application gratuite la plus téléchargée aux États-Unis une semaine seulement après son lancement.

L'émergence de l'application chinoise d'intelligence artificielle DeepSeek a choqué les marchés financiers, le cours de l'action Nvidia a fortement chuté, perdant 600 milliards de dollars américains en valeur boursière, ce qui représente la plus forte baisse jamais enregistrée pour une seule entreprise dans l'histoire du marché boursier américain. Le président américain Donald Trump a même qualifié de « signal d'alarme » pour l'industrie technologique américaine le succès de DeepSeek.

Récemment, un rapport a révélé que DeepSeek s'apprêterait à dévoiler son prochain modèle d'IA. Selon un article du Financial Times, la société se prépare à lancer son prochain modèle majeur, le V4. L'article indique que cette sortie marque un moment crucial pour l'industrie technologique chinoise, qui tente de prouver une fois de plus qu'elle peut rivaliser avec les géants américains malgré les restrictions strictes imposées par les États-Unis sur les puces informatiques haut de gamme.

Nom : 1.jpg
Affichages : 40168
Taille : 22,4 Ko

Contrairement aux versions précédentes, V4 devrait être « multimodal », ce qui signifie qu'il ne se contentera pas de traiter du texte, mais qu'il sera également capable de comprendre et de générer des images et des vidéos, à l'instar de Google Gemini 3.0. Il s'agit de la première initiative majeure de DeepSeek depuis janvier 2025, lorsque son modèle « R1 » avait surpris le monde entier. La raison en était l'affirmation de DeepSeek selon laquelle il avait construit une IA aussi intelligente que les meilleurs modèles de la Silicon Valley, mais en utilisant seulement une infime partie de la puissance et du coût.

Cette affirmation a semé la panique parmi les investisseurs, qui craignaient que les puces coûteuses de Nvidia ne soient plus le seul moyen de construire une IA puissante, ce qui a fait chuter les actions de Nvidia. En outre, un défenseur de l’open source a décrit DeepSeek : « Ce n’est pas juste un modèle, c’est un mouvement ». Dans un climat où l’IA est dominée par des géants comme OpenAI, Google, et Anthropic, l’apparition de DeepSeek est perçue comme une réplique communautaire, radicalement différente par sa philosophie : ouverture, collaboration, transparence.

DeepSeek aurait optimisé V4 pour qu'il fonctionne sur du matériel fabriqué en Chine par des entreprises telles que Huawei et Cambricon, alors même que les géants américains s'appuient sur les puces Nvidia, un scénario quelque peu similaire. En utilisant des puces locales, DeepSeek contourne les contrôles à l'exportation américains qui empêchent la Chine d'acheter les derniers processeurs Nvidia et AMD, une initiative qui devrait accélérer la transition de la Chine vers l'abandon des technologies occidentales pour l'« inférence », le processus par lequel une IA génère une réponse pour un utilisateur.

L'ascension de DeepSeek n'a pas été sans heurts. La société américaine d'IA Anthropic a récemment accusé DeepSeek de « distillation attacks », une pratique consistant pour une entreprise à utiliser les réponses d'une IA plus avancée (comme Claude d'Anthropic) pour « enseigner » à son propre modèle, plus petit, comment se comporter. Le rapport souligne également que, alors que DeepSeek était auparavant salué pour son « ouverture » et le partage de ses techniques d'ingénierie secrètes, il devrait se montrer plus prudent cette fois-ci, ne publiant qu'une brève note technique à l'occasion du lancement de la version V4.

Source : The Financial Times

Et vous ?

Pensez-vous que ce rapport est crédible ou pertinent ?

Quel est votre avis sur le sujet ?

Voir aussi :

DeepSeek-v3.2 : la nouvelle IA chinoise repousse les limites des LLM open source et rivalise avec les modèles de pointe américains GPT-5 d'OpenAI et de Gemini-3 Pro de Google, sur les benchmarks de références

L'adoption mondiale des modèles d'IA open source chinois a presque triplé, passant de 13 % à environ 30 % de l'utilisation totale en 2025, sous l'impulsion de DeepSeek et de Qwen d'Alibaba

Anthropic accuse DeepSeek et d'autres laboratoires chinois d'IA d'utiliser Claude pour extraire illicitement les capacités de Claude afin d'améliorer leurs propres modèles à l'aide de 24 000 comptes frauduleux

**Ryu2000** · 04/03/2026, 10h22

Envoyé par Alex

Quel est votre avis sur le sujet ?

Aujourd'hui des entreprises chinoises sont capables d'innover plus rapidement et pour moins cher que les entreprises US.

Il est possible que des entreprises chinoises finissent par proposer des composants avec un meilleur rapport qualité/prix que ceux d'AMD, d'Intel et d'Nvidia.
Et il est possible que des modèles IA chinois dépassent les modèles US.
Ce qui serait très bien pour les consommateurs.

**floyer** · 04/03/2026, 18h58

On a aussi des pistes chinoises pour des processeurs plus efficaces… s’ils sont plus efficaces côté hardware et software, les américains auront des soucis à se faire.

https://www.lesnumeriques.com/cpu-pr...e-n244691.html

Il peut rester un créneau avec des IA comme Claude qui sont plus « intelligents » (dernièrement j’ai lu qu’elle avait résolu une conjecture ouverte de D.Knuth).

DeepSeek, la start-up chinoise spécialisée dans l'IA, s'apprête à dévoiler son prochain modèle d'IA

Intelligence artificielle

Vue hybride

Discussions similaires

Partager

Partager