IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Intelligence artificielle Discussion :

La start-up chinoise DeepSeek, spécialisée dans l'IA, a lancé R1-0528


Sujet :

Intelligence artificielle

  1. #1
    Communiqués de presse

    Femme Profil pro
    Traductrice Technique
    Inscrit en
    Juin 2023
    Messages
    2 309
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Localisation : France

    Informations professionnelles :
    Activité : Traductrice Technique

    Informations forums :
    Inscription : Juin 2023
    Messages : 2 309
    Par défaut La start-up chinoise DeepSeek, spécialisée dans l'IA, a lancé R1-0528
    La start-up chinoise DeepSeek, spécialisée dans l'IA, a lancé R1-0528, un modèle doté d'une meilleure capacité de raisonnement et d'une meilleure gestion des tâches complexes

    DeepSeek publie une mise à jour de son modèle de raisonnement R1, dont les performances se rapprochent de celles d'o3 d'OpenAI et de Gemini 2.5 Pro de Google. Le succès mondial du modèle R1 en janvier a fait chuter les actions technologiques en dehors de la Chine. L'intelligence artificielle de DeepSeek est saluée pour ses performances et son coût inférieur à celui de ses concurrents américains. La mise à jour réduit le nombre de résultats erronés et améliore le raisonnement complexe.

    L’apparition de DeepSeek a fait voler en éclats le mythe d’un monopole technologique américain sur l’intelligence artificielle. En moins de deux ans, cette entreprise chinoise a réussi à réduire considérablement l’écart qui la séparait des géants américains de l’IA, notamment grâce à une stratégie open source audacieuse. DeepSeek est devenue l'application gratuite la plus téléchargée aux États-Unis une semaine seulement après son lancement.

    L'émergence de l'application chinoise d'intelligence artificielle DeepSeek a choqué les marchés financiers et incité le président américain Donald Trump à la qualifier de « signal d'alarme » pour l'industrie technologique américaine. L'affirmation de DeepSeek selon laquelle son modèle d'intelligence artificielle R1 a été fabriqué pour une fraction du coût de ses concurrents a soulevé des questions sur l'avenir de l'ensemble du secteur et a fait chuter la valeur de certaines des plus grandes entreprises du monde.

    Récemment, la start-up chinoise DeepSeek, spécialisée dans l'intelligence artificielle, a publié la première mise à jour de son modèle de raisonnement R1, qui connaît un grand succès, intensifiant ainsi la concurrence avec ses rivaux américains tels qu'OpenAI. DeepSeek a déclaré via la plateforme de développement Hugging Face que R1-0528 était une mise à jour mineure de R1 qui améliorait néanmoins considérablement sa profondeur de raisonnement et ses capacités d'inférence, notamment en améliorant la gestion des tâches complexes, ce qui rapproche ses performances des modèles de raisonnement o3 d'OpenAI et de Gemini 2.5 Pro de Google.

    Pour rappel, le lancement de R1 en janvier a fait le buzz dans le monde entier, a fait chuter les actions technologiques hors de Chine et a remis en question l'idée selon laquelle le développement de l'IA nécessite une puissance de calcul et des investissements considérables. Depuis la sortie de R1, des géants technologiques chinois tels qu'Alibaba et Tencent ont lancé des modèles prétendant surpasser ceux de DeepSeek.

    Nom : 1.jpg
Affichages : 17185
Taille : 61,8 Ko

    La mise à jour récente était initialement peu détaillée, contrairement au lancement de R1 en janvier, qui était accompagné d'un article universitaire rédigé par plusieurs auteurs que la communauté mondiale de l'IA a analysé pour comprendre les stratégies de l'entreprise. L'entreprise basée à Hangzhou a déclaré plus tard dans un court message sur X que R1-0528 offrait des performances améliorées. Dans un message plus long publié sur WeChat, DeepSeek a déclaré que le taux d'« hallucinations », c'est-à-dire les résultats faux ou trompeurs, avait été réduit d'environ 45 à 50 % dans des scénarios tels que la réécriture et la synthèse.

    Elle a ajouté que la mise à jour lui permettait également d'écrire de manière créative des essais, des romans et d'autres genres, et qu'elle avait amélioré ses capacités dans des domaines tels que la génération de code front-end et les jeux de rôle. "Le modèle a démontré des performances exceptionnelles dans diverses évaluations de référence, notamment en mathématiques, en programmation et en logique générale", a déclaré DeepSeek.

    Nom : 2.jpg
Affichages : 2652
Taille : 57,6 Ko

    Le succès de DeepSeek a bouleversé la croyance selon laquelle les contrôles à l'exportation américains freinaient les progrès de la Chine en matière d'IA, après avoir lancé des modèles d'IA équivalents ou supérieurs aux modèles leaders du secteur aux États-Unis, pour un coût nettement inférieur. La start-up a ajouté qu'une variante de sa mise à jour avait été créée en reprenant le processus de raisonnement utilisé par le modèle R1-0528, afin d'améliorer encore le modèle Qwen 3 8B Base du géant technologique chinois Alibaba, un processus connu sous le nom de distillation. Le résultat a été une performance surpassant de plus de 10 % celle du modèle Qwen 3 original.

    "Nous pensons que la chaîne de pensée de DeepSeek-R1-0528 revêtira une importance considérable tant pour la recherche universitaire sur les modèles de raisonnement que pour le développement industriel axé sur les modèles à petite échelle", a ajouté DeepSeek. Un autre rapport a révélé qu'un représentant de DeepSeek aurait déclaré à un groupe WeChat que la société avait achevé ce qu'elle a qualifié de « mise à niveau d'essai mineure » et que les utilisateurs pouvaient commencer à la tester.

    Nom : 3.jpg
Affichages : 2646
Taille : 34,6 Ko

    Citation Envoyé par DeepSeek
    Le modèle DeepSeek R1 a fait l'objet d'une mise à jour mineure, la version actuelle étant DeepSeek-R1-0528. Dans la dernière mise à jour, DeepSeek R1 a considérablement amélioré ses capacités de raisonnement et d'inférence en tirant parti de ressources informatiques accrues et en introduisant des mécanismes d'optimisation algorithmique pendant la post-formation. Le modèle a démontré des performances exceptionnelles dans diverses évaluations de référence, notamment en mathématiques, en programmation et en logique générale. Ses performances globales se rapprochent désormais de celles des modèles leaders, tels que O3 et Gemini 2.5 Pro.

    Par rapport à la version précédente, le modèle mis à jour présente des améliorations significatives dans le traitement des tâches de raisonnement complexes. Par exemple, dans le test AIME 2025, la précision du modèle est passée de 70 % dans la version précédente à 87,5 % dans la version actuelle. Cette avancée résulte d'une profondeur de réflexion accrue pendant le processus de raisonnement : dans le test AIME, le modèle précédent utilisait en moyenne 12 000 tokens par question, tandis que la nouvelle version en utilise en moyenne 23 000.

    Au-delà de ses capacités de raisonnement améliorées, cette version offre également un taux d'hallucination réduit, une prise en charge améliorée des appels de fonction et une meilleure expérience pour le vibe coding.

    En réponse à la concurrence de Deepseek, Gemini de Google a introduit des niveaux d'accès à prix réduit, tandis qu'OpenAI a baissé ses prix et lancé un modèle o3 Mini qui nécessite moins de puissance de calcul. Deepseek devrait toujours lancer R2, le successeur de R1. La sortie de R2 était initialement prévue pour mai. DeepSeek a également publié une mise à niveau de son grand modèle de langage V3 en mars.

    Dans un climat où l’IA est dominée par des géants comme OpenAI, Google, et Anthropic, l’apparition de DeepSeek est perçue comme une réplique communautaire, radicalement différente par sa philosophie : ouverture, collaboration, transparence. Un défenseur de l’open source avait même affirmé que DeepSeek est plus qu'un LLM : "Ce n’est pas juste un modèle, c’est un mouvement". Sa montée en puissance ravive les mémoires d’une autre révolution numérique : celle du système d’exploitation Linux, qui, dans les années 90, a défié l’hégémonie de Microsoft avec un écosystème construit par une armée mondiale de volontaires.

    Cependant, la fiabilité de DeepSeek a été remis en question de nombreuses fois. Un rapport du Congrès américain a notamment estimé que DeepSeek représente une "menace profonde" pour la sécurité nationale les États-Unis. Selon le rapport, DeepSeek siphonne les données des Américains pour le compte de Pékin et s'appuie sur des "technologies américaines volées". Le rapport affirme notamment : "DeepSeek n'est pas une simple application d'IA. C'est une arme dans l'arsenal du Parti communiste chinois, conçue pour espionner les Américains, voler notre technologie et subvertir la loi américaine".


    Source : DeepSeek

    Et vous ?

    Pensez-vous que cette mise à jour est crédible ou pertinente ?
    Quel est votre avis sur le sujet ?

    Voir aussi :

    DeepSeek échoue à tous les tests de sécurité : il est beaucoup plus facile de tromper DeepSeek pour qu'il fournisse des informations nuisibles que ses rivaux tels que ChatGPT, affirment les chercheurs de Cisco


    Les entreprises d'IA s'inspirent de l'exemple de DeepSeek et créent des modèles performants et moins coûteux grâce à la « distillation », mais les experts préviennent qu'ils sont plus limités

    OpenAI qualifie la startup chinoise DeepSeek d'entreprise « contrôlée par l'État » et demande à la Maison Blanche l'interdiction des modèles d'IA « produits en Chine »
    Publication de communiqués de presse en informatique. Contribuez au club : corrections, suggestions, critiques, ... Contactez le service news et Rédigez des actualités

  2. #2
    Membre confirmé
    Homme Profil pro
    amateur
    Inscrit en
    Juillet 2015
    Messages
    106
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Var (Provence Alpes Côte d'Azur)

    Informations professionnelles :
    Activité : amateur

    Informations forums :
    Inscription : Juillet 2015
    Messages : 106
    Par défaut
    Un rapport du Congrès américain a notamment estimé que DeepSeek représente une "menace profonde" pour la sécurité nationale les États-Unis. Selon le rapport, DeepSeek siphonne les données des Américains pour le compte de Pékin et s'appuie sur des "technologies américaines volées". Le rapport affirme notamment : "DeepSeek n'est pas une simple application d'IA. C'est une arme dans l'arsenal du Parti communiste chinois, conçue pour espionner les Américains, voler notre technologie et subvertir la loi américaine".
    Oui, je n'ai aucun doute que DeepSeek , à l'instar des OpenAI, Gemini et consort, siphonne à tout va. Puisque par principe l'IA repose sur ça.
    Mais deux commentaires:
    • L' hopital se fout de la charité: qui siphonne le plus actuellement? Ou bien les membres du congrès croyaient réellement que l'avance technologique des USA est de plusieurs décennies?
    • La phraséologie utilisée par le congrès est hilarante: elle copie en tout points les formulations/la phraséologie d'autres régimes (que je ne citerai pas)

    lol

Discussions similaires

  1. Réponses: 1
    Dernier message: 20/06/2024, 13h56
  2. Réponses: 42
    Dernier message: 03/05/2018, 18h06
  3. Réponses: 84
    Dernier message: 04/09/2009, 09h07
  4. Réponses: 0
    Dernier message: 31/10/2008, 10h53
  5. Réponses: 3
    Dernier message: 10/05/2006, 18h40

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo