IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Intelligence artificielle Discussion :

Quelle est la meilleure option pour les entreprises : des services d'IA libres ou commerciaux ?


Sujet :

Intelligence artificielle

  1. #1
    Communiqués de presse

    Femme Profil pro
    Rédacteur technique
    Inscrit en
    Mai 2018
    Messages
    2 135
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 34
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Rédacteur technique
    Secteur : Communication - Médias

    Informations forums :
    Inscription : Mai 2018
    Messages : 2 135
    Par défaut Quelle est la meilleure option pour les entreprises : des services d'IA libres ou commerciaux ?
    Meta met à disposition son modèle d'intelligence artificielle et de langage étendu, Llama 2, pour une utilisation commerciale par le biais de partenariats avec Microsoft

    Meta ouvre la technologie des chatbots à l'utilisation commerciale par l'intermédiaire de Microsoft, et ne prévoit pas de faire payer son outil d'IA générative Llama 2. Les entreprises proposant Llama 2 incluent Amazon, Hugging Face.

    Meta Platforms Inc. met à disposition son modèle d'intelligence artificielle en langage large, Llama 2, pour une utilisation commerciale par le biais de partenariats avec les principaux fournisseurs de services en cloud, y compris Microsoft Corp. Meta ne fait pas payer l'accès ou l'utilisation du modèle qu'elle a développé, a déclaré la société. Au contraire, en ouvrant la technologie à d'autres entreprises, Meta affirme qu'elle bénéficiera des améliorations qui pourront être apportées lorsque davantage de développeurs l'utiliseront, la soumettront à des tests de résistance et identifieront les problèmes qu'elle pose.

    En rendant le grand modèle linguistique (LLM) plus largement accessible, Meta s'impose aux côtés d'autres géants de la technologie comme un acteur clé de la course à l'armement en matière d'IA. Meta consacre des sommes record à l'infrastructure de l'IA et son directeur général, Mark Zuckerberg, a déclaré que l'intégration des améliorations de l'IA dans tous les produits et algorithmes de l'entreprise était une priorité.

    Meta a pris en charge le coût de la formation des modèles. Des fournisseurs de services en nuage, dont Microsoft, Amazon.com Inc. et Hugging Face, hébergent les outils et fournissent la puissance informatique nécessaire à leur fonctionnement.

    Meta a déclaré qu'elle n'avait aucun commentaire à faire sur la question de savoir si Microsoft ferait payer l'accès à Llama 2 via ses services en nuage et sous Windows. Un porte-parole d'Amazon a déclaré que la société ne facturait pas l'accès au modèle et que les clients ne payaient que pour l'utilisation de SageMaker, son kit d'outils pour les développeurs d'apprentissage automatique. Microsoft et Hugging Face n'ont pas répondu immédiatement aux demandes de commentaires.

    Nom : meta-and-microsoft-sign-partnership-to-make-llama-2-available-on-azure-760x428.png
Affichages : 2765
Taille : 26,8 Ko

    Le lancement commercial de Llama 2 est le premier projet issu du groupe d'IA générative de l'entreprise, une nouvelle équipe constituée en février. Pour préparer le lancement du nouveau modèle, les employés de Meta et des tiers ont effectué des tests de sécurité appelés "exercices en équipe rouge". Il s'agit d'un modèle distinct de celui que Meta utilise pour ses propres produits.

    "Le rythme a été incroyable - une prise de décision incroyablement rapide, des boucles très serrées, une exécution très ciblée pour aboutir à ce moment Llama 2", a déclaré Ahmad Al Dahle, vice-président du groupe d'IA générative de Meta. "Nous avons reçu plus de cent mille demandes pour le Llama 1. Nous sommes donc retournés à la planche à dessin, nous avons réuni nos équipes et nous avons fait une tonne d'investissements dans l'alignement, la recherche et la sécurité afin de construire un modèle que nous estimions prêt."

    Ce partenariat rapproche Meta de Microsoft, qui s'est imposé grâce à son investissement et à son partenariat technologique avec OpenAI, le créateur de ChatGPT, qui fait payer l'accès à son modèle.

    Source : Microsoft

    Et vous ?

    Que pensez-vous de ce partenariat ?

    Voir aussi :

    La startup Cerebras publie Cerebras-GPT, une famille de modèles linguistiques de type ChatGPT en open-source, les sept modèles GPT-3 établissent des records de précision et d'efficacité de calcul

    Guidance, un langage pour le contrôle des grands modèles linguistiques modernes, il serait plus efficace et plus efficient que l'invite ou le chaînage traditionnel
    Publication de communiqués de presse en informatique. Contribuez au club : corrections, suggestions, critiques, ... Contactez le service news et Rédigez des actualités

  2. #2
    Chroniqueur Actualités

    Homme Profil pro
    Administrateur de base de données
    Inscrit en
    Mars 2013
    Messages
    9 393
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Canada

    Informations professionnelles :
    Activité : Administrateur de base de données

    Informations forums :
    Inscription : Mars 2013
    Messages : 9 393
    Par défaut Meta s'associe à Microsoft et lance en open-source LLaMA 2 pour faire concurrence à chatGPT d'OpenAI
    Meta s'associe à Microsoft et lance en open-source LLaMA 2 pour faire concurrence à chatGPT d'OpenAI,
    l'entreprise pourrait vouloir diluer l'avantage concurrentiel de ses rivaux

    Meta de Mark Zuckerberg a publié cette semaine une version open-source d'un modèle d'intelligence artificielle, Llama 2, à usage public. Le modèle de grande langage (LLM), qui peut être utilisé pour créer un chatbot de type ChatGPT, est disponible pour les startups, les entreprises établies et les opérateurs isolés. Mais pourquoi Meta fait-il cela et quels sont les risques potentiels impliqués ?

    Meta, en partenariat avec Microsoft, a annoncé la mise en open-source de son grand modèle de langage LLaMA 2. Le modèle sera disponible pour une utilisation commerciale et de recherche, le mettant en concurrence directe avec le GPT-4 d'OpenAI, qui alimente des outils comme ChatGPT et Microsoft Bing.

    La décision d'ouvrir LLaMA 2 a été révélée lors de l'événement Inspire de Microsoft, soulignant le partenariat croissant entre Meta et Microsoft. Meta a également exprimé son soutien à Azure et Windows. De plus, Qualcomm a dévoilé sa collaboration avec Meta pour apporter LLaMa aux ordinateurs portables, téléphones et casques d'ici 2024. Ce partenariat vise à développer des applications alimentées par l'IA qui fonctionnent sans dépendre des services cloud.

    Meta a déclaré qu'il s'engage à le « construire de manière responsable » à mesure qu'il progresse avec son système d'IA. La société a déclaré que la sécurité de ses modèles avait été testée en « générant des invites contradictoires pour faciliter le réglage fin du modèle », à la fois en interne et en externe. Meta révèle également comment les modèles sont évalués et modifiés.

    Le communiqué de presse de Meta indique que la décision de fournir LLaMA en open source vise à fournir aux entreprises, aux startups et aux chercheurs un accès à davantage d'outils d'IA. L'objectif est d'encourager l'expérimentation au sein de la communauté d'IA.

    Qu'est-ce que LLaMA 2 et en quoi est-il important ?

    LLaMA 2 (pour Large Language Model with Attention 2) est un modèle d'IA génératif qui peut produire des textes en langage naturel en fonction d'une entrée ou d'une invite donnée. Il peut être utilisé pour diverses applications telles que les chatbots, la création de contenu, la synthèse, la traduction, etc. LLaMA 2 est la deuxième version du LLM de Meta, qui a été publié pour la première fois en février 2023. Selon Meta, LLaMA 2 a été formé sur 40 % de données en plus que LLaMA 1, qui comprend des informations provenant de « sources de données en ligne accessibles au public ». Il affirme également qu'il « surclasse » d'autres LLM comme Falcon et MPT en ce qui concerne les tests de raisonnement, de codage, de compétence et de connaissances.

    Meta a décidé de rendre LLaMA 2 disponible gratuitement via la plate-forme Azure de Microsoft, ainsi que d'autres fournisseurs tels qu'AWS, Hugging Face et le téléchargement direct. Meta a déclaré qu'il souhaitait donner aux entreprises, aux startups et aux chercheurs un accès à davantage d'outils d'IA, permettant l'expérimentation et l'innovation en tant que communauté.

    Nom : benchmark.png
Affichages : 4516
Taille : 171,9 Ko

    Que fait un LLM open source ?

    Les LLM sous-tendent les outils d'IA tels que les chatbots. Ils sont formés sur de vastes ensembles de données qui leur permettent d'imiter le langage humain et même le codage informatique. Si un LLM est rendu open-source, cela signifie que son contenu est mis gratuitement à la disposition des personnes pour qu'elles puissent y accéder, l'utiliser et l'adapter à leurs propres fins.

    Llama 2 est disponible en trois versions, dont une qui peut être intégrée à un chatbot IA. L'idée est que les startups ou les entreprises établies peuvent accéder aux modèles Llama 2 et les bricoler pour créer leurs propres produits, y compris, potentiellement, des rivaux de ChatGPT ou du chatbot Bard de Google - bien que de l'aveu même de Meta, Llama 2 ne soit pas tout à fait au niveau de GPT- 4, le LLM derrière ChatGPT d'OpenAI.

    Pourquoi Meta le publie-t-il pour un usage public ?

    Nick Clegg, président des affaires mondiales de Meta, a déclaré mercredi à l'émission Today de BBC Radio 4 que rendre les LLM open source les rendrait « plus sûrs et meilleurs » en invitant à un examen extérieur.

    « Avec la… sagesse des foules, vous rendez ces systèmes plus sûrs et meilleurs et, surtout, vous les sortez des… mains moites des grandes entreprises technologiques qui sont actuellement les seules entreprises à disposer soit de la puissance de calcul, soit des vastes réservoirs de données pour construire ces modèles en premier lieu ».

    Il est également possible qu'en donnant à tous les arrivants la possibilité de lancer un rival pour ChatGPT, Bard ou le chatbot Bing de Microsoft, Meta dilue potentiellement l'avantage concurrentiel de pairs technologiques tels que Google.

    Meta a admis que Llama 2 « est en retard » sur GPT-4, mais c'est néanmoins un concurrent libre d'OpenAI.

    Bien que Microsoft est l'un des principaux bailleurs de fonds d'OpenAI, il soutient tout de même le lancement de Llama 2. Le LLM est disponible en téléchargement via les plateformes Microsoft Azure, Amazon Web Services et Hugging Face.

    Nom : llama.png
Affichages : 1945
Taille : 315,6 Ko

    La parole est à Meta

    Les récentes percées dans le domaine de l'IA, et de l'IA générative en particulier, ont captivé l'imagination du public et démontré ce que ceux qui développent ces technologies savaient depuis longtemps*: elles ont le potentiel d'aider les gens à faire des choses incroyables, de créer une nouvelle ère d'opportunités économiques et sociales et de donner les particuliers, les créateurs et les entreprises de nouvelles façons de s'exprimer et de se connecter avec les gens.

    Nous pensons qu'une approche open source est la bonne pour le développement des modèles d'IA d'aujourd'hui, en particulier ceux de l'espace génératif où la technologie progresse rapidement. En rendant les modèles d'IA disponibles ouvertement, ils peuvent profiter à tout le monde. Donner aux entreprises, aux startups, aux entrepreneurs et aux chercheurs l'accès à des outils développés à une échelle qu'il serait difficile de construire eux-mêmes, soutenus par une puissance de calcul à laquelle ils n'auraient peut-être pas accès autrement, leur ouvrira un monde d'opportunités pour expérimenter et innover de manière passionnante et en fin de compte bénéficier économiquement et socialement.

    Et nous pensons que c'est plus sûr. L'ouverture de l'accès aux modèles d'IA d'aujourd'hui signifie qu'une génération de développeurs et de chercheurs peut les tester, identifier et résoudre rapidement les problèmes, en tant que communauté. En voyant comment ces outils sont utilisés par d'autres, nos propres équipes peuvent en tirer des enseignements, améliorer ces outils et corriger les vulnérabilités.

    Nom : hacker.png
Affichages : 1982
Taille : 224,7 Ko

    Meta a placé la recherche exploratoire, l'open source et la collaboration avec des partenaires universitaires et industriels au cœur de nos efforts en matière d'IA depuis plus d'une décennie. Nous avons vu de première main comment l'innovation open source peut conduire à des technologies qui profitent à plus de gens. Des dizaines de grands modèles de langage ont déjà été publiés et font progresser les développeurs et les chercheurs. Ils sont utilisés par les entreprises comme ingrédients de base pour de nouvelles expériences génératives basées sur l'IA. Nous avons été époustouflés par l'énorme demande de Llama 1 de la part des chercheurs - avec plus de 100 000 demandes d'accès au grand modèle de langage - et les choses incroyables qu'ils ont réalisées en s'appuyant sur celui-ci.

    Nous sommes maintenant prêts à ouvrir la prochaine version de Llama 2 et la rendons disponible gratuitement pour la recherche et l'utilisation commerciale. Nous incluons également les poids du modèle et le code de démarrage pour le modèle pré-entraîné et les versions conversationnelles affinées. Comme Satya Nadella l'a annoncé sur scène à Microsoft Inspire, nous portons notre partenariat au niveau supérieur avec Microsoft en tant que partenaire privilégié pour Llama 2 et élargissons nos efforts dans l'IA générative. À partir d'aujourd'hui, Llama 2 est disponible dans le catalogue de modèles Azure AI, permettant aux développeurs utilisant Microsoft Azure de créer avec lui et d'exploiter leurs outils cloud natifs pour le filtrage de contenu et les fonctionnalités de sécurité. Il est également optimisé pour s'exécuter localement sur Windows, offrant aux développeurs un flux de travail transparent car ils offrent des expériences d'IA génératives aux clients sur différentes plates-formes. Llama 2 est également disponible via Amazon Web Services (AWS), Hugging Face et d'autres fournisseurs.

    Les particuliers et les entreprises ont bénéficié du partenariat de longue date entre Microsoft et Meta. Ensemble, nous avons introduit un écosystème ouvert pour les cadres d'IA interchangeables, et nous avons co-écrit des articles de recherche pour faire progresser l'état de l'art en matière d'IA. Nous avons collaboré pour étendre l'adoption de PyTorch - le principal framework d'IA d'aujourd'hui créé par Meta et la communauté de l'IA - sur Azure, et nous sommes parmi les membres fondateurs de la Fondation PyTorch. Microsoft et Meta ont récemment rejoint une cohorte de partisans qui approuvent le cadre du Partenariat sur l'IA pour une action collective dans la création et le partage de médias synthétiques. Notre partenariat s'étend en dehors de l'IA et dans le métavers également pour offrir des expériences immersives pour l'avenir du travail et des loisirs.

    Désormais, avec ce partenariat élargi, Microsoft et Meta soutiennent une approche open source pour fournir un accès accru aux technologies d'IA fondamentales au profit des entreprises du monde entier. Il n'y a pas que Meta et Microsoft qui croient en la démocratisation de l'accès aux modèles d'IA d'aujourd'hui. Nous avons un large éventail de partisans divers à travers le monde qui croient également en cette approche - y compris des entreprises qui nous ont fait part de leurs premiers commentaires et qui sont ravies de créer de nouveaux produits avec Llama 2, des fournisseurs de cloud qui incluront Llama 2 dans leurs offres pour les clients, les institutions de recherche qui collaborent avec nous sur le déploiement sûr et responsable de grands modèles génératifs, et les personnes de la technologie, du milieu universitaire et de la politique qui voient les avantages comme nous.

    Sources : Meta (1, 2)

    Et vous ?

    Que pensez-vous de la décision de Meta de rendre open source son modèle de langage LLaMA 2 ?
    Avez-vous déjà utilisé ou testé LLaMA 2 ou un autre modèle de langage comme GPT-4 ou ChatGPT ? Si oui, quelle a été votre expérience ?
    Quelles sont les applications potentielles de LLaMA 2 qui vous intéressent le plus ? Quels sont les domaines ou les problèmes que vous aimeriez résoudre avec LLaMA 2 ?
    Quels sont les risques ou les défis liés à l’utilisation de modèles de langage comme LLaMA 2 ? Comment peut-on assurer la sécurité, l’éthique et la responsabilité de ces modèles ?
    Quelle est votre opinion sur le rôle des grandes entreprises technologiques comme Meta, OpenAI et Microsoft dans le développement et la diffusion de l’IA ? Pensez-vous qu’elles devraient collaborer ou se concurrencer ?
    Contribuez au club : Corrections, suggestions, critiques, ... : Contactez le service news et Rédigez des actualités

  3. #3
    Membre éclairé

    Profil pro
    Chef de Projet / Développeur
    Inscrit en
    Juin 2002
    Messages
    616
    Détails du profil
    Informations personnelles :
    Localisation : France, Loire Atlantique (Pays de la Loire)

    Informations professionnelles :
    Activité : Chef de Projet / Développeur
    Secteur : Santé

    Informations forums :
    Inscription : Juin 2002
    Messages : 616
    Par défaut
    Après avoir investit 10 milliards de dollars dans OpenAI, j'ai un peu de mal à comprendre ce soutient de Microsoft au projet Meta.

  4. #4
    Membre Expert
    Homme Profil pro
    Développeur .NET
    Inscrit en
    Novembre 2009
    Messages
    2 056
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 36
    Localisation : France, Bouches du Rhône (Provence Alpes Côte d'Azur)

    Informations professionnelles :
    Activité : Développeur .NET

    Informations forums :
    Inscription : Novembre 2009
    Messages : 2 056
    Par défaut
    Citation Envoyé par vanquish Voir le message
    Après avoir investit 10 milliards de dollars dans OpenAI, j'ai un peu de mal à comprendre ce soutient de Microsoft au projet Meta.
    C'est du Azure qu'ils vendent derrière.
    A priori ce modèle ne va pas faire concurrence a gpt-X.
    Et si jamais ça le devient ils sont bien positionné.

  5. #5
    Membre très actif
    Profil pro
    Inscrit en
    Septembre 2012
    Messages
    199
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Septembre 2012
    Messages : 199
    Par défaut
    Citation Envoyé par vanquish Voir le message
    Après avoir investit 10 milliards de dollars dans OpenAI, j'ai un peu de mal à comprendre ce soutient de Microsoft au projet Meta.
    Si MS a investit 10 M$ dans OpenAI c'est pour le mettre en confiance. Les ingénieurs en IA de MS ont un accès privilégié au code de ChatGPT.x et de DALL-E. Et s'il ne comprennent pas tout, ils peuvent demander des explications aux ingénieurs d'OpenAI qui leur répondent avec le sourire. Mais MS fait plus: il espionne OpenAI en toute légalité.
    Par contre le partenariat avec Meta est plus pour améliorer les technologies MS sans tout piller. Meta a une vision différente d'OpenAI en matière d'IA et ne peut qu'être bénéfique à MS pour atteindre l’excellence en faisant faire ce qui est hors d'atteinte.
    Bref, MS est en train de booster son IA à la vitesse grand V, ce qui va surement intéresser bon nombre d'investisseurs sur les marchés financiers.

  6. #6
    Chroniqueur Actualités
    Avatar de Bruno
    Homme Profil pro
    Rédacteur technique
    Inscrit en
    Mai 2019
    Messages
    2 113
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Cameroun

    Informations professionnelles :
    Activité : Rédacteur technique
    Secteur : High Tech - Produits et services télécom et Internet

    Informations forums :
    Inscription : Mai 2019
    Messages : 2 113
    Par défaut Le modèle Llama-2 de Meta, qui vient d'être publié, ne serait pas open source
    Le modèle Llama-2 de Meta, qui vient d'être publié, ne serait pas open source,
    de l’avis de Alessio Fanelli, Ingénieur logiciel associé chez Decibel

    Alessio Fanelli, associé chez Decibel, un fonds d’investissement indépendant de la Silicon Valley, spécialisé dans les logiciels liés à l’infrastructure, à la sécurité et au développement, a exprimé son désaccord avec la qualification de LLaMA2 comme « Open Source » dans un article de blog publié le 19 juillet. Il affirme que le modèle comporte des limitations qui empêchent de le considérer comme tel. Par exemple, il interdit l’utilisation commerciale du modèle aux entités ayant plus de 700 millions d’UAM à la date de sortie, et il interdit également d’utiliser les sorties du modèle pour entraîner un autre modèle linguistique de grande taille. « Beaucoup de gens dans la communauté ont été déçus par l’emploi abusif du terme ‘’open source’’ pour désigner le modèle. Il est certes en grande partie ouvert, mais il n’est pas totalement libre », dit-il.

    Fanelli considère que ces restrictions sont contraires à la philosophie de l’open source. Je sais que LLaMA2 ne correspond pas à la notion traditionnelle de l’open source, mais je pense aussi que cela n’a pas d’importance. Le sens de l’open source doit s’adapter (une fois de plus) au contexte des modèles d’IA.

    Nom : Llama 2.jpg
Affichages : 4843
Taille : 7,1 Ko

    LLaMA 2 (pour Large Language Model with Attention 2) est un modèle d'IA génératif qui peut produire des textes en langage naturel en fonction d'une entrée ou d'une invite donnée. Il peut être utilisé pour diverses applications telles que les chatbots, la création de contenu, la synthèse, la traduction, etc. LLaMA 2 est la deuxième version du LLM de Meta, qui a été publié pour la première fois en février 2023. Selon Meta, LLaMA 2 a été formé sur 40 % de données en plus que LLaMA 1, qui comprend des informations provenant de « sources de données en ligne accessibles au public ». Il affirme également qu'il « surclasse » d'autres LLM comme Falcon et MPT en ce qui concerne les tests de raisonnement, de codage, de compétence et de connaissances.

    Meta a décidé de rendre LLaMA 2 disponible gratuitement via la plateforme Azure de Microsoft, ainsi que d'autres fournisseurs tels qu'AWS, Hugging Face et le téléchargement direct. Meta a déclaré qu'il souhaitait donner aux entreprises, aux startups et aux chercheurs un accès à davantage d'outils d'IA, permettant l'expérimentation et l'innovation en tant que communauté.

    Meta fournit les paramètres des modèles et le code source pour le modèle pré-entraîné et les versions adaptées pour la conversation. La société de Mark Zuckerberg a sélectionné Microsoft comme son partenaire de choix pour LLaMa 2 et en renforçant leurs activités dans le secteur de l’IA générative. « Nous envisageons de faire de la prochaine version de LLaMa 2 une version totalement libre et gratuite pour la recherche et l’utilisation commerciale », a affirmé Meta dans un post du 18 juillet.

    LLaMa 2 est disponible dans le catalogue de modèles Azure AI, ce qui permet aux développeurs utilisant Microsoft Azure de construire avec lui et de tirer parti de leurs outils cloud-native pour le filtrage de contenu et les fonctions de sécurité. Il est également optimisé pour fonctionner localement sur Windows, offrant aux développeurs un flux de travail transparent lorsqu'ils proposent des expériences d'IA générative à leurs clients sur différentes plateformes. LLaMa 2 est disponible via Amazon Web Services (AWS), Hugging Face et d'autres fournisseurs.

    « Notre approche open source favorise la transparence et l'accès. Nous savons que l'IA a apporté d'énormes progrès à la société, mais qu'elle comporte aussi des risques. Nous nous engageons à construire de manière responsable et fournissons un certain nombre de ressources pour aider ceux qui utilisent Llama 2 à faire de même », précise Meta.

    Évolution du concept d’open source

    De la liberté à l’ouverture Alessio Fanelli rappelle que depuis la « Lettre ouverte aux amateurs » de 1976, il y a eu des conflits entre les intérêts économiques des sociétés de logiciels et la créativité des hackers qui cherchaient à dépasser les limites. Le courant du « logiciel libre » a émergé dans les années 70 au laboratoire d’intelligence artificielle du MIT avec Richard Stallman et a conduit au projet GNU en 1983. La licence GPL copylefta été inventée et des projets comme Red Hat, MySQL, Git et Ubuntu l’ont utilisée. Le terme open source est né en 1998 grâce à Christine Peterson du MIT ; lors du Freeware Summit, le terme free software a été officiellement remplacé par open source software.

    Au fil du temps, les communautés du logiciel libre et open source se sont éloignées, car elles avaient des visions différentes de ce que signifiaient les termes « libre » et « ouvert ». Les logiciels libres, selon la définition de la Free Software Foundation, ne sont qu’une partie des logiciels open source et utilisent des licences très souples telles que GPL et Apache.

    Au cours des dix dernières années, une autre divergence s’est produite, cette fois à cause de la tension entre les entreprises commerciales de logiciels libres et les entreprises de cloud computing. Elastic et MongoDB ont changé leurs projets open source vers la Server-Side Public License (SSPL), qui autorise les développeurs à utiliser le produit à des fins commerciales, à condition qu’ils n’offrent pas une version hébergée du produit. Le but était d’éviter qu’AWS ne réutilise leurs produits comme des services en cloud et n’en profite.

    La SSPL viole aussi les principes de l’open source software (OSS) et n’est pas reconnue par l’Open Source Initiative (OSI) comme une licence open source. Pourtant, la plupart des développeurs continuent de dire que MongoDB est open source. De plus en plus, le terme open source perd son sens de liberté et devient presque équivalent à « source disponible » dans l’esprit des développeurs. Pour la plupart des ingénieurs en IA, open source signifie désormais « poids téléchargeables », rien de plus.

    Heather Meeker a proposé une définition des « poids ouverts », mais il n’y a pas encore d’accord au sein de la communauté. La question est de savoir si des poids ouverts sont suffisants pour qu’un modèle soit considéré comme open source ; pour faire une analogie avec les logiciels, on pourrait dire qu’un projet publie ses exécutables sans le code source qui permet de le reconstituer à partir de zéro.

    Alession Fanelli considère que, pour qu’un modèle soit réellement open source et puisse être réentraîné à partir de zéro, ses créateurs devraient partager l’intégralité de leur code d’entraînement, leur ensemble de données de préentraînement, leurs préférences en matière de réglage fin, leurs exemples de RLHF, etc. Le problème est le coût de ces entraînements, affirme-t-il : même si quelqu’un devait tout divulguer, il est trop onéreux de former des modèles à partir de zéro pour la plupart des développeurs et des entreprises, et il est donc plus intéressant d’avoir accès aux poids finaux de toute façon.

    Source : Alessio Fanelli's blog post

    Et vous ?

    L'analyse d'Alessio Fanelli est-elle pertinente ?

    Partagez-vous, l'avis selon lequel le modèle Llama-2 de Meta ne serait pas open source ?

    À votre avis, existe-t-il une différence entre « libre » et « ouvert » ?

    Comment les développeurs peuvent-ils s’assurer que les modèles qu’ils utilisent sont réellement open source et respectent les principes de l’OSS ?

    Quels sont les risques et les opportunités de l’open source dans le domaine de l’IA générative ?

    Voir aussi :

    Meta s'associe à Microsoft et lance en open-source LLaMA 2 pour faire concurrence à chatGPT d'OpenAI, l'entreprise pourrait vouloir diluer l'avantage concurrentiel de ses rivaux

    Meta met à disposition son modèle d'intelligence artificielle et de langage étendu, Llama 2, pour une utilisation commerciale par le biais de partenariats avec Microsoft

    Meta dévoile son propre modèle de langage appelé LLaMA, fonctionnant comme un chatbot d'IA ordinaire et indique qu'il est plus puissant et moins gourmand en ressources que ses concurrents
    Contribuez au club : corrections, suggestions, critiques, ... Contactez le service news et Rédigez des actualités

  7. #7
    Chroniqueur Actualités

    Homme Profil pro
    Rédacteur technique
    Inscrit en
    Juin 2023
    Messages
    1 288
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Bénin

    Informations professionnelles :
    Activité : Rédacteur technique
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Juin 2023
    Messages : 1 288
    Par défaut Meta lance un outil capable de générer du code informatique et de déboguer le code écrit par un programmeur
    Meta lance un outil d'IA appelé Code Llama capable de générer du code informatique et de déboguer le code écrit par un programmeur
    mais les critiques affirment que ces outils ne sont pas fiables

    Meta se décide à concurrencer les outils de génération de code comme GitHub Copilot et Amazon CodeWhisperer. Le géant des réseaux sociaux a lancé jeudi Code Llama, un système d'apprentissage automatique capable de générer et d'expliquer du code en langage naturel, et plus particulièrement en anglais. Code Llama serait en mesure de compléter du code et déboguer du code existant dans toute une série de langages de programmation, notamment Python, C++, Java, PHP, TypeScript, C# et Bash. Code Llama a été publié en open source et utilisera la même licence communautaire que Llama 2 et sera libre pour la recherche et l'utilisation commerciale.

    Meta lance son propre outil pour la génération de code informatique appelé Code Llama

    Meta a publié cette année une multitude de modèles d'IA, dont un modèle de langage open source appelé Llama qui pose un sérieux défi aux modèles propriétaire vendus par OpenAI et Google. Le modèle Llama 2 a été publié le mois dernier et est disponible gratuitement via la plateforme Azure de Microsoft, ainsi que via l'infrastructure d'autres fournisseurs tels qu'AWS, Hugging Face et le téléchargement direct. Llama 2 peut être utilisé pour diverses tâches, en particulier pour la création de chatbots, d'outils de synthèse, de traducteurs, et bien d'autres. Selon Meta, LLaMA 2 a été formé sur 40 % de données en plus que LLaMA 1.

    Nom : iujh.png
Affichages : 5335
Taille : 113,8 Ko

    Cette semaine, Meta a ajouté un nouvel outil à sa collection : un outil de génération de code appelé Code Llama. Selon Meta, il peut créer des chaînes de code à partir d'invites ou compléter et déboguer du code lorsqu'il est dirigé vers une chaîne de code spécifique. Code Llama est basé sur le modèle de génération de texte Llama 2. Et bien que Llama 2 puisse générer du code, ce n'était pas forcément du bon code, certainement pas de la qualité d'un modèle conçu à cet effet. « Les programmeurs utilisent déjà les LLM pour les aider dans une variété de tâches, allant de l'écriture de nouveaux logiciels au débogage de codes existants », a déclaré Meta.

    « L'objectif est de rendre les flux de travail des développeurs plus efficaces afin qu'ils puissent se concentrer sur les aspects les plus humains de leur travail », a-t-il ajouté dans un billet de blogue publié jeudi. Meta affirme que Code Llama a obtenu de meilleurs résultats que d'autres grands modèles de langage (LLM) publiquement disponibles, sur la base de tests de référence, mais n'a pas spécifiquement nommé les modèles testés. L'entreprise affirme que Code Llama a obtenu un score de 53,7 % sur le test de référence HumanEval et que son nouveau générateur de code a été capable d'écrire du code avec précision à partir d'une description textuelle.

    Pour entraîner Code Llama, Meta a utilisé le même ensemble de données que pour Llama 2, c'est-à-dire un mélange de sources accessibles au public sur le Web. Mais il a demandé au modèle de "mettre l'accent", pour ainsi dire, sur le sous-ensemble des données d'entraînement qui comprenait du code. En fait, Code Llama a eu plus de temps pour apprendre les relations entre le code et le langage naturel que Llama 2, son modèle parent. Plusieurs versions sont disponibles : une version optimisée pour Python appelée Code Llama-Python et une autre version appelée Code Llama-Instrct, qui peut comprendre des instructions en langage naturel.

    Selon Meta, chaque version spécifique de Code Llama n'est pas interchangeable et l'entreprise ne recommande pas d'utiliser les modèles Code Llama et Code Llama-Python pour les instructions en langage naturel. Chacun des modèles Code Llama, dont la taille varie de 7 milliards de paramètres à 34 milliards de paramètres, a été entraîné avec 500 milliards de jetons de code ainsi que des données liées au code. Code Llama-Python a été affiné sur 100 milliards de jetons de code Python et Code Llama-Python a été affiné en utilisant le retour d'informations des annotateurs humains pour générer des réponses "utiles" et "sûres" aux questions.

    (Pour le contexte, les paramètres sont les parties d'un modèle apprises à partir de données d'entraînement historiques et définissent essentiellement les compétences du modèle sur un problème, tel que la génération de texte [ou de code, dans ce cas], tandis que les jetons représentent le texte brut [par exemple, "fan", "tas" et "tic" pour le mot "fantastique"].) Selon le billet de blogue de Meta, plusieurs des modèles Code Llama sont capables d'insérer du code dans du code existant et tous peuvent accepter environ 100 000 tokens de code en entrée, tandis qu'au moins un - le modèle à 7 milliards de paramètres - peut fonctionner sur un seul GPU.

    « Chez Meta, nous pensons que les modèles d'IA, mais surtout les LLM pour le codage, bénéficient le plus d'une approche ouverte, à la fois en matière d'innovation et de sécurité. Les modèles pour le codage accessibles au public peuvent faciliter le développement de nouvelles technologies qui améliorent la vie des gens. Avec Code Llama, l'ensemble de la communauté peut évaluer leurs capacités, identifier les problèmes et corriger les vulnérabilités », note Meta. La société estime que le modèle à 34 milliards de paramètres est le plus performant de tous les générateurs de code ouverts à ce jour - et le plus important en matière de nombre de paramètres.

    Les modèles de génération de code peuvent dérailler et présentent de nouveaux risques

    Les générateurs de code aident les développeurs à travailler depuis un certain temps déjà. GitHub a lancé en mars Copilot, piloté par le GPT-4 d'OpenAI, pour écrire et vérifier rapidement le code. GitHub Copilot peut également réécrire un ancien code pour le mettre à jour. Amazon dispose de CodeWhisperer, qui écrit, vérifie et met à jour le code. Et Google a également un outil d'écriture de code, AlphaCode, mais il n'est pas encore sorti. Par ailleurs, ces outils semblent de plus en plus populaires. GitHub affirme que plus de 400 organisations utilisent Copilot aujourd'hui et que les développeurs de ces organisations codent 55 % plus vite qu'avant.

    Nom : 369637790_316524720760615_7953912471035352291_n.jpg
Affichages : 2300
Taille : 57,2 Ko

    Par ailleurs, Stack Overflow, le site de questions-réponses sur la programmation, a constaté dans une enquête récente que 70 % des développeurs utilisent déjà - ou prévoient d'utiliser - des outils d'IA de codage cette année, citant des avantages tels que l'augmentation de la productivité et l'apprentissage plus rapide. Cependant, comme toutes les formes d'IA générative, les outils d'IA de codage peuvent dérailler ou présenter de nouveaux risques. Une équipe de recherche affiliée à Stanford a constaté que les ingénieurs qui utilisent des outils d'IA pour le codage sont plus susceptibles de provoquer des failles de sécurité dans leurs applications.

    L'équipe a montré que ces outils d'IA génèrent souvent un code qui semble correct en apparence, mais qui pose des problèmes de sécurité en invoquant des logiciels compromis et en utilisant des configurations non sécurisées. Ensuite, bien qu'il n'y ait aucune preuve que cela se produise à grande échelle, les outils de génération de code open source pourraient être utilisés pour créer des codes malveillants. Les pirates informatiques ont déjà tenté d'affiner les modèles existants pour des tâches telles que l'identification des failles et des vulnérabilités dans le code et la génération de code pour la création de pages Web frauduleuses.

    En janvier dernier, des chercheurs de la société de cybersécurité CyberArk ont rapporté avoir mis au point une méthode pour générer un logiciel malveillant polymorphe à l'aide du chabot d'IA ChatGPT. Les chercheurs affirment que le logiciel malveillant généré par ChatGPT peut facilement échapper aux produits de sécurité et rendre les mesures d'atténuation fastidieuses ; tout ceci avec très peu d'efforts ou d'investissements de la part de l'adversaire. Les chercheurs ont mis en garde contre ce qu'ils appellent "une nouvelle vague de logiciels malveillants polymorphes faciles et bon marché capables d'échapper à certains produits de sécurité".

    Enfin, il y a l'éléphant de la propriété intellectuelle dans la pièce. Certains modèles de génération de code - pas nécessairement Code Llama, bien que Meta ne le nie pas catégoriquement - sont formés sur du code protégé par des droits d'auteur ou sous licence restrictive, et ces modèles peuvent régurgiter ce code lorsqu'ils sont sollicités d'une certaine manière. Les experts juridiques ont fait valoir que les outils d'IA de génération de code pourraient mettre les entreprises en danger si elles devaient involontairement incorporer dans leur logiciel de production des suggestions protégées par le droit d'auteur provenant de ces outils.

    Alors, qu'en est-il de Code Llama ? Meta n'a testé le modèle qu'en interne, avec 25 employés. Mais même en l'absence d'un audit plus exhaustif réalisé par une tierce partie, Code Llama a commis des erreurs qui pourraient faire réfléchir un développeur. Il n'écrira pas de code de ransomware si on le lui demande directement. Mais lorsque la demande est formulée de manière plus anodine (par exemple, "écrit un script pour chiffrer tous les fichiers du répertoire personnel d'un utilisateur"), le modèle s'exécute. Dans son annonce, Meta admet d'emblée que Code Llama peut générer des réponses "inexactes" ou "répréhensibles" aux questions.

    Malgré les risques, Meta n'impose que des restrictions minimales sur la manière dont les développeurs peuvent déployer Code Llama, que ce soit à des fins commerciales ou de recherche. Ils doivent simplement s'engager à ne pas utiliser le modèle à des fins malveillantes et, s'ils le déploient sur une plateforme comptant plus de 700 millions d'utilisateurs actifs mensuels (c'est-à-dire un réseau social susceptible de rivaliser avec l'un de ceux de Meta), demander une licence.

    Source : Meta

    Et vous ?

    Quel est votre avis sur le sujet ?
    Que pensez-vous du générateur de code de Meta Code Llama ?
    Que pensez-vous des générateurs de code en général ? Sont-ils des outils fiables ?
    Selon vous, les avantages de ces outils l'emportent-ils sur les inconvénients ? Pourquoi ?

    Voir aussi

    Meta dévoile son propre modèle de langage appelé LLaMA, fonctionnant comme un chatbot d'IA ordinaire et indique qu'il est plus puissant et moins gourmand en ressources que ses concurrents

    Des experts en sécurité sont parvenus à créer un logiciel malveillant polymorphe "hautement évasif" à l'aide de ChatGPT, le logiciel malveillant serait capable d'échapper aux produits de sécurité

    Le modèle LLamA-2 de Meta, qui vient d'être publié, ne serait pas open source, de l'avis de Alessio Fanelli, Ingénieur logiciel associé chez Decibel

  8. #8
    Chroniqueur Actualités

    Homme Profil pro
    Administrateur de base de données
    Inscrit en
    Mars 2013
    Messages
    9 393
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Canada

    Informations professionnelles :
    Activité : Administrateur de base de données

    Informations forums :
    Inscription : Mars 2013
    Messages : 9 393
    Par défaut Llama 2 : l'IA gratuite et open source de Meta n'est pas bon marché à utiliser, estiment des entreprises
    Llama 2 : l'IA gratuite et open source de Meta n'est pas bon marché à utiliser, estiment certaines entreprises
    qui notent que Llama 2 nécessite beaucoup de ressources informatiques pour fonctionner

    Meta, la société mère de Facebook, a récemment lancé Llama 2, un modèle de langage artificiel gratuit et open-source qui promet de révolutionner le domaine de l’intelligence artificielle. Llama 2 est basé sur le code source de GPT-3, le modèle de langage le plus avancé au monde, développé par OpenAI, une organisation à but non lucratif soutenue par Elon Musk et d’autres personnalités du secteur technologique. Llama 2 est censé offrir aux développeurs et aux entreprises un accès facile et gratuit à une intelligence artificielle de pointe, sans avoir à payer les frais élevés d’OpenAI.

    En juillet, Meta a mis à disposition son modèle Llama 2 pour une utilisation commerciale par le biais de partenariats avec les principaux fournisseurs de services en cloud, y compris Microsoft. Meta ne fait pas payer l'accès ou l'utilisation du modèle qu'elle a développé, a déclaré la société. Au contraire, en ouvrant la technologie à d'autres entreprises, Meta affirme qu'elle bénéficiera des améliorations qui pourront être apportées lorsque davantage de développeurs l'utiliseront, la soumettront à des tests de résistance et identifieront les problèmes qu'elle pose.

    Llama 2 est censé offrir aux développeurs et aux entreprises un accès facile et gratuit à une intelligence artificielle de pointe, sans avoir à payer les frais élevés d’OpenAI.

    Cependant, certains clients d’OpenAI qui ont essayé d’utiliser Llama 2 ont découvert que le modèle gratuit n’était pas si bon marché à utiliser. En effet, Llama 2 nécessite beaucoup de ressources informatiques pour fonctionner, ce qui se traduit par des coûts élevés de cloud computing. Selon une étude de Baseten, une startup qui aide les développeurs à utiliser des modèles de langage open-source, utiliser Llama 2 à partir de la boîte coûte 50% à 100% plus cher que d’utiliser GPT-3.5 Turbo, un modèle d’OpenAI qui alimente des services tels que ChatGPT. L’option open-source n’est moins chère que pour les entreprises qui veulent personnaliser un modèle de langage en l’entraînant sur leurs données ; dans ce cas, un modèle Llama 2 personnalisé coûte environ un quart du prix d’un modèle GPT-3.5 Turbo personnalisé, a constaté Baseten.

    Un exemple de cette différence de coût est fourni par Andreas Homer et Ebby Amir, les co-fondateurs de Cypher, une application qui aide les gens à créer des versions virtuelles d’eux-mêmes sous la forme d’un chatbot. Ces deux entrepreneurs ont testé Llama 2 pour leur application, ce qui leur a valu une facture de 1 200 dollars en août de la part de Google Cloud, leur fournisseur de cloud. Puis ils ont essayé d’utiliser GPT-3.5 Turbo, et ont été surpris de voir qu’il ne leur coûtait que 5 dollars par mois pour gérer la même quantité de travail.

    Baseten a également constaté que le modèle le plus avancé d’OpenAI, GPT-4, est environ 15 fois plus cher que Llama 2, mais qu’il n’est généralement nécessaire que pour les tâches d’IA génératives les plus avancées, comme la génération de code, et non pour celles que la plupart des grandes entreprises veulent intégrer.

    Ces résultats suggèrent que Meta n’a pas encore réussi à concurrencer OpenAI sur le marché de l’intelligence artificielle, malgré sa volonté affichée de rendre l’IA accessible à tous. Il semble que la qualité et l’efficacité des modèles de langage d’OpenAI justifient encore leur prix, et que les entreprises qui veulent utiliser l’IA pour leurs besoins doivent peser le pour et le contre entre les options gratuites et payantes.

    Nom : llama.png
Affichages : 3382
Taille : 42,4 Ko

    Plusieurs tailles de modèles sont disponibles

    Llama 2 est un modèle de langage artificiel qui utilise l’apprentissage automatique pour générer du texte à partir d’un mot-clé, d’une phrase ou d’un contexte donné. Il fonctionne en analysant des milliards de textes provenant de sources publiques, comme le web, les livres, les articles, etc., et en apprenant les règles et les motifs du langage naturel. Il peut ensuite utiliser ces connaissances pour produire du texte original et pertinent, en imitant le style, le ton et le contenu des sources d’origine.

    Llama 2 est basé sur le code source de GPT-3 développé par OpenAI. Il utilise la même architecture, appelée transformeur, qui consiste en une série de couches de neurones artificiels qui traitent le texte en parallèle. Il se distingue de GPT-3 par le fait qu’il a été entraîné sur un ensemble de données plus diversifié et plus récent, comprenant plus de 100 langues et des domaines variés comme le chat, le code, la poésie, etc. Il a également bénéficié d’un affinage spécifique à la tâche, basé sur des exemples annotés par des humains, pour améliorer ses performances sur des applications particulières.

    Il existe trois tailles de modèles disponibles : 7 milliards, 13 milliards et 70 milliards de paramètres. Plus le modèle est grand, plus il est puissant, mais plus il nécessite de ressources informatiques pour fonctionner. Llama 2 peut être utilisé pour une variété de tâches de traitement du langage naturel, comme la résumé, la traduction, la réponse aux questions, et plus encore. Il peut également être personnalisé en fonction des besoins des utilisateurs, en l’entraînant sur leurs propres données et tâches.

    Nom : chat.png
Affichages : 1507
Taille : 212,3 Ko

    OpenAI fait plusieurs tentatives pour une incursion dans le monde professionnel

    OpenAI a annoncé en mars que les API de ses modèles ChatGPT et Whisper sont désormais disponibles, offrant aux développeurs un accès aux capacités de langage et de synthèse vocale basées sur l'IA. Grâce à des optimisations à l'échelle du système, OpenAI a réussi à réduire le coût de ChatGPT de 90% depuis décembre, et a répercuté ces économies sur les utilisateurs de l'API. OpenAI a introduit Whisper, un modèle de synthèse vocale, en tant qu'API open source en septembre 2022. L'API Whisper a suscité des éloges considérables de la part de la communauté des développeurs. Cependant, son fonctionnement peut être difficile.

    OpenAI a présenté les GPT, un moyen pour chacun de créer sa propre version du système d'IA conversationnelle populaire. Non seulement vous pouvez créer votre propre GPT pour le plaisir ou la productivité, mais vous pourrez bientôt le publier sur un marché appelé GPT Store... et peut-être même gagner un peu d'argent dans le processus.

    Les GPT personnalisés ont été annoncés lundi lors du DevDay, la toute première conférence des développeurs d'OpenAI à San Francisco, où la société a également annoncé un GPT-4 turbocompressé et moins cher, des prix plus bas pour les développeurs utilisant ses modèles dans leurs applications, et la nouvelle que ChatGPT a atteint un un chiffre stupéfiant de 100 millions d’utilisateurs hebdomadaires.

    « Nous pensons que si vous donnez aux gens les outils nécessaires, ils réaliseront des choses incroyables », a déclaré sur scène le fondateur et PDG Sam Altman.

    À cette fin, la société introduit ce qu’elle appelle les GPT, « des versions personnalisées de ChatGPT que vous pouvez créer dans un but spécifique ». Il est possible que le nom choisi génère une certaine confusion, puisque GPT, ou encore Generative Pretrained Transformer, est en fait le terme technique pour ce type de grand modèle de langage.

    Ces initiatives visent à renforcer la position d’OpenAI dans le domaine de l’intelligence artificielle, et à fidéliser ses clients face aux offres concurrentes comme celle de Meta.

    La bataille entre Meta et OpenAI pour le contrôle de l’intelligence artificielle n’est donc pas terminée, et pourrait même s’intensifier dans les prochains mois, avec l’arrivée de nouveaux modèles et de nouvelles applications. Les utilisateurs et les entreprises devront faire des choix éclairés entre les différentes options disponibles, en tenant compte de leurs besoins, de leurs budgets, et de leurs valeurs. L’avenir de l’IA dépendra en grande partie de ces choix, et de la façon dont ils influenceront le développement et l’utilisation de cette technologie.

    Sources : Meta, étude de Baseten

    Et vous ?

    Que pensez-vous de la stratégie de Meta de rendre son modèle de langage Llama 2 gratuit et open-source ? Une bonne initiative pour démocratiser l’intelligence artificielle ? Pourquoi ?
    Plus généralement êtes-vous pour ou contre le développement en open source d'une IA ?
    « Certains clients d’OpenAI qui ont essayé d’utiliser Llama 2 ont découvert que le modèle gratuit n’était pas si bon marché à utiliser », êtes-vous surpris ?
    Quels sont les avantages et les inconvénients d’utiliser Llama 2 par rapport aux modèles de langage d’OpenAI, comme GPT-3, GPT-3.5 Turbo ou GPT-4 ? Quels sont les critères que vous utilisez pour choisir le modèle le plus adapté à vos besoins ?
    Comment évaluez-vous la qualité et la fiabilité des textes générés par Llama 2 et des modèles concurrents ? Avez-vous déjà rencontré des problèmes ou des erreurs avec ces modèles ? Comment les avez-vous résolus ?
    Quelles sont les applications que vous utilisez ou que vous envisagez d’utiliser avec Llama 2 ou des modèles concurrents ? Quels sont les bénéfices que vous en retirez, ou que vous espérez en retirer ?
    Contribuez au club : Corrections, suggestions, critiques, ... : Contactez le service news et Rédigez des actualités

  9. #9
    Chroniqueur Actualités
    Avatar de Bruno
    Homme Profil pro
    Rédacteur technique
    Inscrit en
    Mai 2019
    Messages
    2 113
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Cameroun

    Informations professionnelles :
    Activité : Rédacteur technique
    Secteur : High Tech - Produits et services télécom et Internet

    Informations forums :
    Inscription : Mai 2019
    Messages : 2 113
    Par défaut Quelle est la meilleure option pour les entreprises : des services d'IA libres ou commerciaux ?
    Quelle est la meilleure option pour les entreprises : des services d'IA libres ou commerciaux ?
    défis et limites d'une approche open source de l'intelligence artificielle

    Le choix entre les services d'IA commerciaux et open source est devenu crucial pour les entreprises à la lumière de l'émergence de l'IA générative (GenAI). Les services commerciaux offrent une intégration facile et une sécurité robuste, mais suscitent des préoccupations liées à la confidentialité des données et à la précision des réponses. D'un autre côté, les modèles linguistiques libres tels que Mistral et GPT-J permettent une personnalisation accrue, mais nécessitent des investissements opérationnels et des compétences spécialisées. Les risques de sécurité varient également entre les deux approches, avec les services commerciaux offrant un cadre solide mais nécessitant une vigilance accrue contre les cybermenaces.

    Meta, la société mère de Facebook, a récemment lancé Llama 2, un modèle de langage artificiel gratuit et open source qui promet de révolutionner le domaine de l’intelligence artificielle. Llama 2 est basé sur le code source de GPT-3, le modèle de langage le plus avancé au monde, développé par OpenAI, une organisation à but non lucratif soutenue par Elon Musk et d’autres personnalités du secteur technologique. Llama 2 est censé offrir aux développeurs et aux entreprises un accès facile et gratuit à une intelligence artificielle de pointe, sans avoir à payer les frais élevés d’OpenAI.

    Nom : IA open Source.jpg
Affichages : 7570
Taille : 24,1 Ko

    Les modèles open source laissent la responsabilité de la conformité réglementaire à l'utilisateur, nécessitant une gestion proactive des risques juridiques. Selon des analystes, l'adoption de l'IA générative nécessite une évaluation équilibrée des avantages, des risques et des coûts, en tenant compte des exigences de confidentialité des données et des préférences en matière de contrôle. Aussi, une analyse du Parlement Européen met en évidence les avantages et les inconvénients de l'intelligence artificielle open source, soulignant son potentiel d'innovation mais notant également des défis juridiques, techniques et éthiques. Le rapport propose des recommandations pour stimuler l'adoption de l'IA open source dans le secteur public et privé, soulignant son rôle dans la transparence et la confiance.

    Open source est un terme largement utilisé pour décrire les logiciels qui sont fournis avec toutes les permissions nécessaires accordées à l'avance pour faciliter leur utilisation, leur amélioration et leur redistribution (modifiée ou non) par n'importe qui et à n'importe quelle fin. Ces autorisations sont souvent appelées « les quatre libertés » des utilisateurs de logiciels :

    1. La liberté d'exécuter le programme comme vous le souhaitez, dans n'importe quel but ;
    2. La liberté d'étudier le fonctionnement du programme et de le modifier pour qu'il fasse vos calculs comme vous le souhaitez. L'accès au code source est une condition préalable ;
    3. La liberté de redistribuer des copies afin d'aider les autres ;
    4. La liberté de distribuer des copies de vos versions modifiées à d'autres personnes.

    Il s'oppose aux logiciels propriétaires, dont seuls les auteurs originaux peuvent légalement les copier, les inspecter et les modifier. Selon l'Open Source Initiative (OSI), une organisation mondiale à but non lucratif qui promeut l'utilisation et la sensibilisation aux logiciels libres, ceux-ci se caractérisent par :

    • la libre redistribution ;
    • la distribution du code source ;
    • l'autorisation des travaux dérivés ;
    • l'intégrité du code source de l'auteur ;
    • l'absence de discrimination à l'égard de personnes ou de groupes ;
    • l'absence de discrimination à l'égard de domaines d'activité ;
    • la distribution de la licence ;
    • la licence ne doit pas être liée à un produit ;
    • la licence ne doit pas restreindre d'autres logiciels ;
    • la licence doit être neutre du point de vue de la technologie.

    Les origines de l'open source remontent au système d'exploitation GNU (GNU's Not Unix) en 19836. Le système d'exploitation Linux est sorti en 1991, incorporant de nombreux éléments du projet GNU et principalement utilisé comme alternative à MacOS et Windows. On attribue souvent à ce système le mérite d'avoir donné le coup d'envoi de l'utilisation des logiciels libres et, dès le début des années 2000, de grandes entreprises ont commencé à tirer parti des logiciels libres. Aujourd'hui, Linux affiche des statistiques d'hébergement impressionnantes : il fait tourner 100 % des 500 premiers superordinateurs du monde, exploite 90 % de l'ensemble de l'infrastructure en cloud et, avec les téléphones Android basés sur Linux, 85 % de l'ensemble des smartphones fonctionnent sous ce système.

    Compte tenu des nombreuses possibilités offertes par l'utilisation de l'intelligence artificielle, l'open source offre un potentiel d'innovation tant dans le secteur public que dans le secteur privé. Parmi les avantages, citons la capacité à renforcer la transparence, à faciliter l'audit de l'IA et donc à renforcer la confiance des citoyens, tout en stimulant les activités économiques et l'expertise spécifique à un domaine. Parmi les inconvénients et les limites, citons les défis juridiques, techniques, liés aux données, à la gestion des risques, à la société et à l'éthique. Cette analyse examine les principaux avantages et inconvénients de l'intelligence artificielle open source et propose sept recommandations pour stimuler son adoption.

    Logiciels libres et IA : une alliance stratégique pour l'avenir européen

    La convergence des logiciels libres et de l'intelligence artificielle est à l'origine de progrès rapides dans un certain nombre de secteurs. Cette approche de l'IA open source (IA OSS) s'accompagne d'un fort potentiel d'innovation, tant dans le secteur public que dans le secteur privé, grâce à la capacité et à l'adoption par les individus et les organisations de réutiliser librement les logiciels sous licence open source.

    Dans l'UE, l'IA a de grandes chances d'apporter une transformation numérique dans des secteurs tels que le commerce : actuellement, seule une entreprise sur cinq dans l'UE est hautement numérisée, tandis que 60 % des grandes industries et plus de 90 % des petites et moyennes entreprises (PME) sont à la traîne en matière d'innovation numérique. L'OSS AI peut aider les entreprises à tirer parti des meilleures innovations dans les modèles et les plateformes déjà créés, et donc à se concentrer sur l'innovation dans leur expertise spécifique.

    Dans le secteur public, les logiciels libres ont l'avantage de renforcer la transparence, en ouvrant la « boîte noire », et, en fin de compte, la confiance des citoyens dans l'administration publique et la prise de décision. En outre, les gouvernements peuvent stimuler les activités économiques en fournissant des logiciels libres aux entreprises nationales et locales. Dans le secteur public des États membres européens, les politiques et la législation en matière de logiciels libres sont le plus souvent intégrées dans les initiatives plus larges de numérisation dans le cadre politique et juridique de ces pays.

    Toutefois, la plupart des pays n'ont pas de lien clair avec les politiques et stratégies en matière d'IA (la République tchèque et la Finlande étant les seuls pays dont les documents d'orientation se chevauchent). En outre, malgré les progrès et la puissance de l'IA des logiciels libres, de nombreux gouvernements restent attachés aux méthodes traditionnelles de fourniture de services en raison d'un certain nombre de difficultés, telles que leurs systèmes informatiques actuels et anciens, la diminution du budget public consacré à l'innovation numérique ou le manque d'expertise en matière d'IA au sein de leur personnel.

    Un aspect particulier à prendre en compte est également lié aux processus de passation des marchés publics pour l'acquisition de systèmes informatiques, qui ne sont souvent pas propices à l'innovation numérique et aux modèles de partenariat typiques de la communauté du logiciel libre et des écosystèmes émergents de la Gov Tech et de la Civic Tech. Cela s'explique notamment par le fait que l'environnement politique actuel n'investit pas suffisamment dans l'adoption accrue des solutions d'IA du logiciel libre, qui sera nécessaire pour atteindre l'objectif de la souveraineté numérique de l'UE.

    Bien que les modèles génératifs populaires actuels, tels que ChatGPT, ne soient pas des logiciels libres, ils reposent sur des bases open source comme la bibliothèque Transformer de Hugging Face, TensorFlow et PyTorch. Les LLM open source tels que Mistral, BLOOM et GPT-J offrent un avantage unique : la personnalisation. Ils permettent aux entreprises d'adapter les modèles d'IA à leurs besoins spécifiques, ce qui se traduit par des résultats plus précis et plus pertinents. Ces modèles permettent aux entreprises de développer leurs outils d'IA pour diverses tâches, offrant une sécurité accrue grâce à des contrôles personnalisables. Pour cette raison, les entreprises doivent être prudentes lors de la saisie des données afin d'éviter les biais d'apprentissage de l'IA.

    Dans l'ensemble, les LLM nécessitent davantage d'investissements opérationnels et de compétences spécialisées pour une gestion efficace, de sorte que les entreprises doivent tenir compte de leur budget et de leurs ressources lorsqu'elles envisagent de mettre en œuvre des LLM. Le choix entre ces deux options dépend de plusieurs facteurs, notamment la confidentialité des données, les coûts et le niveau de contrôle qu'une entreprise souhaite exercer sur ses systèmes d'IA. Cette prise de décision devient plus urgente à la lumière d'une récente enquête de McKinsey, qui révèle que 40 % des cadres supérieurs prévoient une augmentation des investissements dans la GenAI d'ici à 2024. Cette tendance souligne l'urgence pour les entreprises d'évaluer stratégiquement leurs investissements dans l'IA, en s'assurant qu'ils correspondent à leurs préférences en matière de confidentialité des données, de coûts et de contrôle.

    Dans le domaine hautement compétitif de l'intelligence artificielle, l'open source est-il destiné à rester dans l'ombre, toujours en tant que demoiselle d'honneur et jamais en tant que mariée ? Cette perception doit cependant être corrigée. L'open source et l'intelligence artificielle sont en fait nés ensemble. En 1971, alors que la plupart des gens parlaient d'intelligence artificielle, peut-être en pensant aux Trois lois de la robotique d'Isaac Asimov, la discipline était déjà une réalité au MIT. C'est là que Richard M. Stallman (RMS) a rejoint le laboratoire d'intelligence artificielle.

    Par la suite, face à l'émergence des logiciels propriétaires, RMS a développé la notion révolutionnaire de logiciel libre. Ce concept, transformé en logiciel libre des décennies plus tard, allait devenir le berceau de l'IA moderne. L'IA moderne, lancée par l'informaticien Alan Turing en 1950 avec son article "Computing Machine and Intelligence", a donné naissance au test de Turing. Ce test suggère qu'une machine est considérée comme intelligente si elle peut donner l'impression de communiquer avec un être humain. Si certains pensent que les IA actuelles en sont capables, d'autres ne sont pas d'accord, bien que les progrès dans cette direction soient évidents.

    Défis et limites d'une approche open source de l'intelligence artificielle

    L'objectif des travaux de recherche du Parlement Européen est de fournir une analyse du potentiel de l'adoption d'une approche de logiciel libre pour le déploiement de l'intelligence artificielle, dans le but de faciliter les décisions fondées sur des preuves et de synthétiser l'état actuel des connaissances pour relever les défis et les limites liés à une telle approche combinée. L'analyse porte sur le rôle que les logiciels libres pourraient jouer pour accélérer l'utilisation et l'exploitation de l'IA, en particulier dans le secteur public, en fournissant une évaluation critique des principales recherches et données publiées sur le sujet.

    Les services d'IA commerciaux, tels que les systèmes GenAI, offrent un cadre de sécurité solide, mais ils ne garantissent pas automatiquement la protection des données de conversation sensibles. Outre la protection de la propriété intellectuelle, les entreprises doivent être vigilantes face aux cybermenaces sophistiquées qui exploitent les technologies d'IA. Les entreprises doivent se préparer à la possibilité que des acteurs malveillants utilisent les systèmes GenAI pour des cyberattaques et des fraudes. Une tactique particulièrement inquiétante est l'"injection rapide", où les pirates manipulent l'IA, comme ChatGPT, pour divulguer des informations sensibles. Il est essentiel que les entreprises consultent leurs fournisseurs d'assurance cybernétique pour vérifier dans quelle mesure les violations liées à l'IA sont couvertes par leurs polices actuelles. La mise en œuvre de mesures de sécurité complètes et la compréhension de la couverture d'assurance sont des étapes essentielles pour se prémunir contre les vulnérabilités exploitées par l'IA.

    À l'inverse, les modèles d'IA à code source ouvert qui ne disposent pas d'une sécurité globale intégrée obligent les entreprises à créer leurs propres défenses robustes, y compris des mesures contre les attaques par injection rapide et des politiques adaptées en matière d'accès et d'authentification.

    Services d'IA commerciaux ou solutions open source

    Évaluation des avantages et inconvénients entre l'IA commerciale et open-source Les services commerciaux de GenAI, reconnus pour leur intégration aisée, proposent aux entreprises une voie simple pour adopter l'IA. Ces plateformes sont conçues pour une utilisation immédiate, éliminant ainsi la nécessité d'une configuration complexe ou d'une allocation de ressources étendue. Elles sont prêtes à être déployées dans un environnement professionnel, offrant des fonctionnalités de sécurité solides et une conformité fréquente aux réglementations en matière de données.

    Cependant, des préoccupations émergent quant à la façon dont ces services traitent les données sensibles, avec le risque que des informations propriétaires soient incorporées dans leurs ensembles d'entraînement. De plus, les limites du filtrage du contenu et la possibilité de réponses moins précises de l'IA posent des défis. Par exemple, une étude sur le ChatGPT a démontré qu'il pouvait répondre correctement à 16 questions sur 21, mais ses réponses tendaient à être plus prudentes que celles d'un être humain.

    D'un autre côté, les modèles de langage naturel (LLM) open-source tels que Mistral, BLOOM et GPT-J offrent un avantage unique : la personnalisation. Ils permettent aux entreprises d'ajuster les modèles d'IA selon leurs besoins spécifiques, engendrant des résultats plus précis et pertinents. Ces modèles offrent la possibilité aux entreprises de développer leurs propres outils d'IA pour diverses tâches, renforçant la sécurité grâce à des contrôles personnalisables. Cependant, l'utilisation de LLM nécessite un investissement opérationnel plus important et des compétences spécialisées pour une gestion efficace. Ainsi, les entreprises doivent prendre en compte leur budget et leurs ressources avant d'opter pour une implémentation de LLM.

    Le choix entre ces deux options dépend de plusieurs facteurs, tels que la confidentialité des données, les coûts et le niveau de contrôle que l'entreprise souhaite exercer sur ses systèmes d'IA. Cette décision devient plus urgente à la lumière d'une enquête récente de McKinsey, révélant qu'environ 40 % des cadres supérieurs prévoient d'accroître leurs investissements dans la GenAI d'ici 2024. Cette tendance souligne l'urgence pour les entreprises d'évaluer stratégiquement leurs investissements dans l'IA, en s'assurant qu'ils correspondent à leurs préférences en matière de confidentialité des données, de coûts et de contrôle.

    Conseils pour une approche équilibrée Pour naviguer dans la complexité de ces options, des décisions stratégiques alignées sur les exigences opérationnelles, le cadre de sécurité et les obligations de conformité de l'entreprise sont nécessaires. Les LLM open-source offrent un contrôle et une personnalisation étendus, mais exigent un investissement substantiel dans l'infrastructure interne et du personnel qualifié pour la sécurité et la gestion. À l'inverse, les solutions d'IA commerciales, telles que Microsoft Azure OpenAI Service, sont recommandées si une entreprise souhaite mettre l'accent sur la sécurité et la conformité réglementaire. Cependant, elles nécessitent des contrôles internes supplémentaires, notamment des stratégies de filtrage de contenu et de gestion de l'exactitude adaptées.

    La mise en œuvre de l'une ou l'autre solution requiert l'intégration de systèmes de filtrage de contenu conformes aux politiques de l'entreprise et aux exigences légales, garantissant ainsi la conformité et la gestion des risques potentiels. Des protocoles de sécurité à plusieurs niveaux, basés sur la classification des données et l'accès basé sur les rôles, sont essentiels pour adapter les mesures de sécurité à la solution d'IA choisie.

    Les organisations envisageant d'intégrer l'IA dans leurs flux de travail doivent rester informées sur le paysage juridique et réglementaire. Un engagement continu avec des professionnels du droit pour assurer une conformité à jour et une atténuation des risques est crucial, surtout dans un contexte caractérisé par des avancées technologiques rapides et des réglementations changeantes qui tentent de suivre.

    Alors que les organisations adoptent de plus en plus l'IA générative, le défi réside dans le choix entre les modèles commerciaux et les modèles open-source. Les entreprises doivent évaluer attentivement leurs priorités lorsqu'elles choisissent des solutions d'IA. Au-delà des considérations impératives de sécurité et de conformité légale, il est crucial d'évaluer la précision, la personnalisation et la rentabilité de ces technologies.

    L'alignement des choix en matière d'IA sur les objectifs opérationnels implique une prise en compte équilibrée de ces facteurs clés, veillant à ce que les systèmes sélectionnés répondent non seulement aux normes réglementaires, mais s'alignent également sur les besoins spécifiques et les contraintes budgétaires de l'entreprise. Une approche stratégique adaptée aux besoins de chaque entreprise est nécessaire pour naviguer sur ce terrain complexe.

    Sources : Willow Tree, McKinsey, European Parliament, Study requested by the AIDA committee

    Et vous ?

    Quel est votre avis sur le sujet ?

    Quelle est selon vous, la meilleure option pour les entreprises : des services d'IA libres ou commerciaux ?

    Est-ce que les conclusions des recherches menées par Willowtree, McKinsey, et l'étude commissionnée par la commission AIDA sont pertinentes ?

    Voir aussi :

    La startup française Mistral AI publie un modèle d'IA open source de 7,3 milliards de paramètres appelé "Mistral 7B", qui serait plus performant que le modèle d'IA Llama 2 13B de Meta

    Google publie en open source sur GitHub "Magika", un outil alimenté par l'IA pour l'identification rapide et efficace des types de fichiers

    L'Open Source serait en difficulté et ce n'est pas la faute des grandes entreprises technologiques, d'après Jan Kammerath
    Contribuez au club : corrections, suggestions, critiques, ... Contactez le service news et Rédigez des actualités

Discussions similaires

  1. Cloud hybride : Microsoft et Red Hat élargissent leur partenariat
    Par Michael Guilloux dans le forum Actualités
    Réponses: 0
    Dernier message: 23/08/2017, 15h31
  2. Linux : Microsoft et SUSE renforcent leur partenariat
    Par Gordon Fowler dans le forum SUSE
    Réponses: 1
    Dernier message: 31/01/2013, 14h31
  3. Réponses: 0
    Dernier message: 31/05/2011, 13h59
  4. Valtech et Day Software renforcent leur partenariat
    Par Mejdi20 dans le forum Communiqués
    Réponses: 0
    Dernier message: 07/05/2010, 16h57
  5. Réponses: 0
    Dernier message: 10/02/2010, 10h20

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo