IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

  1. #41
    Communiqués de presse

    Homme Profil pro
    Rédacteur technique
    Inscrit en
    Avril 2025
    Messages
    509
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Rédacteur technique

    Informations forums :
    Inscription : Avril 2025
    Messages : 509
    Par défaut La start-up spécialisée dans l'IA Anthropic a réglé un recours collectif pour violation du droit d'auteur
    Anthropic a réglé un recours collectif pour violation du droit d'auteur, dans lequel des auteurs accusaient l'entreprise d'avoir entraîné ses modèles d'IA à partir de leurs œuvres sans leur autorisation.

    La start-up spécialisée dans l'IA Anthropic a réglé un recours collectif pour violation du droit d'auteur, dans lequel des auteurs accusaient l'entreprise d'avoir entraîné ses modèles d'IA à partir de leurs œuvres sans leur autorisation. Anthropic, qui a formé son assistant IA Claude à l'aide de livres protégés par le droit d'auteur, a été poursuivie en justice par les auteurs Andrea Bartz, Charles Graeber et Kirk Wallace en août 2024.

    Une action en justice contre Anthropic révèle la façon dont l'entreprise a détruit des millions de livres imprimés dans le seul but de former son IA Claude. Anthropic a retiré la reliure des livres, les a numérisés en fichiers numériques et a jeté les originaux. Cette numérisation destructrice a joué en sa faveur : le juge a estimé que cela relève de l'usage loyal, car les livres achetés ont été transformés, utilisés en interne, sans création de nouveaux exemplaires. Mais l'affaire se complique : Anthropic a aussi téléchargé plus de 7 millions de livres numériques piratés. Pour ces copies pirates, Anthropic doit faire face à un procès pour des dommages-intérêts.

    Début août, un juge fédéral américain vient de certifier la plus grande action collective jamais intentée pour violation du droit d’auteur contre une entreprise technologique. La cible : Anthropic, créatrice du modèle Claude, accusée d’avoir bâti une partie de son succès sur des données issues d’une massive bibliothèque de livres piratés. Derrière cette affaire se joue un débat fondamental : l’IA peut-elle prospérer sur la base d’une appropriation massive de contenus protégés ? Et si la justice tranche sévèrement, l’impact pourrait être dévastateur non seulement pour Anthropic, mais pour l’ensemble du secteur.

    Dans ce contexte, Anthropic a réglé un recours collectif pour violation du droit d'auteur, dans lequel des auteurs accusaient l'entreprise d'avoir entraîné ses modèles d'IA à partir de leurs œuvres sans leur autorisation, selon un document judiciaire. Basée à San Francisco, Anthropic, qui a formé son assistant IA Claude à l'aide de livres protégés par le droit d'auteur, a été poursuivie en justice par les auteurs Andrea Bartz, Charles Graeber et Kirk Wallace en août 2024.


    En juin dernier, le juge fédéral américain William Alsup a statué que les modèles d'IA pouvaient légalement apprendre à partir de livres protégés par le droit d'auteur sans le consentement des auteurs. Cette décision a constitué une victoire partielle pour Anthropic. Alsup a estimé que cette utilisation était « extrêmement transformative » et « équitable », même si l'entreprise avait peut-être enfreint la loi en piratant une grande partie de ses sources. Selon le dossier déposé devant la Cour d'appel des États-Unis pour le 9e circuit, la société technologique et les auteurs concernés ont demandé à la cour de suspendre la procédure pendant qu'ils finalisent l'accord de règlement.

    La doctrine de l'« usage loyal », qui autorise la reproduction limitée de matériel protégé par le droit d'auteur sans consentement dans certaines circonstances, est un élément clé de la défense des sociétés d'IA contre les plaintes pour violation du droit d'auteur. « Cet accord historique profitera à tous les membres du groupe », a déclaré Justin Nelson, associé chez Susman Godfrey et avocat des auteurs. « Nous sommes impatients d'annoncer les détails de l'accord dans les semaines à venir. »

    Alsup avait initialement ordonné que l'affaire soit jugée en décembre afin de déterminer le montant des dommages-intérêts à verser pour piratage. Si l'affaire avait été jugée, les dommages-intérêts auraient pu atteindre 150 000 dollars par cas de violation délibérée du droit d'auteur et auraient pu coûter des milliards à la start-up. Début août, l'entreprise d'IA a tenté de faire appel, mais sa demande a été rejetée.

    Anthropic, fondée par d'anciens employés d'OpenAI et soutenue par Amazon, a piraté au moins 7 millions de livres provenant de Books3, Library Genesis et Pirate Library Mirror, des bibliothèques en ligne contenant des copies non autorisées d'ouvrages protégés par le droit d'auteur, afin de former son logiciel, selon le juge. Elle a également acheté des millions d'exemplaires imprimés en gros, en a retiré la reliure, en a découpé les pages et les a numérisées sous forme numérique et lisible par machine, ce que le juge Alsup a estimé relever du fair use, selon la décision du juge.

    « La simple conversion d'un livre imprimé en fichier numérique pour gagner de la place et permettre la recherche était transformatrice pour cette seule raison », a-t-il écrit. Anthropic a ensuite acheté les livres qu'elle avait initialement piratés. Alsup a déclaré que ces achats n'absolraient pas la société, mais qu'ils pouvaient réduire les dommages-intérêts.

    Cet accord intervient alors que de nombreuses autres affaires de violation du droit d'auteur contre des sociétés d'IA sont portées devant les tribunaux à travers le pays. Tout récemment, Walt Disney Co. et Universal Pictures ont poursuivi en justice la société d'intelligence artificielle Midjourney, que les studios accusent d'avoir entraîné ses modèles de génération d'images sur leurs contenus protégés par le droit d'auteur.

    Un autre exemple de cette situation, en 2023, Jane Friedman, journaliste, auteure et professeure, a découvert sur Amazon et Goodreads une demi-douzaine de livres frauduleux portant son nom, probablement remplis de contenu généré par l’intelligence artificielle (IA). Ces livres traitaient de sujets similaires à ceux qu’elle aborde dans ses ouvrages, comme l’écriture, la publication et la promotion de livres électroniques. Elle a demandé à Amazon et à Goodreads de retirer ces faux titres de leurs sites, mais elle s’est heurtée à des difficultés et à des résistances. Ce n'est que quand la plainte de Jane Friedman est devenue virale sur internet que les deux plateformes ont décidé de retirer lesdits livres.

    Source : Juge fédéral américain William Alsup

    Et vous ?

    Pensez-vous que cette décision est crédible ou pertinente ?
    Quel est votre avis sur le sujet ?

    Voir aussi :

    Anthropic remporte une victoire importante au sujet de « l'usage loyal » pour les plateformes d'IA, mais fait face à un procès pour des dommages-intérêts portant sur des millions d'œuvres piratées

    Disney et Universal intentent le premier procès majeur contre une entreprise spécialisée dans la génération d'images par IA, Midjourney, pour violation du droit d'auteur, affirmant : "C'est du vol"

    OpenAI déclare la course à l'IA « terminée » si l'entraînement sur des œuvres protégées par le droit d'auteur n'est pas considéré comme une utilisation équitable, ajoutant que les États-Unis seraient perdants
    Publication de communiqués de presse en informatique. Contribuez au club : corrections, suggestions, critiques, ... Contactez le service news et Rédigez des actualités

  2. #42
    Communiqués de presse

    Homme Profil pro
    Rédacteur technique
    Inscrit en
    Avril 2025
    Messages
    509
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Rédacteur technique

    Informations forums :
    Inscription : Avril 2025
    Messages : 509
    Par défaut Anthropic a accepté de verser 1,5 milliard de $ pour régler un procès pour vol d'œuvres protégées
    Anthropic a accepté de verser 1,5 milliard de $ pour régler un procès pour vol d'œuvres protégées par le droit d'auteur afin d'entraîner ses modèles d'IA, le plus important recouvrement de droits d'auteur

    La société d'intelligence artificielle (IA) Anthropic a accepté de verser 1,5 milliard de dollars pour régler un recours collectif intenté par des auteurs qui affirmaient que l'entreprise avait volé leurs œuvres pour entraîner ses modèles d'IA. Selon les avocats des auteurs, cet accord, qui doit être approuvé par le juge fédéral américain William Alsup, serait le plus important recouvrement de droits d'auteur jamais rendu public. Anthropic a déclaré que l'accord « résoudrait les réclamations restantes des plaignants ».

    En août 2025, un juge fédéral américain a certifié la plus vaste class action jamais intentée pour violation du droit d’auteur contre une entreprise technologique. La cible : Anthropic, créatrice du modèle Claude, accusée d’avoir bâti une partie de son succès sur des données issues d’une massive bibliothèque de livres piratés. Derrière cette affaire se joue un débat fondamental : l’IA peut-elle prospérer sur la base d’une appropriation massive de contenus protégés ? Et si la justice tranche sévèrement, l’impact pourrait être dévastateur non seulement pour Anthropic, mais pour l’ensemble du secteur.

    Récemment, pour régler ce recours collectif intenté par des auteurs, la société d'intelligence artificielle (IA) Anthropic a accepté de verser 1,5 milliard de dollars. Selon les avocats des auteurs, cet accord, qui doit être approuvé par le juge fédéral américain William Alsup, serait le plus important recouvrement de droits d'auteur jamais rendu public. Il intervient deux mois après que le juge Alsup a estimé que l'utilisation de livres pour entraîner l'IA ne violait pas la loi américaine sur le droit d'auteur, mais a ordonné à Anthropic de comparaître devant les tribunaux pour son utilisation de matériel piraté.

    Anthropic a déclaré que l'accord « résoudrait les réclamations restantes des plaignants ». Cet accord intervient alors que d'autres grandes entreprises technologiques, notamment OpenAI, le fabricant de ChatGPT, Microsoft et Meta, la société mère d'Instagram, font l'objet de poursuites judiciaires pour des violations similaires présumées du droit d'auteur.

    Anthropic, avec son chatbot Claude, se présente depuis longtemps comme l'alternative éthique parmi ses concurrents. « Nous restons déterminés à développer des systèmes d'IA sûrs qui aident les personnes et les organisations à étendre leurs capacités, à faire progresser la découverte scientifique et à résoudre des problèmes complexes », a déclaré Aparna Sridhar, directrice juridique adjointe chez Anthropic, qui est soutenue à la fois par Amazon et Alphabet, la société mère de Google.


    Le procès a été intenté contre Anthropic l'année dernière par Andrea Bartz, auteur à succès de thrillers policiers, dont les romans incluent We Were Never Here, ainsi que Charles Graeber, auteur de The Good Nurse, et Kirk Wallace Johnson, auteur de The Feather Thief. Ils ont accusé l'entreprise d'avoir volé leurs œuvres pour entraîner son chatbot Claude AI afin de bâtir une entreprise valant plusieurs milliards de dollars.

    Selon la décision rendue en juin par le juge Alsup, l'entreprise détient plus de sept millions de livres piratés dans une bibliothèque centrale et encourt jusqu'à 150 000 dollars de dommages et intérêts par œuvre protégée par le droit d'auteur. Sa décision a été l'une des premières à se prononcer sur la manière dont les grands modèles de langage (LLM) peuvent légitimement apprendre à partir de documents existants.

    Il a estimé que l'utilisation des livres des auteurs par Anthropic était « extrêmement transformative » et donc autorisée par la loi américaine. Mais il a rejeté la demande d'Anthropic de classer l'affaire. Anthropic devait être jugée en décembre pour avoir utilisé des copies piratées afin de constituer sa bibliothèque de documents. Entre temps, Anthropic a annoncé réviser ses Conditions générales et sa Politique de confidentialité.

    Désormais, les données issues des conversations des utilisateurs de Claude pourront être utilisées pour entraîner les modèles — sauf en cas de refus explicite. Une décision qui a marqué une rupture par rapport à la politique originelle d’Anthropic, qui affirmait vouloir limiter au maximum la collecte et l’usage des données, se différenciant ainsi de certains concurrents comme OpenAI. Pour beaucoup d’observateurs, il s’agit d’un tournant stratégique, dicté à la fois par la nécessité de rester compétitif et par les exigences financières colossales que représente l’entraînement des modèles de nouvelle génération.

    Les avocats des plaignants ont qualifié l'accord annoncé de « premier du genre à l'ère de l'IA ». « Il offrira une compensation significative pour chaque œuvre collective et créera un précédent obligeant les entreprises d'IA à rémunérer les titulaires de droits d'auteur », a déclaré l'avocat Justin Nelson, qui représente les auteurs. « Cet accord envoie un message fort aux entreprises d'IA et aux créateurs, leur indiquant qu'il est répréhensible de s'approprier des œuvres protégées par le droit d'auteur provenant de ces sites web pirates. »

    Selon Alex Yang, professeur de sciences de gestion et d'opérations à la London Business School, cet accord pourrait encourager une plus grande coopération entre les développeurs d'IA et les créateurs. « Vous avez besoin de ces nouvelles données d'entraînement provenant d'êtres humains », a déclaré Yang. « Si vous voulez accorder davantage de droits d'auteur aux contenus créés par l'IA, vous devez également renforcer les mécanismes qui rémunèrent les humains pour leurs contributions originales. »

    Cette décision intervient après qu'Anthropic a obtenu un financement de série F de 13 milliards de dollars, portant sa valorisation post-financement à 183 milliards de dollars, un montant extraordinaire. Le dernier tour de table, annoncé le 2 septembre 2025, marque l'un des plus importants investissements dans le secteur de l'intelligence artificielle à ce jour et consolide la position d'Anthropic en tant que leader mondial de l'innovation en matière d'IA.

    Et vous ?

    Pensez-vous que cet accord est crédible ou pertinent ?
    Quel est votre avis sur le sujet ?

    Voir aussi :

    Anthropic a acheté, découpé et numérisé des millions de livres physiques avant de détruire les originaux, dans le seul but d'entraîner son IA Claude. Il a également téléchargé 7 millions de livres piratés

    OpenAI déclare la course à l'IA « terminée » si l'entraînement sur des œuvres protégées par le droit d'auteur n'est pas considéré comme une utilisation équitable, ajoutant que les États-Unis seraient perdants

    Un juge fédéral américain se prononce sur l'argument de Meta concernant l'utilisation équitable des droits d'auteur sur l'IA : "Vous anéantissez le marché pour le travail de cette personne"
    Publication de communiqués de presse en informatique. Contribuez au club : corrections, suggestions, critiques, ... Contactez le service news et Rédigez des actualités

  3. #43
    Membre confirmé
    Homme Profil pro
    Développeur en systèmes embarqués
    Inscrit en
    Mai 2015
    Messages
    574
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 55
    Localisation : Belgique

    Informations professionnelles :
    Activité : Développeur en systèmes embarqués

    Informations forums :
    Inscription : Mai 2015
    Messages : 574
    Par défaut C'est une bonne chose... Mais...
    Oui, c'est une bonne chose, personne n'aime voir son travail être "voler", qui plus est pour en tirer profit...

    Mais...

    • qui va récolter cet argent ?
    • qui va le recevoir ? Cela m'étonnerait que les créateurs d'origine s'y retrouvent.
    • qui va décider de cette répartition ? Un livre de 100 pages peut avoir une valeur bien plus grand que toute une série d'autres bouquins.
    • comment va être décidé cette répartition ?
    • comment et qui va "surveiller" cela ?
    • comment "savoir" quel IA a utilisé "quoi" ?
    • ...


    Pourquoi faire une "exception" avec l'IA ? L'idée d'admettre qu'il faut régler les choses "une fois le mal fait" est dangereux, il ne faudrait pas pendre avant et juger après... Tous les "créateurs de valeurs" n'ont pas forcément les moyens de se défendre.

    Les entreprises qui "exploitent" le travail d'autres devraient "négocier" avec le créateur d'origine avant d'utiliser son œuvre. Ce serait une bonne chose, même pour ces entreprises, qui n'utiliseraient plus tout et n'importe quoi pour alimenter leur IA.

    Et si tout cela n'est pas "techniquement" faisable et "ralentirait" le développement de l'IA, alors il faut que ces même entreprises dévoilent comment travaillent leurs IAs, ce qui permettrait à d'autres de développer de "meilleurs IA".

    Le "code" d'une IA utilisant des données "volées" devrait automatiquement être rendue public. Ce serait la moindre des choses. Parce qu'actuellement, ces entreprises 'trouvent" normal d'alimenter leur IA avec le travail d'autrui, mais font tout pour "garder secret" comment leur IA fonctionne...

    Ce n'est que mon avis, chacun pense ce qu'il veut, bien entendu.

    BàV et Peace & Love.

  4. #44
    Communiqués de presse

    Homme Profil pro
    Rédacteur technique
    Inscrit en
    Avril 2025
    Messages
    509
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Rédacteur technique

    Informations forums :
    Inscription : Avril 2025
    Messages : 509
    Par défaut Un juge rejette l'accord à 1,5 milliard de dollars conclu par Anthropic AI concernant les droits d'auteur
    Un juge rejette l'accord à 1,5 milliard de dollars conclu par Anthropic concernant un recours collectif sur les droits d'auteur de près d'un demi-million de livres piratés pour former des chatbots

    Un juge fédéral a récemment rejeté l'accord à 1,5 milliard de dollars entre Anthropic et les auteurs qui affirment que près d'un demi-million de livres ont été piratés illégalement pour former des chatbots, laissant planer le spectre d'un éventuel procès. Après avoir passé près d'une heure à critiquer un accord qu'il estime semé d'embûches, le juge fédéral William Alsup a fixé une nouvelle audience à San Francisco le 25 septembre afin d'examiner si ses préoccupations avaient été prises en compte.

    Début septembre,la société d'intelligence artificielle (IA) Anthropic a accepté de verser 1,5 milliard de dollars pour régler un recours collectif intenté par des auteurs qui affirmaient que l'entreprise avait volé leurs œuvres pour entraîner ses modèles d'IA. Selon les avocats des auteurs, cet accord, qui doit être approuvé par le juge fédéral américain William Alsup, serait le plus important recouvrement de droits d'auteur jamais rendu public. Anthropic a déclaré que l'accord « résoudrait les réclamations restantes des plaignants ».

    Cependant, le juge fédéral a récemment rejeté l'accord à 1,5 milliard de dollars entre Anthropic et les auteurs qui affirment que près d'un demi-million de livres ont été piratés illégalement pour former des chatbots, laissant planer le spectre d'un éventuel procès. Après avoir passé près d'une heure à critiquer un accord qu'il estime semé d'embûches, le juge fédéral William Alsup a fixé une nouvelle audience à San Francisco le 25 septembre afin d'examiner si ses préoccupations avaient été prises en compte.

    « Nous verrons si je peux me résoudre à l'approuver », a déclaré Alsup avant de lever l'audience. Le juge Alsup avait rendu en juin un jugement mitigé dans cette affaire, estimant que la formation des chatbots IA à partir de livres protégés par le droit d'auteur n'était pas illégale, mais qu'Anthropic avait acquis de manière illicite des millions de livres sur des sites web pirates afin d'améliorer son chatbot Claude.

    Les doutes du juge sont apparus quelques jours seulement après qu'Anthropic et les avocats qui ont intenté le recours collectif aient annoncé un accord à 1,5 milliard de dollars visant à résoudre les accusations de piratage et à éviter un procès qui devait débuter en décembre. L'accord proposé prévoit de verser aux auteurs et aux éditeurs environ 3 000 dollars pour chacun des livres couverts par l'accord.


    Justin Nelson, l'avocat des auteurs, a déclaré à Alsup qu'environ 465 000 livres figuraient sur la liste des œuvres piratées par Anthropic. Le juge a déclaré qu'il avait besoin de garanties plus solides que ce nombre n'augmenterait pas, afin de s'assurer que l'entreprise ne soit pas prise au dépourvu par d'autres poursuites judiciaires « sortant de nulle part ». Le juge a fixé au 15 septembre la date limite pour la remise d'une « liste définitive » du nombre total de livres piratés.

    La principale préoccupation d'Alsup portait sur la manière dont le processus de réclamation serait géré afin de s'assurer que toutes les personnes éligibles en soient informées et que les auteurs ne soient pas « lésés ». Il a fixé au 22 septembre la date limite pour le dépôt des formulaires de réclamation qu'il examinera avant l'audience du 25 septembre afin de réexaminer l'accord. Le juge a également fait part de ses inquiétudes concernant deux grands groupes liés à l'affaire, l'Authors Guild et l'Association of American Publishers, qui agissent « en coulisses » de manière à faire pression sur certains auteurs pour qu'ils acceptent l'accord sans le comprendre pleinement.

    La PDG de l'Authors Guild, Mary Rasenberger, et la PDG de l'Association of American Publishers, Maria Pallante, ont toutes deux assisté à l'audience, mais n'ont pas pris la parole. Le trio d'auteurs - la romancière Andrea Bartz et les auteurs de non-fiction Charles Graeber et Kirk Wallace Johnson - qui a intenté un procès l'année dernière était également assis au premier rang de la tribune du tribunal, mais ne s'est pas adressé à Alsup. Avant l'audience, Johnson, auteur de « The Feather Thief » et d'autres livres, a décrit l'accord comme « le début d'un combat au nom des humains qui ne croient pas que nous devions tout sacrifier sur l'autel de l'IA ».

    Nelson, l'avocat des auteurs, a tenu à assurer à Alsup que lui-même et les autres avocats chargés de l'affaire étaient convaincus que l'argent serait réparti équitablement, car l'affaire a été largement couverte par les médias, certains articles faisant la une des grands journaux. « Il ne s'agit pas d'une affaire de garantie passée inaperçue », a déclaré Nelson. Alsup a toutefois clairement indiqué qu'il se méfiait de l'accord et a averti qu'il pourrait décider de laisser l'affaire aller en procès. « Je suis mal à l'aise avec tous ces parasites qui se cachent dans l'ombre », a déclaré le juge.

    Cette affaire est suivie de près par l'industrie de l'IA. En effet, derrière cette affaire se joue un débat fondamental : l’IA peut-elle prospérer sur la base d’une appropriation massive de contenus protégés ? Et si la justice tranche sévèrement, l’impact pourrait être dévastateur non seulement pour Anthropic, mais pour l’ensemble du secteur. Si le jugement final confirme la culpabilité d’Anthropic, l’industrie pourrait entrer dans une ère de purge, où seuls les acteurs capables d’investir massivement dans l’achat de données survivront. Dans ce scénario, l’IA perdrait peut-être en diversité et en innovation, mais gagnerait en légitimité et en respect du droit d’auteur.

    Pourtant, Dario Amodei, cofondateur et PDG d'Anthropic, avait déclaré en janvier que l'IA pourrait surpasser les capacités humaines dans presque tous les domaines dans un avenir très proche. Il a ajouté que « les progrès sont vraiment aussi rapides que les gens le pensent ». Le chercheur a également déclaré que cette évolution permettrait à l'industrie de fabriquer de meilleurs robots, tout en forçant l'humanité à redéfinir la manière dont l'économie mondiale est organisée. Toutefois, son point de vue était controversé et qualifié d'argument marketing.

    Source : Le juge fédéral William Alsup

    Et vous ?

    Pensez-vous que cette décision est crédible ou pertinente ?
    Quel est votre avis sur le sujet ?

    Voir aussi :

    Anthropic remporte une victoire importante au sujet de « l'usage loyal » pour les plateformes d'IA, mais fait face à un procès pour des dommages-intérêts portant sur des millions d'œuvres piratées

    Les entreprises d'IA affirment qu'elles ne peuvent pas respecter les droits d'auteur mais ces chercheurs ont essayé, démontrant que former des modèles d'IA puissants sans enfreindre la loi, c'est possible

    Plus de 13 500 artistes se mobilisent pour dénoncer l'exploitation de leurs œuvres par les entreprises d'IA sans leur consentement. L'initiative met en lumière les pratiques controversées dans l'industrie
    Publication de communiqués de presse en informatique. Contribuez au club : corrections, suggestions, critiques, ... Contactez le service news et Rédigez des actualités

  5. #45
    Invité de passage
    Homme Profil pro
    Webmaster
    Inscrit en
    Septembre 2025
    Messages
    10
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 40
    Localisation : France, Bouches du Rhône (Provence Alpes Côte d'Azur)

    Informations professionnelles :
    Activité : Webmaster

    Informations forums :
    Inscription : Septembre 2025
    Messages : 10
    Par défaut oui
    oui normal qu'il l'ai rejeté

  6. #46
    Chroniqueur Actualités

    Homme Profil pro
    Administrateur de base de données
    Inscrit en
    Mars 2013
    Messages
    9 855
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Canada

    Informations professionnelles :
    Activité : Administrateur de base de données

    Informations forums :
    Inscription : Mars 2013
    Messages : 9 855
    Par défaut Comment Anthropic a créé Claude avec le Projet Panama : achat de livres physiques, section des reliures
    Comment Anthropic a créé Claude avec le Projet Panama : achat de livres physiques, section des reliures, scans des pages
    afin d'enrichir son IA avec une matière textuelle jugée plus « noble » que le flux chaotique du web

    Derrière les discours policés sur « l'intelligence artificielle responsable », des documents judiciaires récemment rendus publics dévoilent une réalité beaucoup plus brute : une industrie lancée dans une course effrénée pour absorber l’ensemble du patrimoine écrit mondial. Achat massif de livres papier, découpe industrielle, numérisation à grande échelle, mais aussi téléchargements de bibliothèques pirates : l’affaire dite Project Panama éclaire d’un jour cru la façon dont les grands acteurs de l’IA ont construit leurs modèles. Et pose, frontalement, la question du prix réel de l’innovation.

    Au cœur du dossier se trouve Anthropic, start-up devenue en quelques années l’un des piliers de l’IA générative. Selon des documents internes révélés dans le cadre d’un contentieux judiciaire, l’entreprise a lancé début 2024 un projet tenu volontairement secret : acheter des millions de livres physiques, en sectionner les reliures, scanner chaque page, puis recycler les ouvrages. L’objectif affiché en interne était clair : enrichir les modèles d’IA, notamment Claude, avec une matière textuelle jugée plus « noble » que le flux chaotique du web.

    Ce chantier titanesque, confié à des prestataires spécialisés dans la numérisation de masse, s’inspire directement de précédents célèbres dans la Silicon Valley. Anthropic a d’ailleurs recruté un ancien cadre de Google ayant participé au très controversé projet Google Books. Ici, la logique est poussée à l’extrême : le livre n’est plus un objet culturel, mais une ressource brute, transformée, ingérée, puis détruite.

    L'affaire Anthropic s'inscrit dans une vague de poursuites judiciaires intentées contre des entreprises d'IA par des auteurs, des artistes, des photographes et des organes de presse. Les documents déposés dans le cadre de ces affaires montrent que les grandes entreprises technologiques se livrent à une course effrénée, parfois clandestine, pour acquérir les œuvres collectées de l'humanité.

    Project Panama, ou l’industrialisation de la lecture

    Selon les documents déposés, en l'espace d'un an environ, l'entreprise aurait dépensé des dizaines de millions de dollars pour acquérir et découper la reliure de millions de livres, avant d'en scanner les pages afin d'alimenter en connaissances les modèles d'IA qui sous-tendent des produits tels que son célèbre chatbot, Claude.

    Les détails du projet Panama, qui n'avaient pas été divulgués auparavant, ont été révélés dans plus de 4 000 pages de documents dans le cadre d'un procès pour violation du droit d'auteur intenté par des auteurs de livres contre Anthropic, dont la valeur est estimée à 183 milliards de dollars par les investisseurs. La société a accepté de payer 1,5 milliard de dollars pour régler l'affaire en août, mais la décision prise la semaine dernière par un juge de district de lever les scellés sur une série de documents relatifs à l'affaire a révélé plus en détail la quête effrénée de livres menée par Anthropic.

    Les nouveaux documents, ainsi que les dossiers antérieurs dans d'autres affaires de droits d'auteur contre des entreprises d'IA, montrent les efforts déployés par des entreprises technologiques telles qu'Anthropic, Meta, Google et OpenAI pour obtenir des quantités colossales de données afin de « former » leurs logiciels.


    Pourquoi les livres valent de l’or pour les modèles d’IA

    Les échanges internes cités dans les dossiers judiciaires révèlent une obsession partagée par l’ensemble du secteur : les livres seraient le secret pour apprendre à une IA à « bien écrire ». Là où Internet regorge de contenus répétitifs, mal structurés ou approximatifs, les ouvrages publiés incarnent des styles, des structures narratives et une rigueur linguistique que les ingénieurs jugent indispensables.

    Cette conviction n’est pas propre à Anthropic. Chez Meta, des cadres évoquent l’accès à de vastes catalogues de livres comme une condition essentielle pour rester compétitif. Même raisonnement chez OpenAI ou Google, aujourd’hui également visés par des actions en justice similaires. Les livres sont devenus le carburant premium de l’IA générative.

    Les livres étaient considérés comme un enjeu crucial par ces entreprises, comme le montrent les dossiers judiciaires. Dans un document datant de janvier 2023, l'un des cofondateurs d'Anthropic a émis l'hypothèse que l'entraînement des modèles d'IA à partir de livres pourrait leur apprendre « à bien écrire » au lieu d'imiter « le langage de mauvaise qualité utilisé sur Internet ». Un e-mail interne de Meta datant de 2024 décrivait l'accès à une mine de livres numériques comme « essentiel » pour rester compétitif face à ses rivaux dans le domaine de l'IA.

    Mais les dossiers judiciaires suggèrent que les entreprises ne jugeaient pas pratique d'obtenir l'autorisation directe des éditeurs et des auteurs pour utiliser leurs œuvres. Au lieu de cela, Anthropic, Meta et d'autres entreprises ont trouvé des moyens d'acquérir des livres en vrac à l'insu des auteurs, selon les documents judiciaires, notamment en téléchargeant des copies piratées.

    L’angle mort du consentement et la tentation du piratage

    Le problème, c’est que négocier individuellement avec des éditeurs et des auteurs aurait pris des années, et coûté des sommes colossales. Les documents dévoilés montrent que plusieurs entreprises ont préféré des raccourcis beaucoup plus risqués : le téléchargement massif de bibliothèques dites « de l’ombre », comme LibGen, connues pour héberger des millions d’ouvrages piratés.

    Chez Meta, des ingénieurs ont exprimé par écrit leur malaise. Certains s’inquiètent de télécharger des torrents depuis des ordinateurs professionnels, d’autres redoutent les conséquences juridiques du partage involontaire de contenus piratés. Malgré ces alertes internes, les projets avancent. Une validation « après escalade » jusqu’à la direction générale, faisant référence à Mark Zuckerberg, est même mentionnée dans un courriel interne.

    Dans un document juridique récemment publié, Anthropic a révélé que le cofondateur Ben Mann avait personnellement téléchargé une grande quantité d'ouvrages de fiction et de non-fiction à partir d'une « bibliothèque fantôme » de livres et d'autres contenus enfreignant le droit d'auteur, appelée LibGen, pendant 11 jours en juin 2021. Une capture d'écran de son navigateur web incluse dans les documents montrait qu'il téléchargeait des fichiers à l'aide d'un logiciel de partage de fichiers.

    Un an plus tard, Mann a salué le lancement en juillet 2022 d'un nouveau site web appelé Pirate Library Mirror, qui prétendait disposer d'une immense base de données de livres et déclarait « violer délibérément la loi sur le droit d'auteur dans la plupart des pays ». Mann a envoyé un lien vers le site à d'autres employés d'Anthropic avec le message « juste à temps !!! ».

    Anthropic a déclaré dans des documents juridiques que la société n'avait jamais formé de modèle d'IA commercial générant des revenus à partir de ses données LibGen et n'avait jamais utilisé Pirate Library Mirror pour former un modèle d'IA complet.

    Ed Newton-Rex, ancien cadre dans le domaine de l'IA et compositeur de musique qui dirige aujourd'hui une organisation à but non lucratif défendant les droits des créateurs, a déclaré que ces révélations soulignaient le fait que les entreprises d'IA avaient une dette plus importante envers les créateurs qu'elles ne l'avaient jusqu'à présent. « Nous avons besoin de toute urgence d'une réinitialisation de l'ensemble du secteur de l'IA, afin que les créatifs commencent à être rémunérés équitablement pour leurs contributions essentielles », a-t-il déclaré.

    Google, Microsoft et OpenAI, le fabricant de ChatGPT, font également l'objet de poursuites judiciaires pour violation du droit d'auteur de la part d'auteurs de livres qui formulent des allégations similaires.

    Nom : claude.png
Affichages : 6331
Taille : 48,9 Ko

    La justice tranche… partiellement

    Sur le fond, plusieurs décisions récentes ont surpris observateurs et ayants droit. Des juges américains ont estimé que l’utilisation de livres pour entraîner des modèles d’IA pouvait relever du fair use, au motif que le processus serait « transformateur ». Comparaison est faite avec un enseignant qui apprend à écrire à ses élèves, sans reproduire mot pour mot les œuvres étudiées.

    Mais cette tolérance a des limites. Dans le cas d’Anthropic, si la numérisation de livres achetés légalement a été jugée recevable, l’acquisition préalable de millions d’ouvrages piratés a, elle, posé problème. Résultat : un accord transactionnel à 1,5 milliard de dollars pour éviter un procès, avec une indemnisation estimée à quelques milliers de dollars par titre pour les auteurs concernés.

    La plupart des poursuites judiciaires intentées contre des entreprises spécialisées dans l'IA sont toujours en cours, et James Grimmelmann, professeur de droit numérique et de l'information à Cornell Tech, a déclaré que les questions qu'elles soulèvent restent encore sans réponse sur le plan juridique. Mais dans deux décisions rendues récemment, les juges ont estimé que l'utilisation par les entreprises technologiques de livres pour entraîner des modèles d'IA sans l'autorisation de l'auteur ou de l'éditeur pouvait être légale en vertu d'une doctrine du droit d'auteur connue sous le nom de « fair use » (usage loyal).

    En juin, le juge William Alsup a estimé qu'Anthropic était en droit d'utiliser des livres pour entraîner des modèles d'IA, car ceux-ci traitent le matériel de manière « transformative ». Il a comparé le processus d'entraînement de l'IA à celui des enseignants qui « apprennent aux écoliers à bien écrire ». Le même mois, le juge Vince Chhabria a estimé dans l'affaire Meta que les auteurs des livres n'avaient pas démontré que les modèles d'IA de l'entreprise pouvaient nuire aux ventes de leurs livres.

    Mais les entreprises peuvent tout de même avoir des ennuis en raison de la manière dont elles ont acquis les livres. Dans le cas d'Anthropic, le projet de numérisation des livres a été jugé recevable, mais le juge a estimé que l'entreprise avait peut-être enfreint les droits d'auteur des auteurs en téléchargeant gratuitement des millions de livres piratés avant de lancer le projet Panama.

    Une industrie sous tension éthique et politique

    Au-delà des montants, ces révélations exposent une fracture profonde entre le discours public des entreprises d’IA et leurs pratiques internes. Les dirigeants plaident l’innovation, la transformation et le progrès collectif. Les documents judiciaires racontent plutôt une industrie « verrouillée » dans une compétition à très haute intensité, où chaque retard technologique peut coûter des milliards de valorisation.

    Pour les défenseurs des créateurs, le signal est clair : l’IA s’est construite sur une dette culturelle massive, encore très imparfaitement reconnue. Pour les juristes, le droit d’auteur entre dans une zone grise où l’entraînement des machines bouscule des principes établis depuis des décennies. Et pour le secteur lui-même, Project Panama pourrait devenir un cas d’école : celui d’un virage tardif vers des méthodes plus conformes à la loi, une fois la tempête judiciaire déclenchée.

    Ce qui se joue ici dépasse largement Anthropic ou Meta. C’est la question de savoir si l’intelligence artificielle du futur se développera dans un cadre contractuel et transparent, ou si elle continuera à avancer en terrain miné, en absorbant le patrimoine intellectuel mondial avant que les règles ne soient clairement posées.

    Source : documents judiciaire (1, 2, 3, 4, 5, 6), Anthropic

    Et vous ?

    Cela vous semble-t-il crédible ? Êtes-vous surpris ou pas du tout ?

    Peut-on encore parler « d'innovation responsable » quand des modèles d’IA ont été entraînés à partir de livres piratés téléchargés en masse, en toute connaissance des risques juridiques ?

    Le concept de fair use est-il réellement adapté à des systèmes industriels capables d’absorber et de réexploiter des millions d’œuvres, ou sert-il aujourd’hui de paravent légal à une prédation culturelle à grande échelle ?

    Les auteurs et éditeurs doivent-ils être rémunérés a posteriori, ou faut-il imposer un consentement explicite et contractuel avant toute utilisation de leurs œuvres par des IA commerciales ?

    Les entreprises d’IA auraient-elles pu exister sans l’accès massif et non négocié au patrimoine écrit mondial, ou cette dépendance révèle-t-elle une fragilité structurelle de leurs modèles économiques ?

    En validant l’usage transformateur des œuvres protégées, la justice ne crée-t-elle pas un précédent dangereux pour d’autres industries fondées sur l’extraction de contenus culturels ?

    Les utilisateurs finaux d’IA générative doivent-ils être informés de l’origine exacte des données ayant servi à entraîner les modèles qu’ils utilisent au quotidien ?
    Contribuez au club : Corrections, suggestions, critiques, ... : Contactez le service news et Rédigez des actualités

Discussions similaires

  1. Réponses: 295
    Dernier message: 26/09/2025, 18h59
  2. Réponses: 0
    Dernier message: 09/07/2024, 12h47
  3. Réponses: 0
    Dernier message: 24/05/2023, 17h58
  4. Réponses: 50
    Dernier message: 29/06/2021, 11h26
  5. Réponses: 0
    Dernier message: 03/06/2020, 12h18

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo