
Meta suspend ses efforts pour obtenir des licences de livres à des fins d’IA
De récents documents judiciaires apportent du crédit aux informations selon lesquelles Meta aurait suspendu ses discussions avec les éditeurs de livres concernant l'obtention de licences pour alimenter en données d'entraînement certains de ses modèles d'intelligence artificielle générative.
Ces documents sont liés à l'affaire Kadrey v. Meta Platforms, l'un des nombreux litiges qui opposent actuellement les entreprises d'IA aux auteurs et autres détenteurs de propriété intellectuelle. Dans la plupart des cas, les défendeurs - les sociétés d'IA - affirment que l'entraînement sur du contenu protégé par le droit d'auteur relève du « fair use » (usage raisonnable). Les plaignants - titulaires de droits - s'y opposent fermement.
Des négociations de licences laborieuses
Selon les retranscriptions partielles des dépositions des employés de Meta, certains d'entre eux estimaient que la négociation de licences de données d'entraînement basées sur des livres n'était pas réalisable à grande échelle. Sy Choudhury, responsable des partenariats IA chez Meta, a indiqué que leurs sollicitations auprès de divers éditeurs se sont heurtées à « très peu d'intérêt et d'engagement ».
Nous avions dressé une longue liste des principaux éditeurs en parcourant Internet, mais nous n'avons pas eu beaucoup de retours sur nos démarchages à froid pour établir un contact.
Sy Choudhury, responsable des partenariats IA chez Meta
Pause des efforts en avril 2023
Meta aurait suspendu certains efforts de licence de livres liés à l'IA début avril 2023, suite à des contretemps de « timing » et autres obstacles logistiques. Sy Choudhury a précisé que des éditeurs, en particulier dans la catégorie fiction, se sont avérés ne pas détenir les droits sur le contenu que Meta envisageait sous licence.
Nous avons rapidement appris que la plupart des éditeurs de fiction avec qui nous parlions ne possédaient en fait pas les droits pour nous accorder une licence sur les données. Il faudrait donc beaucoup de temps pour engager des discussions avec tous leurs auteurs.
Sy Choudhury, responsable des partenariats IA chez Meta
Des « bibliothèques pirates » pour entraîner l'IA ?
La dernière plainte modifiée soumise par les avocats des plaignants allègue que Meta aurait recoupé certains livres piratés avec des œuvres sous droits d'auteur disponibles sous licence, afin de déterminer la pertinence de poursuivre un accord avec un éditeur.
Meta est aussi accusée d'avoir utilisé des « bibliothèques fantômes » contenant des e-books piratés pour entraîner plusieurs de ses modèles d'IA, dont sa populaire série de modèles « ouverts » Llama. Selon la plainte, Meta aurait pu se procurer certaines de ces bibliothèques via du torrenting (partage de fichiers pair-à-pair), ce qui constituerait une forme de violation du droit d'auteur selon les plaignants.
Quelles implications pour l'IA générative ?
Cette affaire soulève des questions cruciales pour le développement futur de l'IA générative :
- Comment concilier le besoin de vastes jeux de données d'entraînement avec le respect de la propriété intellectuelle ?
- Les entreprises d'IA peuvent-elles invoquer le « fair use » pour utiliser du contenu protégé sans licence ?
- Quel modèle économique mettre en place pour rémunérer équitablement les créateurs de contenus exploités par l'IA ?
Au-delà de Meta, c'est toute l'industrie de l'IA générative qui est confrontée à ces défis, à l'heure où les modèles de langage et autres systèmes d'IA deviennent omniprésents. Il est essentiel de trouver un équilibre entre innovation technologique et protection des droits, afin d'assurer un écosystème durable et éthique pour le développement de l'intelligence artificielle.
Les litiges en cours, comme celui impliquant Meta, seront déterminants pour façonner le cadre juridique et les pratiques du secteur. Auteurs, éditeurs et acteurs de l'IA devront œuvrer main dans la main pour imaginer de nouveaux modèles, conciliant le besoin de données d'entraînement de qualité et la juste rétribution des créateurs. Un vaste chantier qui ne fait que commencer.