Les sujets d’actualité ne manquent pas pour un éditorialiste. À l’heure où j’écris ces lignes, nous sommes à quelques heures de la cérémonie d’investiture du président Trump qui représente un évènement...
Par Étienne Boursican, associé chez De Pardieu Brocas Maffei Et Alexandre Zuber, collaborateur chez De Pardieu Brocas Maffei Le Listing Act est un corpus de textes européens à l’objectif double et...
Magali Lafourcade, secrétaire générale de la Commission nationale consultative des droits de l’homme En décembre dernier, la Semaine juridique consacrait son édito à un jugement de la 13e chambre correctionnelle...
Les plaintes introduites devant la Cour de justice de la République contre Édouard Philippe, Agnès Buzyn et Olivier Véran pour leur gestion du Covid ont fini par « faire pschitt ». Le 30 octobre dernier...
Le monde juridique évolue , et avec lui, les attentes des clients . Entre gestion des volumes, exigences en matière de transparence et de réactivité, et contraintes légales, les cabinets d’avocats doivent...
La transparence est bien souvent la condition de l'effectivité des droits. L'assertion relève de l'évidence. Et pourtant... Dans une opposition stérile entre innovation et régulation, le législateur a failli renoncer à la transparence en matière d'intelligence artificielle (IA). En quelques mots, les modèles d'IA - comme Chat- GPT, Sora, Gemini... - apprennent grâce à un entraînement sur des grandes quantités de données. À ce stade, on sait que la qualité du modèle dépend en partie de la qualité des données. Notamment, l'entraînement à partir de données synthétiques, c'est-à-dire générées par d'autres modèles d'IA, conduit à terme à la dégénérescence du modèle. En outre, si l'utilisation de contenus du domaine public peut constituer une expérience intéressante, elle ne permet pas de créer un outil pertinent, répondant aux besoins contemporains. Enfin, certains spécialistes pointent la saturation des performances des grands modèles de langage en raison du manque de données, celles « disponibles » ayant en grande majorité été exploitées.
Aussi, la collecte et l'utilisation de données de qualité, qui reflètent la créativité humaine, constituent un enjeu essentiel à la survie même de la technologie. Ces données de qualité bénéficient souvent de la protection du droit d'auteur ou des droits voisins - ensemble romans, vidéos, images, musiques, contenus de presse... Or les conditions actuelles d'utilisation de ces objets protégés ne sont pas satisfaisantes. Si la directive 2019/790 sur le droit d'auteur dans le marché unique numérique a bien prévu une exception de fouille de textes et de données, pour tous les acteurs et tous les usages - y compris commerciaux -, qui semble couvrir l'opération d'entraînement des modèles d'IA, c'est à la condition que le bénéficiaire ait eu un accès licite aux contenus et que le titulaire de droits n'ait pas exercé son opt out - ou clause de réservation de droits, qui permet un retour au monopole et donc au principe d'autorisation (et de rémunération). C'est là qu'intervient la nécessaire transparence. Comment savoir si le fournisseur d'IA a eu un accès licite aux contenus, qu'il n'a pas utilisé de contenus protégés sans autorisation ?
Pour répondre à cette situation de blocage, le Règlement européen sur l'IA impose aux fournisseurs une obligation de transparence qui se traduit par la mise en place d'une politique interne de respect de l'acquis communautaire en matière de droit d'auteur et de droits voisins et la mise à disposition d'un « résumé suffisamment détaillé » des contenus ayant servi à l'entraînement. Que cache cet oxymore en plus de révéler le lobbying incroyable exercé sur cette disposition légale ?
Pour donner à l'exigence légale un « effet utile », comme le préconise souvent la CJUE, le rapport du CSPLA (Conseil Supérieur de la Propriété Littéraire et Artistique - Rapport de mission du CSPLA sur la mise en œuvre du RIA) suggère une lecture globale et finaliste des dispositions. Remis à la ministre de la Culture le 9 décembre, il a vocation à participer à la réflexion sur la position de la France au sujet du canevas de résumé qui devra être proposé dans quelques semaines par le Bureau de l'IA, organe de la Commission européenne.
Dans ce cadre, l'obligation de transparence a vocation à permettre aux parties qui y ont intérêt d'exercer et de faire respecter leurs droits. Elle est cependant limitée par le secret des affaires qui bénéficie aux entreprises d'IA. Dès lors, le résumé des sources d'entraînement doit être complet en termes de contenu mais non sur les techniques utilisées (tokenisation, méthodes de filtrage...). En résumé : les ingrédients, mais pas la recette !
À la veille des fêtes de fin d'année, la métaphore culinaire s'imposait. Bonnes fêtes à toutes et tous. Dans la vie réelle.
Tous les champs marqués d'un astérisque (*) sont obligatoires