• Feite Kraay, Author |
10 minutes de lecture

Ma carrière de musicien a été brève et sans éclat, se limitant à quelques années comme trombone basse dans l’orchestre de mon école secondaire. Je ne possède aucun talent musical. C’est probablement par compassion – et par gratitude envers mes frères plus talentueux qui faisaient partie de l’orchestre – que le professeur de musique m’a confié un rôle où mes notes monocordes seraient les moins dérangeantes. Si je mentionne cela, c’est uniquement parce que le cours de musique a également été ma première introduction aux subtilités de la loi sur le droit d’auteur. Un soir où il me manquait une partition pour la répétition, j’ai demandé à un ami de m’en faire une photocopie. On m’a dit que c’était impossible, car l’école n’avait payé que pour un certain nombre de partitions, et qu’en dépassant ce nombre, elle violerait les droits d’auteur de l’éditeur et du compositeur.

Avez-vous remarqué le titre de ce billet? Il s’agit de l’une des répliques les plus connues de William Shakespeare, tirée de Roméo et Juliette. Heureusement pour moi, l’œuvre de Shakespeare fait partie du domaine public et je ne peux donc pas être accusé d’enfreindre la loi sur le droit d’auteur. Et si vous avez la patience de poursuivre votre lecture, vous verrez que j’utilise cette réplique (et d’autres) d’une manière nouvelle et – j’ose espérer – originale, ce qui m’évitera aussi toute accusation de plagiat.

Quand la mort parle, ce n’est pas pour l’amour le moment de parler*
Le droit d’auteur est le principe de base établissant le droit exclusif d’exploitation d’une œuvre par son auteur ou son créateur. Cette propriété intellectuelle peut être vendue ou échangée, mais uniquement avec le consentement explicite de l’auteur. Par exemple, lorsque j’ai choisi de travailler pour KPMG au Canada, j’ai cédé au cabinet mes droits d’auteur et la propriété de ce billet et de mes autres billets. Le plagiat consiste à faire passer le travail original de quelqu’un d’autre pour le sien, sans attribution ni modification. Certaines informations récentes, ainsi que les grèves en cours (à l’heure où j’écris ces lignes) des scénaristes et des acteurs d’Hollywood, me donnent à penser qu’il y a quelque chose dans la manière dont l’IA générative est construite, alimentée et utilisée qui pourrait avoir d’importantes répercussions juridiques liées au risque de violation du droit d’auteur et de plagiat.

Les points les plus épineux au cœur de la grève des scénaristes concernent la propriété et la rémunération. Les scénaristes – et, en fait, tous les créateurs de contenu, y compris les artistes visuels – craignent, à juste titre, que l’IA puisse générer un contenu qui reproduise la voix ou le style visuel original d’un artiste lorsqu’elle est entraînée à partir d’un ensemble suffisamment important de données préexistantes. Les producteurs pourraient en effet utiliser l’IA générative pour créer de nouveaux scénarios basés sur les travaux antérieurs des écrivains. Cela pourrait-il être considéré comme du plagiat? Comment s’appliquent les lois sur la protection du droit d’auteur sur l’œuvre préexistante dans un tel cas? Ces questions n’ont pas encore été tranchées par les tribunaux, mais les scénaristes estiment que leur droit à une juste rémunération pour leur travail est en jeu. Et le problème dépasse largement Hollywood : tout auteur, musicien ou artiste qui publie ne serait-ce qu’un extrait de son œuvre en ligne pourrait devenir, à son insu, une source d’alimentation pour des systèmes d’IA générative commerciaux qui pourraient ensuite imiter son style.

Les acteurs ont rapidement emboîté le pas aux scénaristes. Par solidarité, mais aussi parce que, bien que différentes, leurs préoccupations sont du même ordre. Les producteurs pourraient en effet utiliser des enregistrements de scènes déjà tournées et créer, au moyen de l’IA, des scènes entièrement nouvelles basées sur certains traits ou manières, et sur le style de l’acteur. Il ne s’agit peut-être pas tant d’une question de plagiat que de contrôle de la propriété intellectuelle. Quel degré de contrôle un acteur devrait-il pouvoir exercer sur un travail dérivé comme celui-ci, et quelle rémunération devrait-il en retirer?

Trébuche qui court vite*
L’enjeu va beaucoup plus loin que le fait pour quelques superstars de se voir retrancher un zéro sur leurs astronomiques cachets. Les moyens de subsistance des acteurs et des autres professionnels du spectacle, tout comme ceux des écrivains, des artistes et de tous les auteurs de contenu original, quel qu’il soit, sont menacés. S’il ne s’agissait que de la perte potentielle d’emplois, du fait que l’IA puisse simplement faire le travail d’un professionnel de la création de manière plus rentable, j’aurais moins de sympathie. Comme je l’ai déjà mentionné, toutes les industries, y compris la haute technologie elle-même, ont subi l’impact de la technologie sur l’emploi – et le secteur de la création ne devrait pas être différent à cet égard. Non, le vrai problème concerne la propriété et le contrôle de l’œuvre et de l’identité de chacun, ainsi que la juste rémunération du travail antérieur, et c’est une question qui mérite d’être examinée de plus près.

L’IA générative ne produit pas de contenu original et – je le précise – elle n’a pas été utilisée pour produire le présent contenu… Mais qu’est-ce au juste que l’IA générative? Il s’agit d’un grand modèle de langage conçu pour imiter la conversation humaine dans une langue naturelle. Sa tâche consiste à proposer la meilleure réponse à une demande de l’utilisateur final. Elle doit, pour cela, être « entraînée », c’est-à-dire qu’on doit l’alimenter avec un maximum de contenu préexistant provenant du plus large éventail de sources possible. Une fois ce contenu organisé et indexé, le système est en mesure d’élaborer rapidement une réponse plausible à toute question qui lui est posée. Plus le système d’IA est polyvalent, plus ses données d’entraînement doivent être étendues, jusqu’à ce qu’elles comprennent pratiquement tout ce qui a été publié sur Internet. Une version antérieure d’un système populaire limitait au moins cette possibilité à tout ce qui était publié jusqu’en 2021, mais cette limite n’est plus en vigueur.

Quel est le rapport avec le droit d’auteur et la propriété intellectuelle? On pourrait faire valoir – et on l’a déjà fait – qu’en construisant ses réponses, l’IA générative utilise le contenu original d’autres personnes sans autorisation ni attribution. En outre, les règles de sélection et de combinaison des éléments sont souvent si complexes et obscures qu’il n’est pas évident de savoir comment le système est parvenu au résultat obtenu ni même s’il est possible d’attribuer sa production à qui que ce soit en particulier. À l’heure où nous écrivons ces lignes, un grand journal américain envisage de poursuivre en justice un célèbre développeur d’IA générative pour cette même raison. Le journal affirme qu’il n’a pas explicitement consenti à ce que son contenu journalistique et éditorial, qu’il soit accessible au public ou par abonnement payant, soit réutilisé par l’IA générative, et qu’en l’absence d’un tel consentement, il doit être indemnisé pour cette utilisation.

Je ne suis pas avocat, mais je ne pense pas que l’IA générative aurait de bonnes chances de remporter une victoire claire si l’affaire était portée devant les tribunaux. Cette hypothétique action en justice repose sur les mêmes revendications que les grèves du secteur du divertissement, soit la propriété, l’utilisation et la rémunération du matériel protégé par le droit d’auteur qui sont, à mon avis, des préoccupations tout à fait légitimes. J’ajouterais même ceci : tous les livres et journaux ne sont pas équivalents, et il ne semble pas y avoir beaucoup de contrôle, voire aucun, sur la qualité du matériel qui alimente l’IA générative, aggravant ainsi le risque réel d’inexactitude et de partialité. Si l’IA générative utilise illégitimement le matériel source d’autres personnes et que ses réponses s’avèrent peu fiables, pourquoi dans ce cas se donner la peine de l’utiliser?

La folie la plus raisonnable*
Je reviendrai sur cette question, car il existe peut-être des solutions prometteuses. Mais j’aimerais d’abord attirer votre attention sur les résultats étonnants d’un récent sondage de KPMG sur l’utilisation de l’IA générative au Canada, révélant que :

  • 52 % des étudiants canadiens de 18 ans et plus reconnaissent utiliser l’IA générative pour les aider dans leurs travaux scolaires, même si 60 % d’entre eux estiment que son utilisation constitue de la tricherie. (Il existe un chevauchement intéressant : une certaine proportion, au moins 12 % et peut-être plus, utiliserait donc l’IA générative en dépit de ses réticences.)
  • 69 % des étudiants s’approprient – systématiquement ou occasionnellement – les résultats produits par l’IA générative.
  • Seulement 37 % vérifient toujours l’exactitude des résultats générés par l’IA générative avant de les utiliser.

Ces statistiques m’inquiètent, car il m’est extrêmement désagréable de penser que l’IA puisse contribuer à une culture de paresse intellectuelle dans nos universités. Je sais bien que le plagiat universitaire n’est pas nouveau, mais l’IA générative le rend beaucoup trop accessible et plus difficile à détecter. J’ai parlé à des amis et à des parents qui travaillent dans l’enseignement, et ils partagent tous les mêmes préoccupations. L’IA transforme l’éducation à un rythme effréné, et il faudra beaucoup de temps avant qu’on trouve des solutions vraiment efficaces à ces problèmes.

Revenons au titre de ce billet : lorsque Juliette dit que « ce que nous appelons une rose embaumerait autant sous un autre nom », elle suggère que si Roméo s’appelait Smith ou Jones au lieu de Montague, elle l’aimerait tout autant – et qu’en l’absence de toute intrigue familiale, leur amour serait beaucoup plus facile à assouvir. Qu’en est-il du plagiat sous une autre forme? Parce qu’il est combiné à des travaux provenant de nombreuses autres sources, le corpus utilisé par l’IA générative ne reprend pas mot pour mot le travail d’un autre auteur, mais il utilise néanmoins ces travaux sans les citer, et les présente comme s’il s’agissait des siens. Peut-être avons-nous besoin d’un nouveau terme pour cela, mais je pense que les écrivains et autres créateurs de contenu ont raison de s’inquiéter de l’utilisation qui est faite de leur travail. Lorsqu’un étudiant ou toute autre personne utilise les résultats de l’IA générative en les présentant comme son propre travail – et même si certains prétendront qu’on ne peut plagier une machine –, la pratique est tout de même malhonnête sur le plan intellectuel. Le plagiat, quel que soit le nom qu’on lui donne, reste du plagiat.

La lumière qui jaillit par cette fenêtre*
Alors, quelle est la solution? Plus le champ d’application de l’IA est large, plus il est difficile de détecter le contenu généré par l’IA. À l’inverse, plus il est étroit, comme dans le cas des scénaristes et des acteurs, plus il est facile de voir le problème – et de s’y attaquer. Une partie de la solution, surtout si le champ d’application est vaste, réside dans la réglementation. KPMG, à l’instar de nombreuses autres sociétés de services professionnels, a déjà publié des règles claires régissant l’utilisation de l’IA générative au travail. Bien qu’il soit acceptable de recourir à l’IA générative comme source d’idées, les résultats ne doivent jamais être utilisés tels quels dans un travail livrable aux clients, et les professionnels doivent toujours s’assurer que ces résultats ne contiennent pas d’erreurs ni de parti pris. Même si cela repose sur un code d’honneur, car il n’est pas toujours possible de repérer le contenu généré par l’IA, c’est un pas dans la bonne direction dont les établissements d’enseignement devraient s’inspirer.

Pour l’instant, je ne peux que suggérer aux utilisateurs de l’IA accessible au grand public d’appliquer la règle « caveat emptor » en espérant qu’une plus grande sensibilisation aux risques les incitera à faire preuve de prudence et de responsabilité dans leur utilisation de l’IA générative. L’éventuelle tenue du procès dont j’ai parlé plus haut et une issue qui serait favorable au journal pourraient avoir des conséquences radicales. Si les propriétaires des contenus originaux utilisés par l’IA générative devaient être identifiés, indemnisés, voire exercer un droit de retrait, c’est tout le modèle économique de l’IA générative commerciale qui s’effondrerait et l’architecture de la technologie elle-même serait entièrement à repenser.

En revanche, plus nous réduisons le champ d’application, plus nous pouvons contrôler la manière dont l’IA générative est alimentée et utilisée. Serait-il possible de se concentrer sur des systèmes d’IA à petite échelle dans des domaines spécifiques? Les oncologues, par exemple, pourraient convenir d’un ensemble limité de documents médicaux nécessaires pour nourrir un système d’IA qui aiderait les chercheurs et les diagnostiqueurs à détecter et à traiter différents types de cancers. Les ingénieurs pourraient définir un domaine de connaissances similaire pour des types particuliers de travaux de construction, et il en irait de même pour les scientifiques collaborant à un projet de recherche. Des systèmes d’IA fermés comportant des dispositions supplémentaires sur la gestion des données confidentielles ou protégées sont également en cours de construction et d’essai au sein de la profession juridique.

L’obtention d’un consensus autour des domaines de connaissance de systèmes d’IA utilisés à des fins spécifiques faciliterait la gestion des questions de droit d’auteur, d’attribution et de rémunération au sein de la communauté des utilisateurs. La propriété du produit ou des résultats générés resterait tout de même à établir et nécessiterait une évaluation approfondie des prétentions à ce titre des clients, des fournisseurs de logiciels et des professionnels. Quoi qu’il en soit, il s’agit là d’un bon point de départ pour démontrer que l’IA générative peut être utile et équitable, et peut-être pour définir son orientation future.

*Traduction de François-Victor Hugo des Œuvres complètes de Shakespeare, Pagnerre, 1868.

Publication multilingue

Cette publication est aussi offerte dans les langues suivantes :

Tenez-vous au courant de sujets qui vous intéressent.

Inscrivez-vous aujourd’hui pour avoir accès à du contenu personnalisé en fonction de vos intérêts.