Existe-t-il une IA créative ?

La créativité est-elle uniquement une compétence détenue par l’homme, ou bien sa reproduction est-elle envisageable grâce aux GANs ?

Image credit: Creative Adversial Network

Abstract

L’un des nombreux défis de l’intelligence artificielle est d’attribuer aux programmes informatiques des compétences cognitives proches de ceux des êtres vivants. Il est très difficile pour une machine d’apprendre à penser de manière créative. Les machines sont totalement rationnelles contrairement aux humains. Ces dernières réalisent exactement ce que l’humain lui demande de faire. Or le processus de création est un concept abstrait que même l’homme a du mal à comprendre. Ainsi, enseigner la créativité à une machine informatique se révèle être un véritable challenge.

Sommaire

1. Introduction

De nos jours, les champs d’application de la science des données ne cessent de s’élargir. On connaît déjà des systèmes d’IA qui arrivent à classer et prédire, il se trouve qu’il en existe également qui deviennent créatives. En effet, l’objectif de l’intelligence artificielle ne se résume plus uniquement à classer des données. Maintenant, son objectif est bel et bien d’en générer, grâce à un type de réseau de neurones très prometteur : les réseaux antagonistes génératifs appelés GAN. Les performances des GANs ont attiré de nombreux chercheurs dans le domaine de l’IA. Certains d’entre eux ont souligné leur puissance. A titre d’exemple, Yann Le Cun, directeur de l’équipe de recherche de Facebook dans le domaine de l’Intelligence Artificielle considère le GAN comme « l’une des idées les plus intéressantes des 10 dernières années en Machine Learning ».

Cela nous amène à nous demander si la créativité est uniquement une compétence détenue par l’homme, ou bien sa reproduction est-elle envisageable grâce aux GANs ?

Pour répondre à la problématique, il convient d’abord d’étudier l’ensemble des techniques créatives propres aux GANs à travers différents domaines d’application, pour ensuite comprendre la différence qui existe entre la créativité que proposent les GANs et la créativité de l’homme. Enfin, il conviendra de tirer des conclusions pour évaluer la place laissée par les GANs à la créativité de l’homme au sein d’un processus d’idéation.

Avant d’avancer des arguments pouvant apporter des éléments de réponses à la problématique, il est d’abord nécessaire de définir clairement ce qu’est la créativité. Celle-ci correspond à la capacité d’un individu à imaginer un concept nouveau, original et singulier.

2. Un GAN: C’est quoi ?

Dès les premiers travaux scientifiques dédiés à l’IA, les scientifiques ont exploré les capacités de la machine pour générer des objets créatifs tels que pourrait le faire un humain. Ils ont réussi à mettre au point plusieurs méthodes créatives qui s’appuient essentiellement sur des réseaux de neurones génératifs convolutifs (CNN). Ces derniers peuvent interpoler des éléments déjà connus ou bien associer plusieurs contenus existants pour en créer des nouveaux. Une architecture prometteuse est particulièrement très utilisée pour générer des images. Il s’agit du réseau antagoniste génératif appelé GAN (Generative Adversial Network). Il est composé de deux réseaux de neurones artificiels. Le générateur constitue l’élément moteur du processus de création. En effet, c’est par le biais du générateur que s’exprime tout le talent créatif d’un GAN. Par conséquent, c’est à lui qu’il revient d’enseigner le concept de la créativité. A l’inverse, le discriminateur va décider de la voie créative que le générateur devra suivre. Ce dernier oriente la créativité du générateur en lui donnant des retours très utiles. Mais aussi, il resserre la vision créative du générateur pour éviter qu’il ne produise quelque chose dénuée de sens.

De manière plus concrète, l’objectif du GAN est de synthétiser du mieux possible des objets complexes comme des images ayant des caractéristiques similaires à ceux d’une liste d’exemples. En d’autres termes, le GAN doit aboutir à la contrefaçon de données la plus réaliste possible. Ainsi on peut penser que les opérations du GAN se résument à du simple copier-coller des données qui lui sont fournies en exemple. Or ceci n’est pas le cas, l’atout des modèles génératifs comme le GAN est d’intégrer une notion de régularité qui revient à interpoler entre les exemples qui lui sont fournis. L’idée étant que le GAN puisse introduire certaines différences au sein de l’image générée par rapport aux exemples d’apprentissage dont seul le discriminateur à accès. Malgré cela on peut se demander si s’inspirer de l’existant revient à être créatif. De nos jours, il existe de nombreuses variantes des GANs (conditional GAN, cycle GAN, Pix2Pix, PAN, E-GAN…) pour des usages différents. Ces variantes tentent de repousser les limites de la créativité du GAN conventionnel. Elles reposent sur le même fonctionnement de base que le GAN à quelques détails près. A l’inverse des GANs qui génèrent des images de manière aléatoire, ces variantes ont la capacité de créer des images beaucoup plus exotiques à partir d’un ensemble de données qui est fourni en entrée au générateur. Par exemple, la variante Pix2Pix peut transformer un dessin numérique créé par l’homme en une image photo-réaliste. C’est une technique qui pourrait être très utile pour les outils de design et de prototypage. Cependant, à travers cet exemple, l’idée originale ne provient pas directement de l’outil technologique mais bel et bien de l’homme. En effet, ce dernier doit d’abord dessiner l’objet de départ avant qu’il soit retranscrit dans le réel. On s’aperçoit que le GAN et ses variantes parviennent plutôt bien à générer des éléments usuels ou faire des reproductions. A l’inverse ces derniers n’arrivent pas à créer quelque chose d’unique et d’original. Ce qui est contraire à la définition de la créativité.

Source weave.eu – esquisse et image photo-réaliste crée via l’outil Pix2Pix
Source weave.eu – esquisse et image photo-réaliste crée via l’outil Pix2Pix

3. Des applications directes du GAN

Dans le domaine de l’art graphique, les réseaux de neurones génératifs sont très utilisés. En combinant plusieurs images, le modèle génératif est capable de créer des images vraisemblables. Par exemple, il est possible de transposer le style d’une peinture à une image. Toutefois, pour produire une image, l’IA générative ne part jamais de zéro, elle s’appuie toujours sur des images existantes pour en imaginer une nouvelle. Des sites internet proposant des services de création de logo comme par exemple logomaster.ai tirent aussi profit de l’intelligence artificielle. Aussi l’utilisateur choisit parmi plusieurs styles, les 5 styles qui lui plaisent le plus et indique le nom de l’entreprise, le slogan et la couleur. Sur cette base, le système propose un logo. Nous pouvons émettre un doute sur l’aspect créatif de ce service car le nom de l’entreprise et le slogan sont finalement le fruit de l’imagination humaine. Dans le domaine musical, on utilise également l’intelligence artificielle pour composer de la musique. Par exemple, AIVA est un système qui compose aléatoirement de la musique en combinant plusieurs partitions musicales. Comme pour l’art graphique, ici aussi on utilise des éléments existants d’origine humaine pour produire quelque chose de nouveau. Par ailleurs, Armand Leroi, chercheur à la BBC avait essayé de dresser les caractéristiques qui font la réussite des hits de la musique pop. Avec l’aide d’algorithmes de machine learning ce dernier avait essayé d’analyser un grand volume de « pop music » afin d’extraire le rythme et les sonorités majeures des hits. Malheureusement, il n’a jamais vraiment été en capacité de cerner la « sauce magique » pour produire des hits. Il s’avère que toutes les musiques générées par l’IA ne permettent pas de susciter de l’émotion chez un individu. En effet, elles nécessitent d’être retravaillées par l’homme pour mettre en émoi une audience.

Enfin dans le domaine du design, l’IA par le biais des GANs est également utilisée. Elle est implémentée dans certains logiciels de conception numérique en combinant plusieurs styles d’objets pour aboutir à la création d’un objet unique.

Source : frenchweb.fr – Objet crée via la fonctionnalité Dreamcatcher d’Autodesk
Source : frenchweb.fr – Objet crée via la fonctionnalité Dreamcatcher d’Autodesk

4. GAN : Un outil créatif ?

Nous venons de découvrir quelques applications directes de la créativité des GANs dans différents domaines en passant de la création graphique à la création musicale jusqu’à la création d’objets. Au travers de ces performances, nous avons également soulevé quelques limites de la créativité du GAN. Nous avons pu nous apercevoir que ce sont davantage des aides à la créativité plutôt que de réels outils purement créatifs. En effet, ces derniers ne peuvent fonctionner sans une intervention humaine. Certes un GAN s’appuie sur des techniques de plus en plus sophistiquées pour créer des choses légèrement nouvelles mais à chaque fois, il s’appuie sur des données provenant de l’imagination humaine. Par conséquent, un GAN n’est pas créatif en tant que tel. A travers ces créations, l’homme s’inspire bien évidemment de choses existantes mais il possède cette capacité de prendre en compte des éléments de contexte, de capter l’audience et de transmettre des émotions à travers ses créations. Pour être créatif, il est nécessaire de sortir des sentiers battus et s’extirper de certaines contraintes pour se démarquer du reste. Malheureusement, les outils actuels de l’IA générative n’ont pas cette capacité car ils ont besoin de données existantes pour s’entraîner. Ainsi ces derniers ne font que converger la créativité vers ce qui existe déjà. Même si les imaginations humaines sont triviales et par conséquent peu innovantes par rapport à l’existant, le GAN l’est encore moins car celui-ci est restreint à ce à quoi il a été entraîné.

Cependant, une équipe de chercheurs qui travaille sur un projet appelé CAN « CAN : Creative Adversarial Networks » tente de remédier à ce problème afin d’élargir les possibilités créatives des GANs. Le CAN s’appuie sur le fonctionnement de base du GAN mais intègre plusieurs changements qui permettent au générateur de « penser » de manière créative. Premièrement, le générateur est conçu pour recevoir non plus un signal mais deux signaux du discriminateur. Ces deux signaux agissent comme des forces contradictoires pour accomplir 3 objectifs :

  • Générer de nouvelles œuvres
  • L’œuvre ne doit pas être trop nouvelle, c’est-à-dire qu’elle ne doit pas trop s'éloigner des exemples d'entraînements
  • L’œuvre générée doit accroître l'ambiguïté stylistique

Le discriminateur apprend toujours à classer l’image générée comme réelle ou fausse mais apprend également à classer les images en fonction de plusieurs styles artistiques (renaissance, abstrait, cubisme,…) . De son côté, le générateur essaie toujours de tromper le discriminateur en lui faisant croire que les images générées sont réelles, mais il essaie également de rendre difficile pour le discriminateur de classer ses images dans l’un des styles artistiques sur lequel le discriminateur a été formé. Ainsi ce dernier envoie un premier signal qui informe le générateur sur la classification réalisée entre « art ou pas art » et un second signal indique avec quel degré de certitude, le discriminateur peut classer l’art généré dans un style donné. C’est ce second signal qui permet au générateur d’exprimer ses talents de créativité en y mélangeant plusieurs styles artistiques différents et ainsi créer des peintures originales et vraisemblables.

Modèle du Creative Adversial Network (CAN)
Modèle du Creative Adversial Network (CAN)

Les CANs sont motivés par la théorie selon laquelle la créativité est perçue par les téléspectateurs lorsqu’une œuvre d’art est unique mais tout de même rattachée à un style artistique facilement identifiable. A travers le CAN, les chercheurs souhaitent faire apprendre différents styles d’art à l’IA pour l’aider à sortir de son domaine d’apprentissage et ainsi créer des choses foncièrement nouvelles. Le résultat est plutôt bon comme on peut le voir sur la figure ci-dessous. Les peintures générées par des CANs mélangent différents styles et couleurs qui les rendent presque indiscernables de peintures créées par l’homme. Cependant, la créativité humaine se trouve toujours en toile de fond. Néanmoins, il faut tout de même reconnaître que les CANs représentent un énorme progrès pour les machines qui pensent de manière créative.

On constate que les récents travaux de chercheurs sur les GANs et ses variantes notamment les CANs montrent d’énormes progrès dans le domaine de la créativité. En effet, il s’avère qu’il est facile pour un GAN de proposer quelque chose de légèrement nouveau de manière aléatoire ou en s’appuyant sur des éléments existants. Mais il est très difficile pour un GAN de générer quelque chose de totalement nouveau, inattendu et utile. En fait, le problème est que la créativité des GANs repose essentiellement sur la technologie d’apprentissage en profondeur et le ‘modèle génératif’. Cela signifie qu’elle apprend à imiter les données sur lesquelles elle a été formée. La créativité d’un GAN classique repose en fait essentiellement sur du mimétisme. C’est ce que fait un artiste de musique en tant qu’apprenti : copier et perfectionner le style d’autres artistes au lieu de travailler à partir d’un style authentique et original.

5. GAN : Un catalyseur pour la créativité humaine

Au cours des dernières années, on peut dire que le domaine de l’intelligence artificielle par le biais des GAN a remis en question la définition de la créativité. En effet, il y a eu des exemples d’art réalisés à l’aide d’apprentissage profond génératif tel que les GANs. Par exemple, en 2018, un portrait nommé Edmond de Bellamy a utilisé une base de données de 15000 portraits des années 1300 aux années 1900 pour entraîner un algorithme d’apprentissage profond de type GAN afin de produire un portrait unique. La peinture s’est vendue à 432 500 dollars aux enchères à New York.

Source : courrierinternationnal.com – Peinture Edmond de Bellamy réalisé par un GAN
Source : courrierinternationnal.com – Peinture Edmond de Bellamy réalisé par un GAN

Mais encore, au regard de tout ce qui a été évoqué précédemment, nous sommes en mesure de dire que les techniques de transformations d’images permises par les GANs et ses variantes sont très utiles pour tester de nouvelles idées et accélérer le prototypage. Ainsi, l’IA permet d’explorer des idées créatives d’origine humaine. On remarque également que la créativité et l’IA ont des implications complexes. La raison est que de nombreux paramètres inhérents à un processus créatif ne peuvent être modélisés par la statistique. Or les systèmes intelligents créatifs apprennent des lois statistiques et n’ont pas la capacité d’évaluer le sens réel des objets qu’ils génèrent et manipulent. L’IA générative doit donc progresser dans le domaine du traitement des émotions humaines et dans la sémantique des objets. Cependant, de mon point de vue, une IA créative puissante serait trop intrusive et empêcherait l’humain de repousser les limites de son imagination. De plus, cela pourrait être dangereux dû à des effets de bord devenant incontrôlable. Par conséquent, il est dans l’intérêt de l’homme d’utiliser les GANs uniquement comme un outil d’aide à la créativité. En effet, au-delà d’être simplement un moyen d’analyser plus rapidement une quantité d’informations, le GAN peut devenir au fil des années un stimulant pour une réflexion plus créative sur la façon d’utiliser les données en suggérant des solutions que les humains n’auraient peut-être jamais envisagées. De plus, comme nous l’avons montré précédemment, le GAN est capable d’imiter des tableaux réalistes sur le plan visuel, composer de la musique et bien d’autres choses encore. L’utilisation de techniques telles que l’apprentissage en profondeur permet d’énormes progrès et ouvre le champ des possibilités pour créer une IA véritablement créative. Toutefois, à ce stade, les GANs ne peuvent pas rivaliser avec l’imagination humaine qui regorge d’idées utiles. Par conséquent les GANs ne font qu’assister l’homme tout au long du processus de création.
De manière générale, on peut se demander si le premier objectif de l’IA n’est finalement pas d’améliorer l’efficacité en automatisant certaines opérations chronophages comme par exemple des tâches répétitives ou complexes pour l’humain. Je ne pense pas que la finalité de l’IA soit de recréer l’esprit humain en y intégrant ses fonctions cognitives dans un système intelligent. Ce qui est le plus intéressant en revanche concerne les techniques d’interaction avec les humains qui inspirent la créativité chez les humains. Le but de l’IA est davantage d’épauler l’homme dans son processus créatif pour l’aider et le pousser à trouver de nouvelles idées et innover continuellement.

6. Conclusion

Pour conclure, il ne fait aucun doute que les limites du rôle de l’IA dans les efforts créatifs seront repoussées dans les années à venir notamment grâce aux différentes améliorations des modèles génératifs tels que les GANs. En effet, les chercheurs continuent d’explorer des techniques de GANs améliorées notamment dans le domaine du traitement des images. Certes, certaines techniques produisent des résultats bluffants mais la plupart n’aboutissent pas à la création d’une œuvre artistique singulière pouvant émerveiller ou captiver une audience. Même si elle ne remplacera jamais l’âme humaine de la créativité, l’IA générative et plus particulièrement le GAN peut certainement offrir de nombreux avantages en tant qu’assistant intelligent et inspirant. Par conséquent, une fois unis, l’IA générative et l’humain peuvent créer de grandes choses comme par exemple trouver des solutions créatives à des problèmes que nous pensions être très complexes à résoudre. En ce sens, elle doit devenir un catalyseur pour pousser la créativité humaine.

Hugo Michel
Front Quant/Data Scientist in Financial Markets

My research interests include Machine Learning, Quantitative Finance and NLP