Un astronaute en combinaison sur un cheval

DALL-E 2, l’artiste est-il sur le point d’être remplacé par l’IA ?

Imaginez une machine capable de créer une image qui vous traverse l’esprit à partir d’un texte descriptif. C’est le projet fou mené par OpenAI, les créateurs de l’intelligence artificielle DALL-E 2 qui vient d’être annoncé.

creation part dalle 2
Vitrail de toucans dans l’espace

Quand vous consultez des images sur un ordinateur, des lignes de code permettent de vous afficher le rendu sur votre écran. Mais le rapport du texte à l’image pourrait devenir bien plus direct d’ici peu.

En associant un personnage ou un objet avec une situation, l’intelligence artificielle de DALL-E 2 choisit des images qui lui semblent les plus à même de retranscrire la description écrite.

Comment ça marche ?

Comment cela fonctionne ? Un algorithme de Deep Learning (comme on parle ici) permet à la machine de retranscrire en images les textes. Plus il est utilisé, meilleur il devient. Chaque requête par une personne améliore le resultat et renforce la corrélation text-image.

Bébé panda qui joue du piano entre deux planètes
un bébé panda joue du piano de l’autre côté de la galaxie

À chaque texte tapé, il propose plusieurs images et différents styles qui rendent le choix possible. Une véritable prouesse puisqu’il s’adapte aux spécificités des images à chercher pour entrer dans le cadre d’un « dessin au crayon à papier », par exemple, ou d’une « peinture à l’huile » qui font partie des options disponibles avec le logiciel. 

L’ordinateur est également capable de faire des points de vue sous tous les angles. Mieux, la seconde version de DALL-E devine les effets d’ombre, la position de certains objets qu’elle vient ajouter à l’image. Le logiciel s’adapte aux effets de reflet et à la disposition des formes pour réaliser une retranscription réaliste.

DALL-E 2, l'artiste est-il sur le point d'être remplacé par l'IA ? 1
Image d'une galerie d'exposition de peinture créée par l'intelligence artificielle
Par un simple changement du texte, le chien change de tableau

En plus de la création de photo inédites, les retouches seraient facilitées par la technologie dite « in-painting ». En utilisant un outil de sélection, il est possible par exemple de transformer la coupe de cheveux de la Joconde ou bien de remplacer un chien par un chat sur une photo. Pour ce faire, un bloc de texte apparaît et interagit avec l’image. C’est-à-dire que les utilisateurs pourraient apporter les modifications nécessaires à une photo aussi simplement que par la modification d’un texte.

Image crée par l'intelligence artificielle d'un monstre tricoté en laine
Bol de soupe rempli par un monstre tricoté en laine

Une autre possibilité offerte par la technologie de cet outil est la proposition de variations à une image préexistante. On ne peut qu’imaginer le potentiel de cette invention capable de créer des œuvres dignes des fameux diptyques d’Andy Warhol représentant Marilyn Monroe. Une technologie telle que celle de DALL-E 2 pourrait pourquoi pas démocratiser la technique du sampling, technique en musique d’utilisation d’un extrait d’un morceau afin d’en créer un autre, dans l’art graphique !

Une entreprise d’Elon Musk, encore ?

OpenAI est une entreprise apparue sous la forme d’une organisation à but non lucratif qui se donne pour mission de trouver des technologies d’intelligence artificielle qui profitent « à toute l’humanité ». Fondée en 2015 par Elon Musk et Sam Altman, entre autres, OpenAI entends bien démocratiser l’intelligence artificielle.

Des astronautes qui jouent au basket avec un chat
Des astronautes qui jouent au basket avec un chat

Pourtant, selon ce même Elon Musk, l’intelligence artificielle serait « la plus grande menace » que connaisse l’être humain. Il pense qu’un monopole imposé par un groupe restreint d’humains sur cette innovation pourrait créer une dictature qui, à la différence d’un régime humain, ne meurt jamais. 

Venant de la première fortune du monde, la réflexion peut paraître étonnante. Vous l’aviez peut-être deviné par son nom et son idée collaborative, OpenAI publie ses recherches sur son site tout comme ses logiciels en open source, accordant l’accès aux internautes et fait part de ses difficultés rencontrées dans la conception. C’est donc sous cette justification humaniste que le patron de Tesla veut participer au développement de ces technologies.

Photographie de Sam Altman pendant une conférence
Sam Altman, PDG de OpenAI

En 2018, l’entreprise se transforme avec le départ d’Elon Musk et la prise de la direction par Sam Altman. L’open source est progressivement délaissée au profit de communiqués en ligne qui viennent informer sur les avancées de la compagnie. Un an plus tard, OpenAI devient une organisation à but lucratif plafonné afin de s’ouvrir aux financements. Financements qui viendront rapidement en partie de Microsoft.

DALL-E 2, l'artiste est-il sur le point d'être remplacé par l'IA ? 2
Affiche de promotion pour GPT-3 (2020)

En 2020, le GPT-3 avait déjà créé un réel engouement. Cette intelligence artificielle avait appris la grammaire, la syntaxe et les règles d’écriture en analysant des millions de pages web. Elle était ainsi capable de tenir une conversation cohérente ou d’écrire des nouvelles littéraires.

Ainsi, le développement des technologies d’intelligence artificielle par OpenAI semble voué à influencer notre conception des arts dans les années futures.

Une version améliorée de DALL-E

Un ours qui joue de la basse et un koala qui dunk
Images de démonstration des créations de DALL-E 2


Le projet DALL-E, présenté en janvier 2021, est désormais équipé d’une résolution quatre fois supérieure dans sa seconde version. Le rendu qui apparaît sous nos yeux est la synthèse des 32 meilleurs résultats trouvés par l’algorithme en relation avec un mot.
Avec une telle invention, il est possible d’observer en haute définition des éléments de très près et d’avoir un effet qui donne le rendu de l’image dans le style rayon-X.
Vous pouvez déjà faire quelques tests du logiciel DALL-E 2 sur le site internet dédié à l’expérience à partir de résultats prédéfinis.

DEs ours habillés en costumes traditionnels japonais qui font leurs courses
Ours en peluches qui font leur courses dans le style ukiyo (estampes japonaises)

Le bouleversement du monde de l’art

Deux ours en peluche font leurs courses dans l'Egypte antique
Ours en peluche dans l’Egypte antique

Le premier domaine concerné est bien sûr celui des arts graphiques. A chaque instruction, le logiciel serait capable de créer une image inédite. Sera-t-il possible de capitaliser sur ce nouvel outil pour un plus large public ? On peut déjà imaginer un potentiel immense pour cette technologie.


Le monde des NFT artistiques semble intéressé par l’innovation qui pourrait rendre encore plus accessible la création artistique. Alors que les artistes commencent à comprendre les bénéfices que peuvent apporter les NFT pour la valorisation de leur travail, la technologie inventée par OpenAI doit les aider à proposer des œuvres en des temps plus restreints.

Ours en peluche sous l'eau qui travaillent sur une nouvelle IA avec du matériel des années 90
Ours en peluche qui travaillent sur des technologies des années 90 sous l’eau

Mieux, elle redéfinirait notre perception de l’art, réduisant peut-être la création à l’imagination sans borne quand la machine nous épargnera le moment de création technique. L’évaluation de la valeur des œuvres serait attribuée en fonction de la créativité de l’artiste plutôt que pour sa virtuosité stylistique et technique.

Ensuite, l’architecture pourrait s’approprier ce genre de pratiques pour proposer aux agences immobilières de plonger leurs clients encore davantage dans la projection d’un terrain inhabité par exemple. Avec une présentation intuitive, le logiciel permet de décider du placement d’un objet comme un canapé ou un meuble.

Véranda avec canapé dans le fond de la pièce
Véranda avec canapé au milieu de la pièce
Démonstration des perspectives d’architecture offertes par l’IA

Enfin, comment ne pas penser à l’industrie du cinéma qui doit observer toutes ces innovations en anticipant la disparition des décors qu’elle n’aura plus à modéliser. Aujourd’hui, la majorité des grands films hollywoodiens sont tournés dans de grands studios avec des fonds verts. Le procédé resterait le même, mais le montage deviendrait bien plus aisé grâce aux technologies d’IA. 

Les ratés sur les travaux de CGI (Computer Generated Imagery) seraient vraisemblablement réduits à néant. D’ici quelques années, les créateurs du projet DALL-E pourront-ils transformer leur invention en une commande du texte à la vidéo ? Serait-ce alors les débuts d’un YouTube ou Netflix dont les vidéos et séries seraient rédigées par leurs propres consommateurs ?

Les IA en plein boom technologique


Le fait que DALL-E se base sur de vraies images pourrait dans un premier temps menacer la perception de la réalité. Il suit dans cette direction les Deep Fake, ces vidéos créées à partir notamment de discours d’hommes politiques. Une fois la synchronisation labiale appliquée, il ne manquait plus qu’à utiliser un sosie vocal de la personnalité en question pour créer une ressemblance presque parfaite.

Ces Deep Fakes sont déjà considérés comme un danger pour la démocratie puisqu’ils donneraient une excuse aux politiciens pour réfuter tout propos tenu. Une situation qui ferait perdre tout intérêt de la population envers la politique.

Wall Street journal, Vidéo YouTube

En 2017, AlphaGo, la machine développée par Google battait dans quatre parties sur cinq le champion du monde du jeu de go. Quelques mois seulement après le développement d’AlphaGo, sa version évoluée AlphaGoZero venait battre 100 victoires à 0 son illustre prédécesseur.

L'intelligence artificielle Alphago bat Lee Sedol au jeu de go
Partie du jeu de go d’alphago contre Lee Sedol (9e dan professionnel)

L’intelligence artificielle commence à trouver sa place dans les créations artistiques. Ainsi, toujours en 2017, Stromae avait participé avec la chanteuse Kiesza à la création d’un morceau composé en partie par l’intelligence artificielle. Capable d’associer des accords entre eux pour faire des progressions cohérentes, celle-ci pourrait permettre d’accélérer encore un peu plus le processus de production de musique.

Depuis quelques jours, OpenAI alimente un nouveau compte Instagram consacré à l’annonce de DALL-E et qui réalise des démonstrations impressionnantes des capacités de l’algorithmes. 

Les évolutions des professions


De nombreux métiers sont susceptibles d’être remplacés à terme par la machine. Dans le cas où le projet DALL-E démocratiserait ses outils, les artistes digitaux ou les photographes seraient contraints de réinventer leur profession pour continuer d’exister.

Montgolfière arc-en-ciel qui se reflète dans un lac
Montgolfière arc-en-ciel qui se reflète dans un lac


DALL-E compte baser son machine learning sur des milliards de liens entre des images et des photos. Et comment faire subsister le copyright dans tout cela ? Pour l’instant, pas de réponse précise, OpenAI se défend en affirmant que sa base de données est accessible à tous en ligne. Il est probable que la justice ait à inventer de nouvelles réglementations pour protéger les artistes, photographes et journalistes d’utilisations abusives de leurs œuvres.

Création d'image d'un raton laveur astronaute par DALL-E 2
Raton laveur dans une combinaison d’astronaute


Pour le marché de l’art graphique, il faudra voir à l’usage si les machines remplacent entièrement les artistes humains. Avec des peintures qui rappellent le style des grands peintres, saurons-nous encore reconnaître les œuvres originales ? Et la reproduction de ces styles ne rendra-t-il pas l’exceptionnel moins exceptionnel ?

On pourrait aussi penser au domaine de la mode qui pourrait y trouver son compte. Une entreprise pourrait ne plus avoir besoin d’un mannequin pour promouvoir ses collections. Une simple image d’un modèle suffirait, ce dernier étant habillé selon les collections par le biais d’un logiciel tel que DALL-E 2. Ces innovations supprimeraient également le coût d’un photographe et de la location d’un studio pour les campagnes de promotion.

des chats jouent au basket dans l'espace
Image dans le style aquarelle

Pour l’instant, la liste d’attente est ouverte pour quelques partenaires qui pourront s’estimer extrêmement privilégié une fois choisis. Le but d’OpenAI n’est pas de rendre DALL-E accessible au grand public tout de suite afin de laisser le temps à ses équipes de trouver des solutions éthiques que posent ces découvertes.

Quelles questions éthiques posent les IA ?

Image d'un renard obtenu par l'intelligence artificielle DALL-E
Image obtenu avec les instructions suivantes “Peinture d’un renard assis dans un champ au levé du soleil dans le style de Claude Monnet”

Le projet se penche lui-même sur ses propres limites. Selon Open AI, l’algorithme doit encore être perfectionné de manière qu’une communauté de trolls ne lui apprenne pas à associer des images violentes, pornographiques ou simplement erronées. 

En effet, on voit mal comment un logiciel qui ne serait pas certain de ses capacités sur le domaine de la sécurité et de la collecte des données pourrait voir le jour dans un monde post-Cambridge Analytica. Ce genre de dérives, qui expliquent que le logiciel n’est pas encore accessible au plus grand nombre, seront d’ailleurs fortement restreintes par des détections automatisées des contenus problématiques.

Se pose aussi la question de l’accessibilité d’une telle innovation pour les artistes. Si OpenAI insiste sur sa volonté de démocratiser les intelligences artificielles, on ne peut pas penser que ces technologies resteront gratuites à l’avenir. Cela signifierait la création d’un marché de l’art à deux vitesses entre des artistes qui en disposeraient ou non.

Puce GPU sous la forme d'un avocat


Pour la presse à scandales, on peut penser qu’il s’agit d’une opportunité en or pour utiliser les images des célébrités afin de choquer ses lecteurs par des images fausses tout en demeurant réalistes. Mais OpenAI a fait savoir qu’il ne sera pas possible de générer des images à partir de noms existants pour empêcher ce genre de désinformation. Les fausses informations et théories complotistes seront bannies, toujours dans cet objectif de ne pas laisser son utilisation dénaturer le logiciel DALL-E. 

On pourrait se satisfaire de la réponse donnée par OpenAI à ces problèmes, mais ces technologies vont bien finir par arriver dans notre vie de tous les jours. Peut-on réellement imaginer les dégâts que feraient des montages aussi bien faits sur des carrières, la méfiance que cela génèrera dans la population vis-à-vis des médias ?
Le nom du projet DALL-E est un mélange entre Salvador Dali, l’artiste surréaliste, et le robot Wall-E du film Pixar du même nom. 

Le robot Wall-E au milieu de deux humains
Dans Wall-E, les humains passent leur journée allongés

Une fusion entre l’esprit humain et les compétences de la robotique donc. Nous l’avons vu, l’entreprise OpenAI pense pouvoir aider l’humanité en rendant son existence moins difficile grâce à l’intelligence artificielle. Mais prenant Wall-E comme référence, elle pourrait bien repousser certaines personnes se souvenant que, dans ce film d’animation, les humains sont devenus des consommateurs débarrassés de toute activité intellectuelle comme physique.

Le futur, c’est pas pour maintenant ?

En réalité, au niveau de la création artistique, le digital est déjà bien présent et commence à faire émerger d’autres disciplines. Par exemple, la modélisation 3D animée plus vrai que nature de Zaeoyo.

Cependant, on l’a vu avec le street artiste Banksy ces dernières années, créer une œuvre d’art suppose de pouvoir en parler, de la communiquer. Pour l’instant, l’intelligence artificielle ne mettra pas en œuvre un plan d’elle-même pour que les internautes réagissent et fassent d’un contenu un phénomène viral. 

Reprise du tableau le radeau de la méduse par Banksy à Calais
Fresque de Banksy à Calais, 2015

Elle n’est pas capable de créer du sens à partir d’une œuvre, mais simplement d’associer des images entre elles. La décision de faire une fresque à Calais dénonçant le sort des migrants comme l’a déjà fait Banksy, ce n’est pas encore de l’ordre des compétences des machines. 

  1. Les médiocres n ont toujours eu pour but que d imiter le beau et le vrai le marché de l art est l un des milieux les plus imité plagié et volé et ce depuis toujours pas besoin d ia pour ça ..c’est claire que ça va détruire un tas de profession et appauvrir le milieu mais tant qu’il y’aura des humains sur terre il y aura toujours un public pour le vrai le beau l art véritable . L art ce n’est pas juste une belle image.

Votre adresse e-mail ne sera pas publiée.

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.