
Un écureuil sent une fleur © 2019 Dick van Duijn
Photographie d'un écureuil prise par Dick van Duijn, 2019.Dick van Duijn capture l'instant où, les yeux fermés de plaisir, un écureuil sent le parfum d'une fleur avant de la croquer.
La photographie analogique, la photographie numérique et les systèmes de génération automatique d'images ont-ils modifié notre rapport aux représentations visuelles ?
La surproduction et la nature des images générées automatiquement par l'intelligence artificielle ont-elles déjà irrémédiablement pollué notre imaginaire ?
Les images peuvent-elles encore nous faire rêver ?
En résumé,
● La photographie analogique n'a que peu modifié notre rapport aux images en comparaison de la démocratisation de la photographie numérique et des systèmes génératifs d'images.
● Les utilisateurs des systèmes génératifs d’images ne sont pas les artistes d’avant l’IA et, à la différence du texte, ils ne risquent pas de perdre un savoir-faire qu’ils n’ont pas.
● Générer des images donne l’illusion de création mais relève de la consommation. Nous commandons des images, proposont et modifiont des mots-clés jusqu’à obtenir satisfaction.
● La surconsommation d'images générées par l’IA, en apparence originales et étonnantes, banalise le merveilleux, nous rend insensibles au mystère et altère notre imaginaire.
● Si les images ne nous font plus rêver, allons-nous, d'un point de vue optimiste, redécouvrir notre quotidien, être attentifs et habiter à nouveau poétiquement le monde ?
Depuis son invention, de nombreux penseurs ont essayé de théoriser la photographie.
Qu’est-ce que la photographie ? Quelles sont ses particularités ? Est-elle différente des autres arts visuels ?
Roland Barthes (La Chambre claire, 1980) se disait lui-même saisi d’un désir « ontologique » à l’égard de la photographie : un désir de savoir ce qu’elle était « en soi » et par quel trait essentiel elle se distinguait de la communauté des images.
Certains, comme Walter Benjamin (L’œuvre d’art à l’ère de sa reproductibilité technique, 1936), ont pensé que la reproductibilité technique de la photographie, tout en démocratisant les représentations visuelles jusqu’alors réservées à une élite sociale et culturelle et désormais accessibles à un large public, détruisait cependant l’unicité et l’aura de l’œuvre d’art traditionnelle, laquelle, exposée dans un lieu précis, crée une relation particulière avec le spectateur.
D’autres, comme André Bazin et Roland Barthes, ont pensé que la particularité de la photographie, de par sa capacité à reproduire mécaniquement la réalité, permet, d’une certaine façon, de l’immortaliser.
Roland Barthes propose les concepts de Studium (l'intérêt général ou culturel qu'une photographie suscite) et de Punctum (l'émotion personnelle provoquée par un détail inattendu dans une photographie) pour singulariser la photographie.
Vilém Flusser (Pour une philosophie de la photographie, 1983) estimait, quant à lui, que les appareils photographiques imposent des choix et des limites créatives au photographe, en raison de leurs propres contraintes techniques.
Plus récemment, Philippe Dubois (De l’image-trace à l’image-fiction, 2016) transpose à la photographie le concept des mondes possibles, développé notamment par Thomas Pavel à propos des œuvres littéraires (Univers de la fiction, 1988).
Dans la littérature, les mondes possibles désignent l'infinité des univers alternatifs imaginables à partir d'un récit.
La photographie n'est plus uniquement une représentation de la réalité, mais un espace autonome, narratif ou conceptuel, qui contient des réalités alternatives, des hypothèses ou des fictions.
Il est cependant possible de penser que l’apparition de la photographie avant le numérique, au-delà des particularités effectivement distinctes des outils de représentation précédents (gravure, mosaïque, tapisserie, peinture, lithographie...), n’a finalement pas changé fondamentalement la relation qu’entretenaient les créateurs et les spectateurs avec les images.
L’expérience esthétique intime d'un spectateur face à l’unicité d’une œuvre d’art dans un lieu d’exposition, est-elle fondamentalement différente de l’expérience esthétique que l’on peut avoir face à une photographie reproduite en grande quantité et accessible au plus grand nombre ?
Une photographie est-elle davantage un certificat d'authenticité d’un « ça a été » qu’une peinture ? N’est-elle pas avant tout une construction subjective d’un « ça a été » qui, en réalité, « n’a été » que le temps de la mise en scène de la photographie ?
Les concepts de Studium et de Punctum de Roland Barthes ne sont-ils pas applicables à toute représentation visuelle ?
Les contraintes techniques des appareils photographiques influencent-elles davantage le processus créatif que les contraintes techniques de la gravure ou de la peinture ?
Le concept des mondes possibles n'est-il pas applicable à la sculpture ? Toute représentation ne permet-elle pas d'explorer des réalités alternatives ?
Une nouvelle question apparaît aux côtés des questionnements ontologiques avec la photographie numérique.
Qui photographie ?
Si l’on peut penser que la photographie pour le créateur et le spectateur ne présentait avant le numérique que peu de différences par rapport aux autres modes de représentation visuelle, le numérique, quant à lui, introduit une importante différence : Prendre une photographie devient simple.
La reproductibilité technique de la photographie, selon Walter Benjamin, a permis de démocratiser et de rendre accessibles les représentations visuelles à un large public mais le numérique démocratise et rend accessible le processus même de production d'images. La photographie était, comme les autres modes de représentation, réservée aux professionnels et aux passionnés expérimentés. Avec le numérique, prendre une photographie devient accessible à tous.
Les spectateurs d’avant la photographie numérique deviennent alors de véritables producteurs d’images.
L’apprentissage et la compréhension des techniques de production, les contraintes financières et le temps nécessaire à la préparation et à la production d’une gravure, d’une peinture ou d’une photographie analogique disparaissent au profit de la facilité d’utilisation, de l’invisibilité des processus de production, de l’apparente gratuité et de l’instantanéité du numérique.
Les photographies, produites et consommées par l’utilisation massive des appareils photographiques et des médias, surabondent, saturent notre environnement quotidien et deviennent non plus uniquement des outils à notre service, mais aussi, peut-être, des dispositifs qui influencent inconsciemment nos actions et nos choix.
La nature de l’intention photographique, les pratiques et l’expérience esthétique, se transforment aussi.
Au départ utilisée à des fins documentaires, artistiques, scientifiques, publicitaires ou éducatives, la photographie est aujourd’hui principalement utilisée à des fins personnelles et sociales.
Les selfies par exemple, loin des intentions artistiques, esthétiques ou symboliques des autoportraits traditionnels, permettent de se mettre en scène dans un lieu et de partager un moment, une émotion ou une expérience avec des amis.
La nécessité d’un développement chimique pour une photographie analogique imposait un délai technique, un décalage temporel entre le moment vécu lors de la prise d’une photographie et la découverte du moment photographié. Cependant, les technologies numériques et les écrans intégrés aux appareils photographiques permettent aujourd’hui une simultanéité entre le moment vécu et le moment photographié, dont chacun de nous s’approprie les possibilités.
Les expériences d’un lieu, d’une rencontre ou d’un événement vécu deviennent alors diverses. La vérification instantanée par l’enregistrement photographique d’un moment vécu invite chacun à vivre des expériences nouvelles et à porter une attention au moment présent, différente d’avant le numérique.
Comme pour la photographie, au-delà d’une ontologie des images générées par l’IA, il est important de questionner les mécanismes de production et les nouvelles pratiques.
Qui génère ces images, dans quel contexte et avec quels objectifs?
Ne pas questionner la qualité ou l'originalité des images générées par l'IA, l’appréciation esthétique d’une représentation visuelle, car subjective, appartient à chaque spectateur, mais questionner l'impact de ces images sur notre imaginaire.
Par ailleurs, comme le précise Serge Tisseron dans le Manifeste pour une École inférieure de la Photographie, il n’existe pas d’images « riches » ou d’images « pauvres ».
Les outils de génération d’images par l'IA permettent à tous de produire, de plus en plus massivement, des images sans apprentissage ni savoir-faire. Notre langue maternelle suffit à elle seule, de simples instructions textuelles (prompts) suffisent à chacun pour produire des images. Il n’est par ailleurs plus nécessaire de sortir de chez soi, de vivre une expérience réelle, ou d’appuyer sur un bouton au contact de la réalité.
Génération de texte VS Génération d’images
L'IA dans les domaines créatifs semble se généraliser mais il existe une différence importante entre le texte et les images.
Les modèles de langage comme ChatGPT permettent à leurs utilisateurs de simplifier, d’accélérer ou d’automatiser une activité déjà existante avant l’apparition de ces modèles, comme chercher une information ou rédiger un texte.
Les romanciers, les journalistes, les responsables administratifs, les avocats, les développeurs informatiques continuent leurs activités habituelles, mais différemment. : ils externalisent et délèguent une partie de leur savoir-faire à un modèle de langage dans le but d’une « optimisation ».
Le cas des systèmes de génération d’images semble différent.
Les artistes, peintres, illustrateurs, graphistes ou photographes ne sont pas les utilisateurs, mais plutôt, à leur insu, les créateurs en amont des contenus qui alimentent les bases de données nécessaires au fonctionnement de ces systèmes.
Les utilisateurs des systèmes génératifs d’images, comme les utilisateurs des appareils photographiques numériques, ne sont plus uniquement des passionnés ou des professionnels de l’image. Pour de nombreuses raisons, manque d’intérêt, de savoir-faire ou de temps, beaucoup n’avaient jamais envisagé de créer d’univers visuels, de designs d’objets, d’architecture ou de paysages avant l’apparition des outils de génération d’images.
Les exemples sont nombreux.
Le gérant d'une entreprise, à la recherche d’un logo, ne recourt plus au savoir-faire d’un graphiste, mais sélectionne, sur la base d'instructions textuelles, son logo parmi les propositions graphiques des systèmes de génération d’images.
Le directeur artistique d’une agence de publicité ne sollicite plus un artiste pour créer un visuel dans le cadre d’une campagne publicitaire, génère lui-même ce visuel.
Par ailleurs, de plus en plus de personnes s’inventent artistes, designers et proposent à la vente des œuvres artistiques comme Porter Art Guild ou du mobilier comme Futuristic Decors, entièrement générés par l'intelligence artificielle.
Les apprentis directeurs artistiques comme Jonas Peterson ou Polina Kostanda n'ont jamais été aussi nombreux.
La prolifération de pages internet entièrement rédigées et illustrées par l'IA dans le but d'une meilleure visibilité sur Internet est impressionnante. Des entreprises d'entretien comme Écolavage créent des pages de comparaisons d'aspirateurs fictifs. Des agences de voyage comme X Holidays créent des comptes Instagram de fausses maisons idylliques.
Les particuliers inondent internet d'images IA dans l'espoir de vendre des T-shirts (Nordikido) ou des mugs (IllustNation).
À noter que les utilisateurs des systèmes génératifs de textes externalisent leur savoir-faire cognitif, avec le danger d’une perte de ce savoir-faire, perte d’autant plus alarmante dans le cas des jeunes enfants apprenants qui n’ont pas encore acquis parfaitement ce savoir-faire. Ce n’est cependant pas le cas des utilisateurs des systèmes génératifs d’images : Ils n’externalisent pas leur savoir-faire créatif, car ils n'en ont pas et ne risquent donc pas de le perdre.
Les utilisateurs des systèmes génératifs d’images n’ont pas tous non plus un regard critique sur les images que ces systèmes génèrent en fonction de leurs requêtes textuelles.
Cette image générée est-elle réellement originale ? Quel sens ou quel impact peut-elle avoir ? Entretient-elle une relation particulière avec les œuvres existantes ? Se réfère-t-elle à une période spécifique de l’histoire de l’art ?
L’apparente qualité graphique des images générées élude très souvent ces questions.
Créateurs vs Consommateurs
Depuis la mise à disposition auprès du grand public, en 2022, des systèmes de génération d’images assistés par intelligence artificielle, l’augmentation de la production d'images semble exponentielle.
À noter que les outils de génération d’images par IA, ainsi que les réseaux sociaux, ne communiquent aucune donnée sur le volume d’images générées et partagées, estimé cependant à plusieurs milliards.
Mais pourquoi toute ces images ?
La facilité de production des images générées par l’IA et la facilité de leur diffusion sur Internet, sans nécessaire reconnaissance institutionnelle comme celle d’un musée ou d’un journal, est certainement un facteur important.
Comme pour la photographie numérique, nous produisons des images tout simplement parce que c’est possible de le faire.
Mais au-delà de la facilité d'utilisation à des fins personnelles ou professionnelles, de la fascination pour l’apparente qualité artistique de ces images, le mode de production semble être, lui-même, le principal vecteur de leur prolifération.
Nous ne créons plus d’images au sens traditionnel du terme, ce qui était encore le cas pour les photographies numériques, mais nous commanditons des images sous la forme de requêtes textuelles à un algorithme.
Le mode de production des images générées par l’IA semble se faire sur le mode de la consommation.
Nous proposons à un algorithme des mots-clés et des références visuelles sans avoir une idée précise du résultat a priori, puis reformulons ces mots-clés jusqu’à l’obtention d’un résultat satisfaisant.
Notre société de consommation nous a habitués à l’addiction et au plaisir d’obtenir satisfaction.
Le plaisir du consommateur ne serait-il pas l’une des motivations de la production des images générées par l’IA ?
Un sentiment de création
Les producteurs d’images IA tendent cependant à interpréter cette consommation comme un acte créatif.
Le vocabulaire utilisé est explicite quant à l’appropriation en tant que créateurs de ces images.
Par exemple : « Regardez ce que j’ai créé », « C’est mon travail », « J’ai fait de nombreux tests, de nombreuses combinaisons de mots-clés avant de créer mon image »...
« Avec cet outil, nous dessinons nos illustrations trois fois plus vite ! »
Apparaît aussi le sentiment d'avoir appris et acquis un savoir-faire : « Je sais prompter pour obtenir ce que je veux. »
Le vocabulaire des spectateurs est également révélateur : « J’aime votre travail », « Vous êtes mon artiste préféré »...
Nous pouvons cependant estimer que, par leur mode de production, les représentations générées par l’IA diffèrent des représentations visuelles traditionnelles, y compris la photographie numérique, en ce que tous, spectateurs et producteurs, deviennent simplement des consommateurs. En échange d’une contribution financière, comme un abonnement à un service d’intelligence artificielle, nous obtenons, suite à une consommation d'images, la satisfaction de nos désirs.
À noter que la revendication du statut de créateurs est problématique, car la législation sur le droit d'auteur des images générées par l'intelligence artificielle est encore insuffisamment définie. Qui sont les auteurs ? Les utilisateurs, rédacteurs des requêtes textuelles ? Les développeurs des systèmes et des algorithmes ? Les artistes dont les œuvres sont été utilisées pour l’entraînement des systèmes d’IA et pour la génération des images ?
De nombreux pays, comme les États-Unis, précisent que les œuvres créées par intelligence artificielle ne peuvent bénéficier de la protection du droit d'auteur sans une contribution humaine significative.
Par exemple, le Bureau du Copyright des États-Unis stipule en mars 2023 dans ses Directives pour l'enregistrement des droits d'auteur concernant les Œuvres contenant du matériel généré par intelligence artificielle qu'il n'enregistrera pas « les œuvres produites par une machine ou un simple processus mécanique fonctionnant de manière aléatoire ou automatique » mais uniquement « les créations fondamentalement humaines (l’ordinateur jouant uniquement le rôle d’un assistant), dont les éléments traditionnels de création (composition, choix des couleurs et des formes...) ont été effectivement conçus et exécutés par un humain, et non par une machine. »
La qualité des requêtes textuelles utilisées pour générer automatiquement des images apparaît donc essentielle pour définir la notion d’auteur. Les systèmes de génération d’images rendent publiques les requêtes textuelles des utilisateurs et permettent donc facilement d’évaluer leur « contribution créative ».
Parmi les exemples de requêtes textuelles de MidJourney, « un essaim d'insectes magiques aux ailes lumineuses », « Un petit arbre au bord de la rivière avec un arrière-plan flou », « Un robot samouraï disco, portrait royal officiel ».
Il semble donc qu’aujourd’hui, de nombreuses images générées ne résultent pas d’une contribution créative suffisamment significative pour considérer les utilisateurs comme des auteurs ; ces images relèvent par conséquent du domaine public.
Vers un 7e continent numérique ?
Tout comme la consommation excessive de marchandises réelles, la consommation d’images provoque une pollution.
Une pollution matérielle qui dégrade notre monde physique car la fabrication et l’exploitation des infrastructures nécessaires aux systèmes de génération d’IA mobilisent de nombreuses ressources, notamment des métaux rares comme le cobalt et le lithium, et consomment d’énormes quantités d’électricité, ainsi que d’eau pour le refroidissement des serveurs.
Une pollution visuelle qui altère notre imaginaire, car les images fictives générées, en apparence originales et étonnantes, nous submergent et saturent nos cerveaux.
Les systèmes génératifs d’IA vont-ils créer un désintérêt croissant pour les images singulières ?
Le choix des thèmes, des sujets que l’on demande de générer à un algorithme d’IA joue un rôle important.
L'image extraordinaire et poétique d’une habitation isolée dans un espace naturel spectaculaire, comme un immense iceberg, autrefois source de rêverie, devient ordinaire et prosaïque face aux milliers d’images similaires générées quotidiennement par l’IA. L'expression étonnante et émouvante d’un animal sauvage pris au dépourvu face à un appareil photographique ne nous étonne ni ne nous émeut plus.
La génération d'images par IA pollue-t-elle notre imaginaire, au point de nous priver de notre capacité d’émerveillement ?
Ou bien, au contraire, et d’un point de vue optimiste, la prolifération d’images de mondes fictifs extraordinaires et la pollution croissante de notre imaginaire, tout comme la prolifération de marchandises réelles et la pollution de notre planète, nous inviteront-elles à porter un regard plus sensible, attentionné et attentif sur la beauté de l’ordinaire ?
La saturation d’images IA générées nous invitera-t-elle à accorder de l’importance, non plus au résultat, mais à l’expérience réelle vécue, à fuir le virtuel et vivre à nouveau physiquement et poétiquement notre monde ?