Capturer le réel ou générer l'illusion ?

Capturer le réel ou générer l'illusion ?

  • RN
  • juin 13, 2026
  • 10 minutes

La street photography aime ces instants ordinaires : une personne attend à un arrêt de bus, un enfant traverse une rue en courant, une femme regarde son téléphone sous la pluie, une lumière rebondit sur une vitrine, un visage surgit dans une foule.

La scène semble familière. La photographie paraît authentique. Pourtant, aucun photographe n'était présent. Aucun appareil n'a déclenché. Aucun passant n'a été photographié. L'image a été générée par une intelligence artificielle.

Peut-on encore parler de photographie lorsque le réel n'a jamais été rencontré ?

La formule est efficace. Elle mérite pourtant une nuance. Le réel a bien été rencontré. Des millions de fois. Les photographes dont les images ont servi à l'entraînement des modèles ont photographié des rues, des passants, des vitrines, des gestes, des regards, des accidents visuels. Les modèles génératifs sont nourris de cette accumulation d'expériences photographiques.

La différence ne se situe pas entre un réel rencontré et un réel absent. Elle se situe entre un réel observé directement par l'auteur et un réel reconstruit statistiquement à partir d'observations antérieures. Ces images ne naissent pas d'une rencontre avec le réel mais d'une rencontre indirecte avec des milliards de représentations du réel.

Une question demeure, rarement posée : les photographes dont le travail a nourri ces modèles n'ont pas été consultés. Les passants qu'ils ont photographiés non plus. La matière première de l'image générée porte en elle une dette invisible envers ceux qui ont fait exister le réel en image.

Le corps dans la rue

La street photography ne se résume pas à la production d'images. Elle constitue une expérience physique. Marcher pendant plusieurs heures sans savoir ce qui va surgir. Traverser un quartier sous la pluie. Attendre une lumière. Observer un geste. Entrer dans un lieu. En sortir avec une image, ou sans aucune image.

Le corps participe à la photographie autant que l'appareil. Le regard s'affûte dans le déplacement, dans l'attente, dans l'attention portée aux détails. Une photographie de rue est souvent le résultat visible d'une expérience invisible. La fatigue, la météo, l'ambiance d'un quartier, une rencontre inattendue, une conversation improvisée, le bruit d'une rue ou l'odeur d'un marché influencent le regard du photographe bien avant le déclenchement.

La création d'images par IA repose sur une logique différente. Le processus se déroule entièrement devant un écran. La marche laisse place à l'écriture de prompts. L'exploration d'un territoire devient exploration d'un espace statistique. La création demeure présente. Le corps cesse d'être un acteur direct de la fabrication de l'image. Cette différence ne retire aucune valeur à l'image générée. Elle rappelle simplement que les deux pratiques ne mobilisent pas le même rapport au monde.

Une scène qui n'a jamais existé

Les modèles actuels produisent désormais des images capables d'imiter avec une précision remarquable l'esthétique documentaire. Visages anonymes, gestes ordinaires, lumière naturelle, imperfections calculées, profondeur de champ crédible, grain discret : tous les codes visuels de la photographie de rue peuvent être reproduits.

Le spectateur reconnaît immédiatement un langage photographique familier. Cette ressemblance crée une forme de faux réel photographique. L'expression ne désigne pas une tromperie au sens classique du terme. Elle décrit un phénomène plus subtil. L'image ressemble à un document. Elle évoque un instant vécu. Elle suggère la présence d'un photographe face à une situation réelle.

L'image devient la représentation d'un événement fictif présenté sous une forme documentaire.

Cette situation n'a pourtant jamais existé. Aucun événement ne précède l'image. L'image devient alors la représentation d'un événement fictif présenté sous une forme documentaire.

Le World Press Photo a tranché la question pour son concours : les images générées par IA ne sont pas de la photographie. Une photographie résulte de l'enregistrement de lumière provenant d'une scène ayant effectivement existé devant l'appareil. Ce que les générateurs produisent est d'une autre nature, même lorsque l'apparence est identique.

Contre la perfection

Un paradoxe apparaît rapidement lorsqu'on utilise ces outils. Les modèles génératifs produisent spontanément des images séduisantes. Les visages sont souvent trop harmonieux. Les compositions trop équilibrées. Les lumières trop flatteuses. Les situations trop cohérentes.

La réalité fonctionne rarement ainsi. Le travail du créateur consiste alors à lutter contre les réflexes du modèle. Des contraintes s'ajoutent aux prompts. Des prompts négatifs viennent limiter certains comportements. Une recherche permanente s'engage pour introduire davantage d'ambiguïté, d'imperfection, d'accident, de banalité.

La quête ne consiste plus à embellir une scène réelle. Elle consiste souvent à rendre crédible une scène fictive. Cette inversion raconte beaucoup sur notre époque. Le photographe attend parfois qu'un événement survienne. Le créateur d'images génératives cherche souvent à empêcher l'algorithme de produire une image trop parfaite.

Enregistrer ou construire

Les images générées ne remplacent pas la photographie de rue. Elles constituent une pratique différente. La photographie documentaire entretient un lien direct avec un événement, un lieu, une rencontre ou une observation. L'image générée entretient un lien avec un immense corpus d'images préexistantes.

L'une enregistre une présence. L'autre construit une vraisemblance.

La confusion apparaît lorsque les deux utilisent exactement les mêmes codes visuels. Cette proximité nous oblige à devenir plus attentifs à la provenance des images que nous regardons. Des standards techniques existent désormais pour y répondre. Le C2PA (Coalition for Content Provenance and Authenticity) propose un système ouvert de métadonnées cryptographiques permettant de documenter l'origine d'un média, qu'il ait été capturé par un appareil photo, retouché ou généré par IA.

OpenAI et Google ont annoncé en mai 2026 intégrer conjointement ce standard à leurs outils de génération d'images, en y ajoutant un filigrane invisible nommé SynthID, conçu pour résister aux transformations courantes comme les captures d'écran ou le recadrage. En Europe, l'AI Act impose à partir du 2 août 2026 des obligations de transparence concernant le marquage des contenus générés par IA.

Ces outils ne règlent pas la question esthétique. Ils posent simplement les bases d'une lisibilité minimale : savoir d'où vient une image avant de décider ce qu'on en fait. Pendant plus d'un siècle, la photographie a bénéficié d'un statut particulier. Malgré toutes les manipulations possibles, elle conservait un lien matériel avec un instant du monde réel. L'émergence des générateurs d'images modifie profondément cette relation. L'apparence photographique ne garantit plus l'existence d'un événement.

Processus

Les images qui accompagnent cet article ont été réalisées à l'aide de plusieurs modèles génératifs contemporains. Le processus combine écriture de prompts, ajustements successifs, prompts négatifs, sélection éditoriale, développement sous Lightroom et corrections ponctuelles dans Photoshop. L'objectif n'était pas de démontrer les performances d'un outil particulier. L'objectif consistait à explorer la frontière de plus en plus floue entre document photographique et image simulée.

Cette expérience m'a moins appris sur l'intelligence artificielle que sur la photographie elle-même. Elle m'a rappelé qu'une photographie ne se résume jamais à son apparence. Elle porte aussi la trace d'une présence, d'un déplacement, d'une attente, d'une rencontre. Une image générée peut reproduire les traces visibles de cette expérience. Elle ne contient pas cette expérience. C'est précisément dans cet écart que se situe aujourd'hui l'une des questions les plus passionnantes de la création visuelle contemporaine.

Sources et ressources