Formes & perception

This manuscript (permalink) was automatically generated from laurentperrinet/2023-01-31_formes-et-perception@9ed4600 on May 21, 2023.

Authors

✉ — Correspondence possible via GitHub Issues

Observer une œuvre d’art nous confronte directement à la relation intime entre la réalité physique et la façon dont nous la percevons. Les avancées récentes en neurosciences nous permettent d’en apprendre davantage sur le rôle de notre cerveau dans l’établissement de cette relation fondamentale.

Matière à voir, la neuroscience de la vision

Commençons par imaginer que nous portons notre regard dans un télescope et que nous observons M51, la galaxie du Tourbillon. Notre système nerveux est responsable de notre capacité à voir le monde lumineux qui en résulte. Les photons réfléchis sur la surface du tableau sont ensuite focalisés par nos yeux pour former une image sur la rétine. Cette fine surface qui tapisse le fond de l’œil contient un réseau compact de neurones qui transforment cette image en un signal électro-chimique. Celui-ci entraine une cascade de processus qui va conduire à séparer différentes caractéristiques de la lumière, comme notamment le contraste ou la couleur pour finalement former une représentation neurale qui, transmise au reste du cerveau par le nerf optique, permettra de construire une perception de l’ensemble de la scène.

Figure 1: Rétinotopie. Une image de la galaxie du Tourbillon (photo © Laurent Perrinet, 6 minutes d’exposition avec un evScope) peut être cartographiée sur une grille régulière dénotée ici par des lignes verticales (en rouge) et horizontales (en bleu). La rétinotopie transforme radicalement cette grille, et en particulier la zone représentant la fovéa (en gris) occupe environ la moitié de l’espace dans l’espace rétinien. Appliquée à l’image originale de la galaxie, l’image est déformée et représente plus finement les parties sous l’axe de vue (ici le cœur de la galaxie) et transforme les bras spiralés de la galaxie en segments.

Il est remarquable de constater que cette représentation est fortement contrainte par l’anatomie de l’œil et de la rétine. Par exemple, la densité de neurones est bien plus élevée dans un rayon de quelque degrés autour du centre de l’axe visuel, où environ la moitié de notre acuité visuelle est concentrée (Figure 1). Cette zone, appelée fovéa, est principalement composée de photorécepteurs sensibles aux couleurs. En revanche, les photorécepteurs en périphérie de cette zone sont principalement insensibles aux couleurs, mais ont la capacité de répondre plus rapidement aux variations de luminosité, et aussi de s’adapter à des conditions d’éclairage changeantes, notamment la nuit. Cette contrainte physiologique explique pourquoi les objets peuvent apparaître en nuances de gris sous un clair de lune ou pourquoi nous pouvons plus facilement distinguer une étoile faiblement brillante en fixant légèrement à côté d’elle.

Cette représentation de l’image est ensuite relayée au reste du cerveau pour être transmise aux aires visuelles situées sur sa surface, le cortex. Ces aires conservent un arrangement sensiblement similaire à celui de la rétine et la moitié de la surface de chacune de ces aires traite la zone de la fovéa. D’aire en aire, une série de processus affine progressivement les caractéristiques visuelles. En premier, l’information de nos deux yeux converge dans le cortex visuel primaire pour former une représentation binoculaire qui va permettre l’extraction de caractéristiques locales basiques : orientation locale des contours, disparité entre les deux yeux, contrastes de couleur, etc. Le portrait est alors représenté comme l’activation de neurones sélectifs à des bords contrastés locaux, similaires aux touches d’un peintre sur le tableau. Depuis cette représentation, des aires spécialisées vont extraire des conjonctions entre ces caractéristiques, assembler les différents traits de pinceau pour former par exemple une représentation de la forme d’un nez et de la bouche d’un personnage et pour enfin obtenir des indices de plus haut niveau, comme identifier les parties qui constituent le tour du visage et ses parties et ensuite déchiffrer l’émotion exprimée sur l’image du visage.

Figure 2: Étienne Rey, Trames Instabilité, 2018. Cette sérigraphie sur papier (100 x 100 cm) est basée sur des principes d’occultations partielles en couches associées à des trames qui font émerger une dimension immatérielle et instable. Copyright Étienne Rey (ADAGP).

L’œuvre Trames Instabilité (Figure 2) d’Étienne Rey démontre comment les principes anatomiques de la formation de l’image sur la rétine peuvent être utilisés dans l’art. L’artiste a disposé des motifs élémentaires sur une grille hexagonale resserrée et rythmique. Une seconde grille est superposée en profondeur et crée un moiré caractérisé par une oscillation plus lente. Cette œuvre est calibrée pour rentrer en résonance avec les limites induites par l’anatomie de la rétine. Les deux échelles interagissent spatialement avec l’arrangement des photorécepteurs de la rétine et créent une impression d’instabilité. L’œuvre n’est plus seulement appréciée suivant un point fixe, mais invite l’observateur à interagir avec elle. Alors, les points semblent s’organiser suivant des alignements en périphérie, suggérant une organisation en profondeur, cette perception disparaissant dès qu’on veut la saisir avec un mouvement oculaire tel qu’une saccade, ce qui invite à la remplacer par une autre.

Depuis la description de ces phénomènes, on pouvait déduire tout d’abord que les processus visuels sont similaires à ceux d’une caméra vidéo : une lentille focalise l’image sur des senseurs, puis cette information est traitée par d’autres mécanismes, par exemple pour extraire les objets, mesurer leur vitesse ou les identifier. Mais la réalité est bien plus complexe, car comme nous l’avons vu l’image est fortement déformée sur la rétine, et d’autre part le traitement de cette information n’est pas simplement séquentiel. Les aires corticales communiquent dans les deux directions, de telle sorte qu’un objet d’intérêt, par exemple le visage du portrait que nous observions, puisse être rendu plus saillant dans les aires de bas niveau par l’intermédiaire d’une aire de haut niveau. En parallèle, des phénomènes d’attention peuvent conduire à être plus alerte pour certaines caractéristiques a priori, comme une couleur ou une zone de l’espace visuel. La plupart de ces mécanismes sont inconscients et fortement éloignés de la stabilité apparente de notre perception visuelle.

Des formes à la perception

Pour comprendre comment la fragmentation de la représentation visuelle dans notre cerveau coexiste avec la stabilité de notre perception du monde, il est important de considérer de façon générale la fonction de la vision. Celle-ci n’est pas simplement un processus passif, mais un échange entre les objets lumineux et leur représentation interne déduite par notre perception. Les principes d’organisation de la perception permettent de regrouper des éléments de la scène visuelle en se basant sur le principe selon lequel le tout est plus que la somme des parties. Par exemple, les formes peuvent être regroupées en fonction des régularités que nous avons l’habitude d’observer dans la nature, telles que celles observées dans les ramifications d’arbres ou la configuration d’une mousse ou d’une craquelure. Les formes dans la nature forment également des répétitions et des rythmes visuels, ainsi qu’une gamme de formes allant d’une apparence douce à chaotique, comme dans celles d’un nuage dans le ciel. La perception est également caractérisée par la prévalence de symétries, en particulier celles qui sont présentes dans les formes naturelles, comme la symétrie gauche-droite du corps humain. Les artistes cherchent souvent à utiliser cet aspect pour exprimer une certaine harmonie dans leur composition. La perception peut être consciente, même si de nombreux mécanismes restent inconscients. Son interprétation semble unique à un moment donné, et si deux interprétations sont possibles, c’est souvent la plus simple qui est choisie. En somme, la perception est l’ensemble des processus qui, en se basant sur notre connaissance des régularités observées dans la nature, nous permet de former une représentation stable du monde qui nous entoure.

Figure 3: Étienne Rey, Densité – Flou, 2019. Des points placés au hasard sont reliés par triangulation et imprimés par sérigraphie sur papier (100 x 100 cm). Leur observation provoque l’émergence de formes et volumes. Copyright Étienne Rey (ADAGP).

Comprendre comment nous percevons le monde visuel est toujours un défi. Cependant, il semble que, par rapport à la représentation analogique produite par la rétine, la perception manipule un monde numérique d’objets visuels. En effet, à l’image de l’alphabet plastique de Victor Vasarely, nous manipulons des objets visuels comme les contours d’un objet et un nombre limité d’orientations suffit à produire une esquisse de la scène visuelle. Un caractère essentiel de cette organisation perceptive est appelé la « Gestalt », c’est-à-dire, la mise en forme des éléments pour former un tout. Les règles de la Gestalt permettent à notre cerveau de relier les contours en fonction de leur proximité spatiale, leur similarité (par exemple de couleur) ou leur continuité, ainsi que d’autres critères qui permettent de séparer les objets de leur fond. Ces règles forment une sorte de grammaire qui guide notre perception visuelle.

Mais parfois, notre perception peut nous faire voir des objets qui n’existent pas, comme un visage dans les textures d’un rocher. Ce phénomène a été utilisé dans Densité – Flou, présentée à Avignon en 2019 (Figure 3), qui consistait en un ensemble de triangles indépendants disposés aléatoirement sur une surface. La forte densité des triangles induit la perception de formes imaginaires comme des voiles, des perspectives ou des structures tri-dimensionnelles élémentaires. Dans une autre œuvre, Trame Élasticité, présentée en 2016 dans le cadre d’un hommage à Victor Vasarely à la Fondation d’Aix-en-Provence, cette expérience était poussée plus loin : 25 monolithes de 3 m de hauteur et 40 cm de largeur étaient placés sur un socle rectiligne de 5 m de long et pouvaient tourner indépendamment suivant leur axe vertical. Cette chorégraphie produisait des moments de calme cristallin qui rapidement se transformaient en instants de chaos. Pour un observateur, ce procédé permettait de projeter son propre reflet tout en le fragmentant dans l’environnement de l’œuvre, notamment les rythmes colorés de Vasarely, afin de produire un va-et-vient entre les mondes réels et perçus. Les observateurs devaient alors changer de perspective pour résoudre cette incertitude et explorer le lien entre mondes réel et perçu.

Figure 4: Étienne Rey, Trame Élasticité, 2016, un hommage à Victor Vasarely dans le cadre de la Fondation d’Aix-en-Provence. Copyright Étienne Rey (ADAGP).

La perception relie donc notre monde intérieur au monde extérieur, réel. Dans cette approche dite phénoménologique, le monde visuel extérieur est une source d’inspiration qui alimente notre monde intérieur. La performance artistique, considérée encore comme un domaine réservé à l’espèce humaine, joue ici un rôle important dans notre vie mentale, car elle nourrit la construction de notre perception. L’observation et la création artistique nous permettent de remettre en question et d’enrichir notre compréhension de l’environnement. Un exemple de cette approche se dissimule dans l’œuvre Les ambassadeurs (1533) de Hans Holbein le Jeune (c. 1497-1543), dans lequel un memento mori est seulement perceptible suivant un point de vue excentré. Cette œuvre souligne comment on peut apporter un sens nouveau à une scène visuelle en changeant notre perspective. Ce lien intime et créatif entre l’œuvre d’art et sa compréhension contribue au plaisir, aux émotions et à l’expérience artistique.

Voir en agissant sur le monde

Dans notre analyse de la perception visuelle, nous avons jusqu’ici omis le facteur temps. En réalité, bien que les images atteignent notre rétine en quelques millisecondes, il faut environ une dixième de seconde pour que le cortex cérébral soit activé et autant de temps pour produire un mouvement oculaire tel qu’une saccade. La notion de présent est donc relative dans le cerveau et ce que nous percevons peut en réalité être différent de ce qui est devant nos yeux. Cette nouvelle dimension rend a priori la compréhension de la perception plus difficile, ce qui met en évidence la nécessité d’utiliser des approches plus avancées, telles que les mathématiques, pour mieux comprendre et reproduire ces processus. Une avancée importante dans ce domaine est de considérer que pour chaque scène visuelle, la perception génère en parallèle différentes hypothèses possibles de configuration des formes qui la compose. Par exemple, au lieu de mesurer les caractéristiques d’une image, comme l’orientation verticale d’une ligne, le cerveau représente toutes les orientations possibles d’une ligne. La dynamique de cette représentation permet alors de décrire les différents niveaux de vraisemblance et de l’inclure dans la grammaire de l’organisation perceptive pour comprendre comment les formes s’associent pour produire une perception. En explorant cette approche, nous avons pu considérer la perception comme un processus qui a émergé pour permettre aux systèmes vivants d’optimiser leurs chances de survie sur le long terme.

L’évolution favorise avant tout l’adaptabilité, ce qui signifie que le cerveau est capable de s’ajuster face aux changements pour réagir de manière efficace. La structure rétinotopique que nous avons précédemment décrite en est un exemple parfait : la fovéa permet en effet de mieux distinguer les objets situés dans l’axe de vue, ce qui représente un avantage évolutif pour les prédateurs que nous sommes. Par exemple, les lapins, qui sont des proies, sont dépourvus de fovéa. Toutefois, une fovéa est inutile sans la capacité à pouvoir bouger les yeux et donc le regard. Nous avons la capacité à produire une large gamme de ces mouvements, pour stabiliser une image en mouvement, mais aussi pour “sauter” sur la position d’un objet d’intérêt et ensuite suivre son mouvement. Cette nouvelle perspective bouleverse radicalement notre compréhension de la perception. Celle-ci peut donc être considérée comme un mécanisme qui intègre une sensation déformée et retardée avec les mouvements oculaires pour créer un monde visuel, interne, stable et unique. La perception, comme un processus de représentation stable du monde, devient alors un atout pour l’évolution de notre espèce.

Figure 5: Étienne Rey, Tropique, 2013. Capture de deux personnes plongées dans la sculpture formée par la projection de segments dynamiques dans l’espace de l’installation. Copyright Étienne Rey (ADAGP).

Illustrons ce point grâce à Tropique. Étienne Rey a conçu cette œuvre d’art en travaillant avec Wilfried Wendling pour la partie sonore, tandis que j’ai apporté mon expertise scientifique à leur collaboration. Elle a été produite pour l’Année européenne de la culture d’Aix-Marseille et présentée en 2013 à la fondation Vasarely. Cette installation immersive consiste en une sculpture de lumière incluse dans un espace fermé de 20 mètres de longueur sur 15 mètres de large. De minuscules billes d’eau transparentes, invisibles à l’œil nu, flottent dans la salle plongée dans l’obscurité. Par diffraction, elles constituent chacune une source de lumière lorsqu’elles sont illuminées par des vidéoprojecteurs qui sont placés aux bords opposés de la salle. Ces derniers projettent des segments qui composent l’alphabet de la sculpture. Chaque segment est caractérisé par sa position, sa longueur et son orientation et chacun crée ainsi une lame de lumière dans l’espace de la salle. Une fois les segments combinés, ils forment un monde propre à la sculpture et isolé du monde habituel (Figure 5). La grammaire qui régit les mouvements de ces segments est inspirée par les forces d’attraction et de répulsion observées aussi bien aux tailles microscopiques des atomes et celle macroscopique des galaxies. Cette population de segments évoluait alors comme un système autonome, sans scénario pré-écrit ou enregistré et complété par une synchronisation des différentes sources de lumière ainsi que du système de génération spatiale du son. Un point crucial de l’installation était d’introduire une interaction intime entre ce système et chaque observateur. Un discret système de capteurs de mouvement permettait de localiser la présence des différents observateurs et de modifier la configuration de la sculpture en fonction de leurs mouvements. Le système évoluait ainsi de façon autonome d’une sculpture de lumière, que l’on pouvait regarder et toucher, à une configuration dans laquelle le spectateur était plongé dans un monde propre, intime. Dans cet état, les segments alignés autour de l’observateur formaient une “aura” où tout repère de perspective était perdu. Ce dispositif, en manipulant visible et invisible, invitait les spectateurs à lever alors le voile sur des mécanismes cachés de leur perception.

Dans ce nouveau genre d’initiative artistique, la manipulation des formes et des perceptions met en lumière l’importance de la créativité. Les avancées récentes des intelligences artificielles, construites à partir de grandes bases de données sensorielles et d’apprentissage par renforcement, démontrent que celles-ci peuvent maintenant avoir des conversations naturelles et générer du son, des images ou des vidéos. Cependant, notre jugement critique reste fondamental pour apprécier ce qui est créatif à la lumière des émotions qui sont évoquées. Cet aspect a été mis en avant par Victor Vasarely comme un aspect essentiel de sa propre œuvre et de l’art cinétique en général. Il souligne l’importance d’incarner l’expérience artistique en engageant l’observateur dans son appréciation de l’œuvre, notamment par l’introduction de nouvelles dimensions comme le mouvement et le temps. Les agents artificiels manquent encore de la capacité d’engagement physique avec le monde visuel, ce qui était en particulier un aspect crucial dans l’œuvre Tropique. Dans cette installation, les spectateurs ont pu explorer le monde de la sculpture en se déplaçant physiquement dans l’espace, apprivoisant ainsi un monde nouveau, mais étrangement familier. Intuitivement, ils ont pu comprendre les règles de l’installation et ressentir interactivement les émotions générées de manière autonome par l’installation, tantôt rapides et tantôt contemplatives.

Voir a-t-il un sens ?

En somme, Art et Sciences abordent la question de la relation entre réalité et perception avec des approches différentes, mais intimement complémentaires. Ensemble, ils permettent de reconsidérer notre relation avec le monde en tant qu’individus et en tant qu’espèce, remettant en question la spécificité réservée à l’humain de pouvoir apprécier la création artistique. Aujourd’hui, nous commençons à comprendre le rôle de la vision et sa fonction dans la synergie entre les formes sensorielles et la perception. Cette synergie définit notre propre “cinéma interne” qui, à l’analogue de notre voix interne, définit pour une large part notre identité et qui, pour l’essentiel, reste un mystère ouvert dont la découverte nous échappe encore.