Réseaux de neurones artificiels et apprentissage machine appliqués à la compréhension de la vision

Laurent Perrinet

[2022-03-23] Master 1 Neurosciences et Sciences Cognitives

logo

Principes de la Vision

À quoi sert la vision?

[An Unexpected Visitor (Ilya Repin, 1884)](https://www.cabinetmagazine.org/issues/30/archibald.php)
An Unexpected Visitor (Ilya Repin, 1884)

À quoi sert la vision?

[An Unexpected Visitor (Yarbus, 1965)](https://www.cabinetmagazine.org/issues/30/archibald.php)
An Unexpected Visitor (Yarbus, 1965)

À quoi sert la vision?

[An Unexpected Visitor - *Age?* (Yarbus, 1965)](https://www.cabinetmagazine.org/issues/30/archibald.php)
An Unexpected Visitor - Age? (Yarbus, 1965)

À quoi sert la vision?

[An Unexpected Visitor - *How long?*  (Yarbus, 1965)](https://www.cabinetmagazine.org/issues/30/archibald.php)
An Unexpected Visitor - How long? (Yarbus, 1965)

Les illusions visuelles

[Hering illusion](https://en.wikipedia.org/wiki/Hering_illusion)
Hering illusion

Les illusions visuelles

[Hering illusion](https://en.wikipedia.org/wiki/Hering_illusion)
Hering illusion

Les illusions visuelles

Ilusions of brightness or lightness Akiyoshi KITAOKA

Les illusions visuelles

[Rotating Snakes *Akiyoshi KITAOKA*](http://www.ritsumei.ac.jp/~akitaoka/index-e.html)
Rotating Snakes Akiyoshi KITAOKA

Les illusions visuelles : Paréidolie

[Cydonia Mensae (1976) *Viking Orbiter image*](https://fr.wikipedia.org/wiki/Cydonia_Mensae)
Cydonia Mensae (1976) Viking Orbiter image

Les illusions visuelles : Paréidolie

[Cydonia Mensae (2007) *Mars Global Surveyor*](https://fr.wikipedia.org/wiki/Cydonia_Mensae)
Cydonia Mensae (2007) Mars Global Surveyor

Les illusions visuelles : Paréidolie

[Cydonia Mensae (2007) *Mars Global Surveyor*](https://fr.wikipedia.org/wiki/Cydonia_Mensae)
Cydonia Mensae (2007) Mars Global Surveyor

Les neurosciences computationnelles

[[Sejnowski,  Koch  & Churchland (1998)](http://www.hms.harvard.edu/bss/neuro/bornlab/nb204/papers/sejnowski-koch-churchland-science1988.pdf)]
[Sejnowski, Koch & Churchland (1998)]

De V1 aux réseaux convolutionnels

Le système visuel

[Système visuel humain (Wikipedia)](https://fr.wikipedia.org/wiki/Syst%C3%A8me_visuel_humain)
Système visuel humain (Wikipedia)

Le cortex visuel primaire

[Hubel & Wiesel, 1962]
[Hubel & Wiesel, 1962]

Hubel & Wiesel

[Hubel & Wiesel, 1962]

Réseaux convolutionnels : hiérarchie

[[Boutin *et al*, 2021](https://laurentperrinet.github.io/publication/boutin-franciosini-chavane-ruffier-perrinet-20/)]
[Boutin et al, 2021]

Réseaux convolutionnels : Math

  • Convolution discrète uni-dimensionnelle (eg dans le temps) avec un noyau f de rayon $K$: $$ (f \ast g)[n]=\sum_{m=-K}^{K} f[m] g[n-m] $$

Réseaux convolutionnels : Math

  • Convolution discrète d’une image (bi-dimensionnelle):

$$ (f \ast g)[x, y] = \sum_{i=-K}^{K} \sum_{j=-K}^{K} f[i, j] g[i-x, j-y] $$

Réseaux convolutionnels : l’opération de convolution

[[Amidi & Amidi](https://stanford.edu/~shervine/teaching/cs-230/cheatsheet-convolutional-neural-networks)]
[Amidi & Amidi]

Réseaux convolutionnels : Math

  • Convolution discrète d’une image sur plusieurs canaux de sortie:

$$ (f \ast g)[x, y, k] = \sum_{i=-K}^{K} \sum_{j=-K}^{K} f[k, i, j, k] g[i-x, j-y] $$

Réseaux convolutionnels : Math

  • Convolution discrète d’une image multi-canaux (eg. RGB) sur plusieurs canaux de sortie (noter l’ordre des indices):

$$ (f \ast g)[x, y, k] = \ \sum_{i=-K}^{K} \sum_{j=-K}^{K} \sum_{c=1}^{C} f[k, c, i, j] g[i-x, j-y, c] $$

Réseaux convolutionnels : CNN

[[Amidi & Amidi](https://stanford.edu/~shervine/teaching/cs-230/cheatsheet-convolutional-neural-networks)]
[Amidi & Amidi]

Mise en pratique: détecter & apprendre

Perspectives

Réseaux convolutionnels : hiérarchie

[[Boutin *et al*, 2021](https://laurentperrinet.github.io/publication/boutin-franciosini-chavane-ruffier-perrinet-20/)]
[Boutin et al, 2021]

Réseaux prédictifs

[[Boutin *et al*, 2021](https://laurentperrinet.github.io/publication/boutin-franciosini-chavane-ruffier-perrinet-20/)]
[Boutin et al, 2021]

Topographie dans V1

[Bosking *et al*, 1997]
[Bosking et al, 1997]

Spiking Neural Networks

From frame-based to event-based cameras.
From frame-based to event-based cameras.

Recurrent processing

[[Amidi & Amidi](https://stanford.edu/~shervine/teaching/cs-230/cheatsheet-convolutional-neural-networks)]
[Amidi & Amidi]

Dynamique de la vision

[[Thorpe (2001)]](https://laurentperrinet.github.io/2022-01-12_NeuroCercle/#/2/1)
[Thorpe (2001)]

Applications robotiques

Our system is divided into 3 units to process visual inputs communicating by event-driven, feed-forward and feed-back communications.
Our system is divided into 3 units to process visual inputs communicating by event-driven, feed-forward and feed-back communications.

Questions?

Ask info @ laurent.perrinet@univ-amu.fr

More info @ web-site