Principes de la Vision
De V1 aux réseaux convolutionnels
Le cortex visuel primaire
Hubel & Wiesel
[Hubel & Wiesel, 1962]
Réseaux convolutionnels : Math
- Convolution discrète uni-dimensionnelle (eg dans le temps) avec un noyau f de rayon $K$:
$$
(f \ast g)[n]=\sum_{m=-K}^{K} f[m] g[n-m]
$$
Réseaux convolutionnels : Math
- Convolution discrète d’une image (bi-dimensionnelle):
$$
(f \ast g)[x, y] = \sum_{i=-K}^{K} \sum_{j=-K}^{K} f[i, j] g[i-x, j-y]
$$
Réseaux convolutionnels : l’opération de convolution
Réseaux convolutionnels : Math
- Convolution discrète d’une image sur plusieurs canaux de sortie:
$$
(f \ast g)[x, y, k] = \sum_{i=-K}^{K} \sum_{j=-K}^{K} f[k, i, j, k] g[i-x, j-y]
$$
Réseaux convolutionnels : Math
- Convolution discrète d’une image multi-canaux (eg. RGB) sur plusieurs canaux de sortie (noter l’ordre des indices):
$$
(f \ast g)[x, y, k] = \
\sum_{i=-K}^{K} \sum_{j=-K}^{K} \sum_{c=1}^{C} f[k, c, i, j] g[i-x, j-y, c]
$$
Mise en pratique: détecter & apprendre
Topographie dans V1
Spiking Neural Networks
Applications robotiques