[Réseaux neuronaux] Architecture d'une couche de convolution

**ganondorf5** · 10/06/2016, 18h00

Bonjour,

je m'intéresse depuis peu aux réseaux de neurones, notamment en ce moments aux réseaux de neurones convolutifs, mais j'ai plusieurs questions auxquelles je n'arrive pas à trouver de réponse claire et précise ...
Je suis donc venu ici dans l'espoir d'y trouver des réponses !

Si j'ai bien compris, dans une couche "full connected", chaque neurone est relié à tous les neurones de la couche précédente et chaque neurones a également une matrice de poids (de la même taille que l'entrée) et un biais (optionnel).
Dans une telle couche les neurones vont faire la somme des x(i)*w(i) et rajouter le biais à la fin (x est l'entrée et w les poids).

Et dans une couche convolutionnelle c'est tout pareil sauf que la multiplication des matrices est remplacée par une convolution ? (où ce qui est entrainable est le noyau et le biais)
Si c'est le cas alors pourquoi une couche de convolution à des neurones en profondeur ?
Pourquoi dit-on que chaque neurone ne regarde qu'une partie de l'image à la fois, alors qu'ils font tous la convolution de toute l'image par leur filtre (noyau) ?
J'ai crus comprendre que les neurones sur le même "plan" regardaient des parties différentes de l'image mais partageaient le même noyau ? Et que les neurones en profondeur regardaient la même partie que les neurones devant et derrière mais avec un noyau différent (mais commun avec leur plan ?)

Si les neurones ne font pas la convolution de toute l'image par leur noyau alors que font-ils ? Font-ils seulement une seule itération de la convolution ? (faire la somme des produits indice à indice de leur noyau avec une partie de l'image ?) Dans ce cas il faut adapter le nombre de neurones de la première couche à la taille de l'image en entrée ?
Peut-être que c'est carrément l'opération de convolution que j'ai mal comprise et qu'en fait la convolution d'une matrice par un noyau est juste le fait de faire la somme des produits indice à indice de la matrice avec le noyau ? Mais d'après Wikipedia il faut réaliser cette étape en faisant glisser le noyau sur la matrice ...

Bon ça fait beaucoup de questions c'est vrai mais ce sont des questions simples et je suis complètement perdu

Si quelqu'un pouvait m'expliquer comment ça se passe exactement pour chaque neurone dans une couche de convolution ça m'aiderait vraiment beaucoup !

Merci d'avance !

[Réseaux neuronaux] Architecture d'une couche de convolution

Méthodes prédictives

Mode arborescent

Discussions similaires

Partager

Partager