Bonjour,
Je cherche à comprendre comment déterminer le nombre de neurones cachées sur une couche cachée d'un perceptron multicouche à trois couches.
Je pensais à la dimension de Vapnik mais apparemment cette méthode est plus difficile (si vous la connaissez et savez comment le faire, ce sera avec grand plaisir).
Selon des sites sur Google, l'idéal serait de regarder l'erreur de validation croisée. Je ne comprends pas ce qu'est train ? Test ?
Par exemple, j'ai 3 vecteurs d'entrées de taille de 200 et 4 vecteurs de sortie de taille 200. Avec la méthode de validation croisée K-fold (K=10, par exemple), j'ai deux ensembles, l'un (K-1 partitions) d'apprentissage dit "train" et l'autre de test (1 partition). Si je comprends bien, l'algorithme est le suivant :
1) découper l'échantillon en K partitions
2) Pour chaque choix du nombre de neurones cachés et pour k entre 1 et K, calculer l'erreur quadratique entre les sorties de test (donc de taille 20 = 200/K=200/10) et les sorties du réseau de neurones et la stocker
3) Calculer la moyenne des erreurs pour chaque de nombres de taille de la couche intermédiaire
4) Tracer le graphe et déterminer l'erreur minimale
Question : que faire des "train" (de taille 180) ??
Merci beaucoup
Partager