Bonjour j'essaie de faire un reseau de neuronne avec deux entree et deux sorties.

En gros les entrees sont :
-Distance
-Orientation

Et les sorties devraient etre donc:
-se deplacer
-regarder dans la bonne direction.

Pour apprendre mon reseau j'utilise le "BackPropagationLearningAlgorithm".

Mes fonctions rewards sont:


rewardsMove = 1f - ((len - DistanceToMaintain) / 5000f);



et

rewardsOrientation = MONORIENTATION + TARGETORIENTATION == 0 ? 1 : 0


Une fois que j'ai appris le reseau j'aimerai que l'agent reste toujours a la "DistanceToMaintain" et avec la bonne orientation mais ce n'est pas le cas...:S
Pour savoir l'action a effectuer (De se deplacer ou regarder dans la bonne direction) je choisis l'output max.


J'aurai besoin d'un petit coup de main ,

Merci a vous.