Bonjour j'essaie de faire un reseau de neuronne avec deux entree et deux sorties.
En gros les entrees sont :
-Distance
-Orientation
Et les sorties devraient etre donc:
-se deplacer
-regarder dans la bonne direction.
Pour apprendre mon reseau j'utilise le "BackPropagationLearningAlgorithm".
Mes fonctions rewards sont:
rewardsMove = 1f - ((len - DistanceToMaintain) / 5000f);
et
rewardsOrientation = MONORIENTATION + TARGETORIENTATION == 0 ? 1 : 0
Une fois que j'ai appris le reseau j'aimerai que l'agent reste toujours a la "DistanceToMaintain" et avec la bonne orientation mais ce n'est pas le cas...:S
Pour savoir l'action a effectuer (De se deplacer ou regarder dans la bonne direction) je choisis l'output max.
J'aurai besoin d'un petit coup de main ,
Merci a vous.
Partager