Donate to arXiv
Title:Adversar A3C pentru învățare robustă prin întărire Authors: Adversar A3C pentru învățare robustă prin întărire :Zhaoyuan Gu, Zhenzhong Jia, Howie Choset Download PDF Abstract: Asynchronous Advantage Actor Critic (A3C) este un algoritm eficient de ReinforcementLearning (RL) pentru o gamă largă de sarcini, cum ar fi jocurile Atari și controlul roboților. Agentul învață politicile și funcția … Citește mai mult