漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品

GitHub开源项目:Hindsight Experience Replay

talkingdev • 2023-06-16

1329728 views

近日,OpenAI开源了一份老但经典的论文——Hindsight Experience Replay,该论文是OpenAI成立初期所撰写的。Hindsight Experience Replay是一种处理强化学习中非每个时间步都有奖励的方法,它将代理的经验保存在重放缓冲区中,并回放经验,假装终止状态是目标状态。这使得模型能够学习更好的问题表示。 ## 要点摘要: - Hindsight Experience Replay是OpenAI成立初期撰写的一份经典论文。 - 该方法用于解决强化学习中奖励不是每个时间步都有的情况。 - 该方法将代理的经验保存在重放缓冲区中,并回放经验,假装终止状态是目标状态。