[2015] [Gorila DQN] [Massively Parallel Methods for Deep Reinforcement Learning]
Massively Parallel Methods for Deep Reinforcement Learning, 2015
DQN 的并行版
- DQN 在单个 GPU 上需要耗时 12-14 天来学习 Atari 游戏
- Gorila DQN 仅需不到 4 天,就可以在 41/49 个游戏上超过 DQN 的效果
- 引入 Parameter Server,Learner, Actor
- Actor: 一共N a c t N_{act}N
