-
皮卡丘排球项目中Ape-x DQN的PyTorch实现:apex_dqn_pytorch
资源介绍
Alphachu:皮卡丘排球的Ape-x DQN实现
培训代理商,以学习如何玩皮卡丘排球。 架构是基于从猿-X DQN。 该游戏位于exe文件中,这使整个问题比其他Atari游戏要复杂得多。 我构建了python环境来获取游戏的屏幕截图,以提供状态信息并检测游戏的开始和结束。 我使用mss进行屏幕截图,使用cv2预处理图像,使用Pynput按下键盘,并使用tensorboardX记录日志。 我为每个参与者使用Xvfb创建了许多虚拟监视器。 为了向每个监视器提供不同的键输入,该体系结构必须是多进程的。 学习者仅在GPU上训练,许多(假设10个)参与者从虚拟监视器收集数据。 它们通过日志目录中的文件进行通信。
听起来很复杂。 我的方法看起来很原始,但这是训练皮卡丘排球的唯一方法。
开始之前
我在Ubuntu和Mac上尝试过。
在actor.py和learninger.py中重置log_d
- 上一篇: python皮卡丘Pikachu.py
- 下一篇: canvas绘制皮卡丘