登录 注册
当前位置:主页 > 资源下载 > 46 > 皮卡丘排球项目中Ape-x DQN的PyTorch实现:apex_dqn_pytorch

皮卡丘排球项目中Ape-x DQN的PyTorch实现:apex_dqn_pytorch

  • 更新:2024-08-06 11:11:26
  • 大小:1.6MB
  • 推荐:★★★★★
  • 来源:网友上传分享
  • 类别:其它 - 开发技术
  • 格式:ZIP

资源介绍

Alphachu:皮卡丘排球的Ape-x DQN实现 培训代理商,以学习如何玩皮卡丘排球。 架构是基于从猿-X DQN。 该游戏位于exe文件中,这使整个问题比其他Atari游戏要复杂得多。 我构建了python环境来获取游戏的屏幕截图,以提供状态信息并检测游戏的开始和结束。 我使用mss进行屏幕截图,使用cv2预处理图像,使用Pynput按下键盘,并使用tensorboardX记录日志。 我为每个参与者使用Xvfb创建了许多虚拟监视器。 为了向每个监视器提供不同的键输入,该体系结构必须是多进程的。 学习者仅在GPU上训练,许多(假设10个)参与者从虚拟监视器收集数据。 它们通过日志目录中的文件进行通信。 听起来很复杂。 我的方法看起来很原始,但这是训练皮卡丘排球的唯一方法。 开始之前 我在Ubuntu和Mac上尝试过。 在actor.py和learninger.py中重置log_d