当前位置:主页 > 资源下载 > 在OpenAI Gym环境中实现的DDPG（深度确定性策略梯度）算法，应用于连续控制，具备深度强化学习特性，即ddpg-aigym

在OpenAI Gym环境中实现的DDPG（深度确定性策略梯度）算法，应用于连续控制，具备深度强化学习特性，即ddpg-aigym

更新：2024-07-30 11:29:02
大小：322KB
推荐：★★★★★
来源：网友上传分享
类别：其它 - 开发技术
格式：ZIP

反馈 / 投诉

资源介绍

ddpg-aigym 深度确定性策略梯度 Tensorflow中深度确定性策略梯度算法的实现（Lillicrap等人。）如何使用 git clone https://github.com/stevenpjg/ddpg-aigym.git cd ddpg-aigym python main.py 培训期间一旦训练学习曲线 InvertedPendulum-v1环境的学习曲线。依存关系 Tensorflow（在tensorflow版本0.11.0rc0 ） OpenAi体育馆 Mujoco 产品特点批量归一化（提高学习速度）梯度转换器（在arXiv中提供：）注意使用不同

上一篇: DDPG_update.py
下一篇: 如何清空matlab的代码-understand-ddpg:DDPG学习心得

相关推荐

12-02 在OpenAI Gym环境中实现的DDPG（深度确定性策略梯度）算法，应用于连续控制，具备深度强化学习特性，即ddpg-aigym

在OpenAI Gym环境中实现的DDPG（深度确定性策略梯度）算法，应用于连续控制，具备深度强化学习特性，即ddpg-aigym

资源介绍

热门标签

资源声明