当前位置:主页 > 资源下载 > 44 > Pytorch中强化学习算法的实现，包括但不限于SAC、DDPG、TD3、DQN、A2C、PPO和TRPO，即torchrl

Pytorch中强化学习算法的实现，包括但不限于SAC、DDPG、TD3、DQN、A2C、PPO和TRPO，即torchrl

更新：2024-07-30 10:24:56
大小：170KB
推荐：★★★★★
来源：网友上传分享
类别：其它 - 开发技术
格式：ZIP

反馈 / 投诉

资源介绍

火炬RL RL方法的Pytorch实现支持具有连续和离散动作空间的环境。支持具有1d和3d观察空间的环境。支持多进程环境要求一般要求火炬1.7 健身房（0.10.9） Mujoco（1.50.1）列表（用于日志） tensorboardX（日志文件输出）张量板要求 Tensorflow：启动tensorboard或读取tf记录中的日志安装使用use environment.yml创建虚拟环境 conda create -f environment.yml source activate py_off 手动安装所有要求用法在配置文件中指定算法的参数，并在参数中指定日志目录/种子/设备 python examples/ppo_continuous_vec.py --config config/ppo_halfcheetah.json --seed 0 --device 0 --id ppo_halfcheetah 结帐示例文件夹以获取详细信息目前包含：政策上的方法：加强 A2C（演员评论家） PPO（近端政策优化）

相关推荐

12-02 Pytorch中强化学习算法的实现，包括但不限于SAC、DDPG、TD3、DQN、A2C、PPO和TRPO，即torchrl

Pytorch中强化学习算法的实现，包括但不限于SAC、DDPG、TD3、DQN、A2C、PPO和TRPO，即torchrl

资源介绍

热门标签

资源声明