登录 注册
当前位置:主页 > 资源下载 > 9 > 回购深度强化学习纳米学位课程

回购深度强化学习纳米学位课程

  • 更新:2024-10-10 08:08:38
  • 大小:15.35MB
  • 推荐:★★★★★
  • 来源:网友上传分享
  • 类别:其它 - 开发技术
  • 格式:ZIP

资源介绍

深度强化学习纳米学位 该存储库包含与Udacity的“ 计划有关的材料。 目录 讲解 这些教程将引导您实现强化学习中的各种算法。 所有代码都在PyTorch(v0.4)和Python 3中。 :实现动态编程算法,例如策略评估,策略改进,策略迭代和值迭代。 :实施蒙特卡洛方法进行预测和控制。 :实施时差方法,例如Sarsa,Q-Learning和Expected Sarsa。 :了解如何离散化连续状态空间,以及解决Mountain Car环境。 :实现离散化连续状态空间的方法,以实现更好的泛化。 :探索如何使用深度Q网络(DQN)导航航天器而不会坠毁。 :使用C ++ API从3D虚拟机器人仿真中训练强化学习代理。 (外部链接) :使用具有自适应噪声缩放功能的爬坡来平衡移动小车上的杆。 :使用交叉熵法训练汽车在陡峭的山坡上行驶。 :了解如何使用蒙特卡洛政策渐变,解决了经典