-
回购深度强化学习纳米学位课程
资源介绍
深度强化学习纳米学位
该存储库包含与Udacity的“ 计划有关的材料。
目录
讲解
这些教程将引导您实现强化学习中的各种算法。 所有代码都在PyTorch(v0.4)和Python 3中。
:实现动态编程算法,例如策略评估,策略改进,策略迭代和值迭代。
:实施蒙特卡洛方法进行预测和控制。
:实施时差方法,例如Sarsa,Q-Learning和Expected Sarsa。
:了解如何离散化连续状态空间,以及解决Mountain Car环境。
:实现离散化连续状态空间的方法,以实现更好的泛化。
:探索如何使用深度Q网络(DQN)导航航天器而不会坠毁。
:使用C ++ API从3D虚拟机器人仿真中训练强化学习代理。 (外部链接)
:使用具有自适应噪声缩放功能的爬坡来平衡移动小车上的杆。
:使用交叉熵法训练汽车在陡峭的山坡上行驶。
:了解如何使用蒙特卡洛政策渐变,解决了经典
- 上一篇: python 强化学习
- 下一篇: 强力抓j扫描器