当前位置:主页 > 资源下载 > 50 > 基于值函数和策略梯度的深度强化学习综述_刘建伟.pdf下载

基于值函数和策略梯度的深度强化学习综述_刘建伟.pdf下载

更新：2024-07-15 19:31:26
大小：1.35MB
推荐：★★★★★
来源：网友上传分享
类别：机器学习 - 人工智能
格式：PDF

反馈 / 投诉

资源介绍

作为人工智能领域的热门研究问题，深度强化学习自提出以来，就受到人们越来越多的关注。目前，深度强化学习能够解决很多以前难以解决的问题，比如直接从原始像素中学习如何玩视频游戏和针对机器人问题学习控制策略，深度强化学习通过不断优化控制策略，建立一个对视觉世界有更高层次理解的自治系统。其中，基于值函数和策略梯度的深度强化学习是核心的基础方法和研究重点。本文对这两类深度强化学习方法进行了系统的阐述和总结，包括用到的求解算法和网络结构。首先，概述了基于值函数的深度强化学习方法，包括开山鼻祖深度Q 网络和基于深度Q 网络的各种改进方法。然后介绍了策略梯度的概念和常见算法，并概述了深度确定性策略梯度

上一篇: 波尔兹曼机研究进展
下一篇: 网络安全基础：标准与应用第三版课后习题答案

相关推荐

12-02 基于值函数和策略梯度的深度强化学习综述_刘建伟.pdf下载

基于值函数和策略梯度的深度强化学习综述_刘建伟.pdf下载

资源介绍

热门标签

资源声明