深度强化学习理论与实践

作者: 龙强、章胜

出版社: 清华大学出版社

出版日期: 2023-03-01

  • 优惠券
  • ¥3
    ¥10
    ¥30
    ¥70
  • 领券
电子书 ¥53.76 定价:89.0
  • 收藏

  • 加书架

  • 引用

简介

本书比较全面、系统地介绍了深度强化学习的理论和算法,并配有大量的案例和编程实现。全书核心内容可以分为3部分,第一部分为经典强化学习,包括第2、3、4章,主要内容有动态规划法,蒙特卡洛法、时序差分法;第二部分为深度强化学习,包括第6、7、8章,主要内容有值函数近似法、策略梯度法、策略梯度法进阶;第三部分重点介绍了深度强化学习的经典应用——AlphaGo系列算法。另外,作为理论和算法的辅助,第1章介绍了强化学习的模型,第5章简单介绍了深度学习和PyTorch编程框架。 本书可以作为理工科大学相关专业研究生的学位课教材,也可以作为人工智能、机器学习相关专业高年级本科生的选修课教材,还可以作为相关领域学术研究人员、教师和工程技术人员的参考资料。

编辑推荐

本书系统介绍深度强化学习的理论和算法,并配有大量的案例。全书核心内容可以分为3部分,第一部分为经典强化学习,主要内容有动态规划法,蒙特卡洛法、时序差分法;第二部分为深度强化学习,主要内容有值函数近似法、策略梯度法、策略梯度法进阶;第三部分重点介绍了深度强化学习的经典应用——AlphaGo系列算法。 ★ 大多数每个算法配有一个或多个测试案例,便于读者理解理论和算法; ★ 每个案例都配有编程实现的代码,便于读者理论联系实际,并亲自上手实践; ★ 为减轻读者编写代码的难度,本书所有案例的代码都是可以独立运行的,并且尽量减少了对依赖包的使用。

更多出版物信息
  • 版权: 清华大学出版社
  • 出版: 2023-03-01
  • 作者:龙强、章胜
  • 更新: 2023-10-18
  • 书号:9787302625544
  • 中图:TP181
  • 学科:
    工学
    控制科学与工程
    工学
    计算机科学与技术
    交叉学科
    智能科学与技术

作者信息

龙强、章胜

龙强,男,博士,副教授,硕士生导师;就职于西南科技大学理学院数据科学系,中国运筹学会终生会员,中国工业与应用数学学会会员;主要从事最优化理论与算法、机器学习研究;在国际国内学术期刊上发表论文20余篇;讲授算法设计与分析、最优化理论与算法、机器学习等课程。

相关图书