《深度强化学习理论与实践》龙强、章胜 9787302625544 【清华大学出版社官方正版电子书】- 文泉书局

深度强化学习理论与实践

作者：龙强、章胜

出版社：清华大学出版社

出版日期： 2023-03-01

优惠券：
￥3
￥10
￥30
￥70
领券

电子书：￥53.76 （ 定价：89.0 ）

支持送礼物

送给好友

收藏
加书架
引用

简介

本书比较全面、系统地介绍了深度强化学习的理论和算法，并配有大量的案例和编程实现。全书核心内容可以分为3部分，第一部分为经典强化学习，包括第2、3、4章，主要内容有动态规划法，蒙特卡洛法、时序差分法；第二部分为深度强化学习，包括第6、7、8章，主要内容有值函数近似法、策略梯度法、策略梯度法进阶；第三部分重点介绍了深度强化学习的经典应用——AlphaGo系列算法。另外，作为理论和算法的辅助，第1章介绍了强化学习的模型，第5章简单介绍了深度学习和PyTorch编程框架。本书可以作为理工科大学相关专业研究生的学位课教材，也可以作为人工智能、机器学习相关专业高年级本科生的选修课教材，还可以作为相关领域学术研究人员、教师和工程技术人员的参考资料。

编辑推荐

本书系统介绍深度强化学习的理论和算法，并配有大量的案例。全书核心内容可以分为3部分，第一部分为经典强化学习，主要内容有动态规划法，蒙特卡洛法、时序差分法；第二部分为深度强化学习，主要内容有值函数近似法、策略梯度法、策略梯度法进阶；第三部分重点介绍了深度强化学习的经典应用——AlphaGo系列算法。 ★ 大多数每个算法配有一个或多个测试案例，便于读者理解理论和算法； ★ 每个案例都配有编程实现的代码，便于读者理论联系实际，并亲自上手实践； ★ 为减轻读者编写代码的难度，本书所有案例的代码都是可以独立运行的，并且尽量减少了对依赖包的使用。

更多出版物信息

版权：清华大学出版社
出版： 2023-03-01
作者：龙强、章胜
更新： 2023-10-18
书号：9787302625544
中图：TP181
学科：

工学

控制科学与工程
工学

计算机科学与技术
交叉学科

智能科学与技术

封面页 1

书名页 2

版权页 3

作者简介 4

内容简介 5

前言 6

目录 7

第1章　强化学习的模型 8

第2章　动态规划法 24

第3章　蒙特卡罗法 35

第4章　时序差分法 58

第5章　深度学习与PyTorch 79

第6章　值函数近似算法 103

第7章　策略梯度算法 122

第8章　策略梯度法进阶 143

第9章　深度强化学习案例：AlphaGo系列算法 164

参考文献 183

作者信息

龙强、章胜

龙强，男，博士，副教授，硕士生导师；就职于西南科技大学理学院数据科学系，中国运筹学会终生会员，中国工业与应用数学学会会员；主要从事最优化理论与算法、机器学习研究；在国际国内学术期刊上发表论文20余篇；讲授算法设计与分析、最优化理论与算法、机器学习等课程。