强化学习(微课版)

作者: 袁莎、白朔天、唐杰

出版社: 清华大学出版社

出版日期: 2021-09-27

  • 优惠券
  • ¥3
    ¥10
    ¥30
    ¥70
  • 领券
电子书 ¥44.85 定价:69.0
  • 收藏

  • 加书架

  • 引用

简介

本书构建了一个完整的强化学习入门路径,深入浅出地介绍了强化学习算法的基本原理和实现方法。本书 首先回顾了相关预备知识,包括数学基础和机器学习基础,然后先介绍强化学习的基本概念,给出强化学习的 数学框架(马尔可夫决策过程),随后介绍强化学习的求解算法,包括表格求解法(动态规划法、蒙特卡洛法 和时序差分法),以及近似求解法(值函数近似法、策略梯度法和深度强化学习)。本书最后一部分为实践与前 沿,实践部分基于一个相同的例子实现了强化学习领域的主流基础算法,前沿部分介绍了强化学习领域的最新 研究进展。本书配有相当数量的习题供练习,配套代码基于 Python 实现,源代码均已开源,可开放获取。 本书可作为理工科本科生、研究生的“强化学习”课程的教材,也可作为相关从业者掌握强化学习的入门 参考书。

编辑推荐

本书是强化学习领域的入门书籍。本书结合大量清晰易懂的实际用用案例,能够帮助读者更好地理解强化学习各个算法的实现原理,降低了强化学习入学门槛。书中架构安排合理,语言表达准确,推理证明齐全。

更多出版物信息
  • 版权: 清华大学出版社
  • 出版: 2021-09-27
  • 作者:袁莎、白朔天、唐杰
  • 更新: 2023-06-21
  • 书号:9787302587941
  • 中图:TP181
  • 学科:
    工学
    控制科学与工程
    工学
    计算机科学与技术
    交叉学科
    智能科学与技术