-
收藏
-
加书架
-
引用
本书重点突出深度强化学习理论的基本概念、前沿基础理论和Python应用实现。首先介绍马尔可夫决策、基于模型的算法、无模型方法、动态规划、蒙特卡洛和函数逼近等基础知识;然后详细阐述强化学习、深度强化学习、多智能体强化学习等算法,及其Python应用实现。本书既阐述奖励、价值函数、模型和策略等重要概念和基础知识,又介绍深度强化学习理论的前沿研究和热点方向。本书英文版出版之后,广受好评,已成为深度强化学习领域畅销教材,也可为人工智能和机器学习等领域的科研工作者、技术工程师提供参考。
(1)知识覆盖全面,内容新颖独特,涵盖基于模型的算法、无模型方法、深度Q-学习、策略梯度和多智能体强化学习等算法以及国际前沿研究和热点方向。 (2)侧重基本概念和基础知识,总结提炼强化学习和深度强化学习的理论研究。 (3)重点突出在OpenAI Gym工具包下使用PyTorch和TensorFlow框架的深度强化学习算法。 (4)详尽分析特定场景领域的数学建模和理论推导过程,理论讲解深入浅出,应用实例简洁易懂,源代码清晰易理解。 (5)适合作为大学生的教材以及工程师的参考书籍。在有限篇幅内系统精炼地阐明基本理论、方法,辅以典型的理论分析、实例和相关程序,化繁为简,便于学习和认知。
- 版权: 清华大学出版社
- 出版: 2022-10-01
- 更新: 2023-11-16
- 书号:9787302607724
- 中图:TP311.561
- 学科:工学控制科学与工程工学计算机科学与技术工学软件工程
相关图书
-
Python深度学习异常检测 使用Keras和PyTorch
[美] 斯里达尔·阿拉(Sridhar Alla)、苏曼·卡拉扬·阿达里(Suman Kalyan Adari)著 杨小冬 译
¥98.00 -
概率深度学习 使用Python、Keras和TensorFlow Probability
[德] 奥利弗·杜尔(Oliver Dürr)、贝亚特·西克(Beate Sick)、埃尔维斯·穆里纳(Elvis Murina)著 崔亚奇 唐田田 但波 译
¥98.00 -
机器学习和深度学习:原理、算法、实战(使用Python 和 TensorFlow)
[印] 文卡塔·雷迪·科纳萨尼(Venkata Reddy Konasani)、沙伦德拉·卡德雷(Shailendra Kadre)著 秦婧 韩雨童 译
¥128.00