《Python深度强化学习——使用PyTorch, TensorFlow 和OpenAI Gym》 [印]尼米什·桑吉（Nimish Sanghi）著，罗俊海译 9787302607724 【清华大学出版社官方正版电子书】- 文泉书局

Python深度强化学习——使用PyTorch, TensorFlow 和OpenAI Gym

出版日期： 2022-10-01

电子书：暂不销售（ 定价：69.0 ）

收藏
加书架
引用

简介

本书重点突出深度强化学习理论的基本概念、前沿基础理论和Python应用实现。首先介绍马尔可夫决策、基于模型的算法、无模型方法、动态规划、蒙特卡洛和函数逼近等基础知识；然后详细阐述强化学习、深度强化学习、多智能体强化学习等算法，及其Python应用实现。本书既阐述奖励、价值函数、模型和策略等重要概念和基础知识，又介绍深度强化学习理论的前沿研究和热点方向。本书英文版出版之后，广受好评，已成为深度强化学习领域畅销教材，也可为人工智能和机器学习等领域的科研工作者、技术工程师提供参考。

编辑推荐

（1）知识覆盖全面，内容新颖独特，涵盖基于模型的算法、无模型方法、深度Q-学习、策略梯度和多智能体强化学习等算法以及国际前沿研究和热点方向。（2）侧重基本概念和基础知识，总结提炼强化学习和深度强化学习的理论研究。（3）重点突出在OpenAI Gym工具包下使用PyTorch和TensorFlow框架的深度强化学习算法。（4）详尽分析特定场景领域的数学建模和理论推导过程，理论讲解深入浅出，应用实例简洁易懂，源代码清晰易理解。（5）适合作为大学生的教材以及工程师的参考书籍。在有限篇幅内系统精炼地阐明基本理论、方法，辅以典型的理论分析、实例和相关程序，化繁为简，便于学习和认知。

更多出版物信息

版权：清华大学出版社
出版： 2022-10-01
作者：[印]尼米什·桑吉（Nimish Sanghi）著，罗俊海译
更新： 2023-11-16
书号：9787302607724
中图：TP311.561
学科：

工学

控制科学与工程
工学

计算机科学与技术
工学

软件工程

封面 1

扉页 2

版权页 3

前言 4

目录 6

第1章强化学习导论 9

第2章马尔可夫决策 19

第3章基于模型的算法 38

第4章无模型方法 55

第5章函数逼近 82

第6章深度Q-学习 101

第7章策略梯度算法 133

第8章结合策略梯度和Q-学习 159

第9章综合规划与学习 191

第10章进一步的探索与后续工作 213

正文结束 229

术语 230

封底 242

作者信息

[印]尼米什·桑吉（Nimish Sanghi）著，罗俊海译

作者简介 Nimish Sanghi（尼米什·桑吉）一位充满激情的技术领导者，专注于使用技术解决客户问题，在软件和咨询领域拥有超过25年的工作经验，拥有人工智能和深度学习的多项证书，获得印度理工学院电气工程学士学位、印度管理学院工商管理硕士学位。曾在普华永道、IBM和Oracle等公司担任领导职务，负责盈亏管理。2006年，在SOAIS公司开启软件咨询创业之旅，为《财富》100强的众多公司提供自动化和数字化转型服务，实现从本地应用到云计算的转型。人工智能和自动化驱动的初创公司领域的天使投资人，联合创立面向印度市场的SaaS人力资源和薪资Paybooks平台，联合创立提供人工智能驱动的工作流ZipperAgent自动化平台和视频营销ZipperHQ自动化平台（总部位于波士顿的初创公司），现任这两个平台的首席技术官和首席数据科学家。译者简介罗俊海，博士(后)，电子科技大学副教授、硕士生导师。主要研究方向为智能计算、目标检测和数据融合，主持国家自然科学基金、四川省科技厅基金、总装预研基金和中央高校基本科研业务等15项，参与制订标准6项，发表文章60余篇，其中SCI检索50余篇，总引用1500余次。申请和授权发明专利30余项，获四川省科学技术进步奖二等奖和三等奖各1项。出版《多源数据融合和传感器管理》《使用HTML和CSS开发WEB网站》《物联网系统开发及应用实战》等专著和教材5部，以及译著《实用MATLAB深度学习：基于项目的方法》。