Python深度强化学习——使用PyTorch, TensorFlow 和OpenAI Gym

作者: [印]尼米什·桑吉(Nimish Sanghi)著,罗俊海 译

出版社: 清华大学出版社

出版日期: 2022-10-01

电子书 暂不销售 定价:69.0
  • 收藏

  • 加书架

  • 引用

简介

本书重点突出深度强化学习理论的基本概念、前沿基础理论和Python应用实现。首先介绍马尔可夫决策、基于模型的算法、无模型方法、动态规划、蒙特卡洛和函数逼近等基础知识;然后详细阐述强化学习、深度强化学习、多智能体强化学习等算法,及其Python应用实现。本书既阐述奖励、价值函数、模型和策略等重要概念和基础知识,又介绍深度强化学习理论的前沿研究和热点方向。本书英文版出版之后,广受好评,已成为深度强化学习领域畅销教材,也可为人工智能和机器学习等领域的科研工作者、技术工程师提供参考。

编辑推荐

(1)知识覆盖全面,内容新颖独特,涵盖基于模型的算法、无模型方法、深度Q-学习、策略梯度和多智能体强化学习等算法以及国际前沿研究和热点方向。 (2)侧重基本概念和基础知识,总结提炼强化学习和深度强化学习的理论研究。 (3)重点突出在OpenAI Gym工具包下使用PyTorch和TensorFlow框架的深度强化学习算法。 (4)详尽分析特定场景领域的数学建模和理论推导过程,理论讲解深入浅出,应用实例简洁易懂,源代码清晰易理解。 (5)适合作为大学生的教材以及工程师的参考书籍。在有限篇幅内系统精炼地阐明基本理论、方法,辅以典型的理论分析、实例和相关程序,化繁为简,便于学习和认知。

更多出版物信息
  • 版权: 清华大学出版社
  • 出版: 2022-10-01
  • 作者:[印]尼米什·桑吉(Nimish Sanghi)著,罗俊海 译
  • 更新: 2023-11-16
  • 书号:9787302607724
  • 中图:TP311.561
  • 学科:
    工学
    控制科学与工程
    工学
    计算机科学与技术
    工学
    软件工程

作者信息

[印]尼米什·桑吉(Nimish Sanghi)著,罗俊海 译

作者简介 Nimish Sanghi(尼米什·桑吉)一位充满激情的技术领导者,专注于使用技术解决客户问题,在软件和咨询领域拥有超过25年的工作经验,拥有人工智能和深度学习的多项证书,获得印度理工学院电气工程学士学位、印度管理学院工商管理硕士学位。曾在普华永道、IBM和Oracle等公司担任领导职务,负责盈亏管理。2006年,在SOAIS公司开启软件咨询创业之旅,为《财富》100强的众多公司提供自动化和数字化转型服务,实现从本地应用到云计算的转型。人工智能和自动化驱动的初创公司领域的天使投资人,联合创立面向印度市场的SaaS人力资源和薪资Paybooks平台,联合创立提供人工智能驱动的工作流ZipperAgent自动化平台和视频营销ZipperHQ自动化平台(总部位于波士顿的初创公司),现任这两个平台的首席技术官和首席数据科学家。 译者简介 罗俊海,博士(后),电子科技大学副教授、硕士生导师。主要研究方向为智能计算、目标检测和数据融合,主持国家自然科学基金、四川省科技厅基金、总装预研基金和中央高校基本科研业务等15项,参与制订标准6项,发表文章60余篇,其中SCI检索50余篇,总引用1500余次。申请和授权发明专利30余项,获四川省科学技术进步奖二等奖和三等奖各1项。出版《多源数据融合和传感器管理》《使用HTML和CSS开发WEB网站》《物联网系统开发及应用实战》等专著和教材5部,以及译著《实用MATLAB深度学习:基于项目的方法》。

相关图书