《策略前展、策略迭代与分布式强化学习》 [美]德梅萃·P. 博赛卡斯（Dimitri P. Bertsekas）著 9787302599388 【清华大学出版社官方正版电子书】- 文泉书局

策略前展、策略迭代与分布式强化学习

作者： [美]德梅萃·P. 博赛卡斯（Dimitri P. Bertsekas）著

出版日期： 2022-04-01

电子书：暂不销售（ 定价：139.0 ）

收藏
加书架
引用

简介

本书目的是从作者最近出版的《强化学习预最优控制》教科书中更深入地发展一些方法。特别是，提出了有关涉及多个代理，分区架构和分布式异步计算的系统的新研究。本书还将详细讨论该方法在挑战离散/组合优化问题（例如路由，调度，分配和混合整数编程）中的应用，包括在这些情况下使用神经网络近似。本书可作为计算机科学与技术、控制科学与技术、电子科学与技术等相关领域研究生和高年级本科生的教学参考书，也可供信息、通信、控制、优化等领域的科研人员参考。

编辑推荐

读者通过本书可以了解强化学习中策略迭代，特别是Rollout方法在分布式和多智能体框架下的最新进展和应用。本书可用作人工智能或系统与控制科学等相关专业的高年级本科生或研究生作为一个学期的课程教材。也适用于开展相关研究工作的专业技术人员作为参考书阅读。

更多出版物信息

版权：清华大学出版社
出版： 2022-04-01
作者：[美]德梅萃·P. 博赛卡斯（Dimitri P. Bertsekas）著
更新： 2023-11-16
书号：9787302599388
中图：TP181
学科：

工学

控制科学与工程
工学

计算机科学与技术
交叉学科

智能科学与技术

封面 1

扉页 2

版权页 3

影印版序 4

ABOUT THE AUTHOR 6

Contents 8

Preface 12

1 Exact and Approximate Dynamic Programming Principles 16

2 General Principles of Approximation in Value Space 118

3 Specialized Rollout Algorithms 210

4 Learning Values and Policies 300

5 Infinite Horizon Problems 344

正文结束 465

References 466

Index 492

封底 500

策略前展、策略迭代与分布式强化学习

作者信息

[美]德梅萃·P. 博赛卡斯（Dimitri P. Bertsekas）著

推荐专题

正义的算法：司法变革与未来法治

数字时代的艺术生产：工具、AI与跨媒介实践

数字经济浪潮：洞察、变革与前沿

碳路新篇：战略、路径与创新

“移” 路探索：移动智能新纪元

驭见智行：自动驾驶全景洞察

相关图书

多主体强化学习协作策略研究

多主体强化学习协作策略研究

英语学习策略与方法

英语学习策略与方法

英语学习策略与思维训练

英语学习策略与思维训练

英语学习策略与技巧（第3版）

英语学习策略与技巧（第3版）

基于顾客策略型行为的预售策略研究

基于顾客策略型行为的预售策略研究

量化投资策略

量化投资策略

中考数学十大突破——母题情境学习策略

中考数学十大突破——母题情境学习策略

强化学习

强化学习

强化学习

强化学习

相关课程

闭环空间策略

服务变现策略

超级用户制胜策略

内容创新策略

讲课设计的策略方法和理念

分布式机器学习实战（9787302552932/085311-01）

深度强化学习理论与实践（9787302625544/095306-01）

雅思写作强化班（陈国辉）

【强化备考】软考系统集成项目管理工程师（中级）强化备考班

马泉艺术展——对话马泉

策略前展、策略迭代与分布式强化学习

作者信息

[美]德梅萃·P. 博赛卡斯（Dimitri P. Bertsekas） 著

推荐专题

正义的算法：司法变革与未来法治

数字时代的艺术生产：工具、AI与跨媒介实践

数字经济浪潮：洞察、变革与前沿

碳路新篇：战略、路径与创新

“移” 路探索：移动智能新纪元

驭见智行：自动驾驶全景洞察

相关图书

多主体强化学习协作策略研究

英语学习策略与方法

英语学习策略与思维训练

英语学习策略与技巧（第3版）

基于顾客策略型行为的预售策略研究

量化投资策略

中考数学十大突破——母题情境学习策略

强化学习

强化学习

相关课程

[美]德梅萃·P. 博赛卡斯（Dimitri P. Bertsekas）著