策略前展、策略迭代与分布式强化学习

作者: [美]德梅萃·P. 博赛卡斯(Dimitri P. Bertsekas) 著

出版社: 清华大学出版社

出版日期: 2022-04-01

电子书 暂不销售 定价:139.0
  • 收藏

  • 加书架

  • 引用

简介

本书目的是从作者最近出版的《强化学习预最优控制》教科书中更深入地发展一些方法。特别是,提出了有关涉及多个代理,分区架构和分布式异步计算的系统的新研究。本书还将详细讨论该方法在挑战离散/组合优化问题(例如路由,调度,分配和混合整数编程)中的应用,包括在这些情况下使用神经网络近似。 本书可作为计算机科学与技术、控制科学与技术、电子科学与技术等相关领域研究生和高年级本科生的教学参考书,也可供信息、通信、控制、优化等领域的科研人员参考。

编辑推荐

读者通过本书可以了解强化学习中策略迭代,特别是Rollout方法在分布式和多智能体框架下的最新进展和应用。本书可用作人工智能或系统与控制科学等相关专业的高年级本科生或研究生作为一个学期的课程教材。也适用于开展相关研究工作的专业技术人员作为参考书阅读。

更多出版物信息
  • 版权: 清华大学出版社
  • 出版: 2022-04-01
  • 作者:[美]德梅萃·P. 博赛卡斯(Dimitri P. Bertsekas) 著
  • 更新: 2023-11-16
  • 书号:9787302599388
  • 中图:TP181
  • 学科:
    工学
    控制科学与工程
    工学
    计算机科学与技术
    交叉学科
    智能科学与技术