强化学习基础、原理与应用

作者: 张百珂

出版社: 清华大学出版社

出版日期: 2025-05-01

电子书 暂不销售 定价:99.0
  • 收藏

  • 加书架

  • 引用

简介

本书循序渐进地讲解了使用Python语言实现强化学习的核心算法开发的知识,内容涵盖了数据处理、算法、大模型等知识,并通过具体实例的实现过程演练了各个知识点的使用方法和使用流程。本书共分为17章,主要内容包括强化学习基础、马尔可夫决策过程、蒙特卡洛方法、Q-learning与贝尔曼方程、时序差分学习和SARSA算法、DQN算法、DDQN算法、竞争DQN算法、REINFORCE算法、Actor-Critic算法、PPO算法、TRPO算法、连续动作空间的强化学习、值分布式算法、基于模型的强化学习、多智能体强化学习实战:Predator-Prey游戏及自动驾驶系统。本书内容简洁而不失技术深度,以极简的文字介绍了复杂的案例,易于阅读和理解。本书适用于已经了解Python语言基础语法的读者,想进一步学习强化学习、机器学习、深度学习及相关技术的读者,还可作为大专院校相关专业的师生用书和培训机构的教材使用。

编辑推荐

《强化学习基础、原理与应用》全面介绍强化学习领域的核心开发技术和项目实践。书中涵盖了强化学习领域的广泛内容,从算法到应用,从理论到实践,涵盖机器人控制、游戏、金融投资、自动驾驶等多个场景,让读者不仅能理解理论,还能将其应用到实际项目中。

更多出版物信息
  • 版权: 清华大学出版社
  • 出版: 2025-05-01
  • 作者:张百珂
  • 更新: 2025-06-18
  • 书号:9787302685913
  • 中图:TP312.8
  • 学科:
    工学
    控制科学与工程
    工学
    计算机科学与技术

作者信息

张百珂

张百珂,计算机硕士,前百度云研发工程师,在大规模机器学习、深度学习、数据搜索、行业垂直应用、研发管理等领域拥有丰富经验。在企业智能化转型、业务线上化经营,拥有丰富的大规模搜索架构、个性化推荐架构、机器学习系统架构经验和技术团队管理经验。现在从事与城市大数据中心的开发和建设工作,将深度学习运用到数字经济利领域。

相关图书