简介
本书循序渐进地讲解了使用Python语言实现强化学习的核心算法开发的知识,内容涵盖了数据处理、算法、大模型等知识,并通过具体实例的实现过程演练了各个知识点的使用方法和使用流程。本书共分为17章,主要内容包括强化学习基础、马尔可夫决策过程、蒙特卡洛方法、Q-learning与贝尔曼方程、时序差分学习和SARSA算法、DQN算法、DDQN算法、竞争DQN算法、REINFORCE算法、Actor-Critic算法、PPO算法、TRPO算法、连续动作空间的强化学习、值分布式算法、基于模型的强化学习、多智能体强化学习实战:Predator-Prey游戏及自动驾驶系统。本书内容简洁而不失技术深度,以极简的文字介绍了复杂的案例,易于阅读和理解。本书适用于已经了解Python语言基础语法的读者,想进一步学习强化学习、机器学习、深度学习及相关技术的读者,还可作为大专院校相关专业的师生用书和培训机构的教材使用。
编辑推荐
《强化学习基础、原理与应用》全面介绍强化学习领域的核心开发技术和项目实践。书中涵盖了强化学习领域的广泛内容,从算法到应用,从理论到实践,涵盖机器人控制、游戏、金融投资、自动驾驶等多个场景,让读者不仅能理解理论,还能将其应用到实际项目中。
更多出版物信息
- 版权: 清华大学出版社
- 出版: 2025-05-01
- 更新: 2025-06-18
- 书号:9787302685913
- 中图:TP312.8
- 学科:工学控制科学与工程工学计算机科学与技术