简介
随机学习与优化在现代工程、社会、金融问题中具有广泛的应用。《随机学习与优化:基于灵敏度的方法》以一个统一的框架,涵盖了离散事件动态系统的摄动分析、马尔可大决策过程、强化学习、辨识和自适应控制等学习和优化的不同学科;并利用基于性能差分公式的简单方法介绍马尔可夫决策过程理论,通过该方法能求得以长期平均代价为准则的n阶偏差优化策略以及无折扣的Blackwell优化策略。《随机学习与优化:基于灵敏度的方法》还包含有最近发展出来的基于事件的优化方法,它为利用系统的特性来克服或减轻数灾的研究开辟了个新方向。《随机学习与优化:基于灵敏度的方法》强调以样本路径的构造为基础的物理解释,物理上的直观认识可以为完善已有的优化方法提供新思路。 为帮助读者理解掌握书中的内容,《随机学习与优化:基于灵敏度的方法》提供了大量的示例和丰富的习题。 《随机学习与优化:基于灵敏度的方法》适合作为相关专业的研究生教材,学生可从一门课程中学到原本属于多个不同学科的内容。《随机学习与优化:基于灵敏度的方法》有助于促进学习和优化领域中各学科之间的合作,对该领域的研究人员也大有裨益。
更多出版物信息
- 版权: 清华大学出版社
- 出版: 2011-02-01
- 更新: 2023-06-07
- 书号:9787302242925
- 中图:TP13;O211.6
- 学科:工学控制科学与工程工学计算机科学与技术
相关图书
-
结构可靠性分析与随机优化设计的统一方法
¥48.00