梯度提升算法实战 : 基于XGBoost 和scikit-learn

作者: ( 美) 科里• 韦德 (Corey Wade) 著;张生军译

出版社: 清华大学出版社

出版日期: 2024-04-01

电子书 ¥64.34 定价:99.0
  • 收藏

  • 加书架

  • 引用

简介

本书首先介绍了scikit-learn中的机器学习和XGBoost技术,然后探讨了梯度提升背后的理论知识。包括决策树、装袋技术及XGBoost超参数。本书将从头开始构建梯度提升模型,并将梯度提升扩展到大数据领域。本书重点探讨XGBoost的细节,着重于速度增强和通过数学推导导出参数。通过详细案例研究,练习使用 scikit-learn 、原始的 Python API 构建、以及微调 XGBoost 分类器和回归器。利用XGBoost超参数来提高评分、纠正缺失值、缩放不平衡数据集以及微调备选基学习器。最后,应用高级 XGBoost 技术,如构建非相关的集成模型、堆叠模型,并使用稀疏矩阵、定制的转换器和管道为行业部署准备模型。全书共分3篇:第1篇(第1~4章)为入门篇,介绍XGBoost背后的实用理论,包括装袋和提升模型结构、数据预处理、回归和分类模型、XGBoost基本模型及超参数微调;第2篇(第5~7章)为进阶篇,介绍XGBoost框架构成及超参数优化;第3篇(第8~10章)为进阶篇,着重讨论微调备选基学习器、创新技巧、特征工程,并使用稀疏矩阵、定制转换器和管道,练习构建适合行业部署的模型。全书提供了大量应用实例。本书适合作为高等院校计算机、软件工程专业高年级本科生、研究生的教材,同时适合有一定机器学习基础的数据科学家、机器学习工程师和研究人员阅读,为解决复杂问题提供实用指导。

编辑推荐

本书从机器学习基础出发,详解XGBoost模型构建和优化过程,并借助实例分析,引入XGBoost工业化应用的高级方法和技巧,实用性强,便于自学。

更多出版物信息
  • 版权: 清华大学出版社
  • 出版: 2024-04-01
  • 作者:( 美) 科里• 韦德 (Corey Wade) 著;张生军译
  • 更新: 2024-10-24
  • 书号:9787302659518
  • 中图:TP181
  • 学科:
    工学
    控制科学与工程
    工学
    计算机科学与技术
    交叉学科
    智能科学与技术

相关图书