梯度提升算法实战
基于XGBoost 和 scikit-learn
CIP核准号 | 2024065073 |
ISBN | 978-7-302-65951-8 |
正书名 | 梯度提升算法实战 |
丛书名 | |
出版单位 | 清华大学出版社 |
出版地 | 北京 |
作者 | (美) 科里·韦德 (Corey Wade) , 著 | 出版时间 | 2024.4 |
分册名 | 分册号 | ||
定价(元) | 99 | 正文语种 | |
中图法分类 | TP181 | 主题词 | 机器学习-算法 |
内容摘要 | 本书首先介绍了scikit-learn中的机器学习和XGBoost技术,然后探讨了梯度提升背后的理论知识。包括决策树、装袋技术及XGBoost超参数。本书将从头开始构建梯度提升模型,并将梯度提升扩展到大数据领域。本书重点探讨XGBoost的细节,着重于速度增强和通过数学推导导出参数。通过详细案例研究,练习使用 scikit-learn 、原始的 Python API 构建、以及微调 XGBoost 分类器和回归器。利用XGBoost超参数来提高评分、纠正缺失值、缩放不平衡数据集以及微调备选基学习器。最后,应用高级 XGBoost 技术,如构建非相关的集成模型、堆叠模型,并使用稀疏矩阵、定制的转换器和管道为行业部署准备模型。全书共分3篇:第1篇(第1~4章)为入门篇,介绍XGBoost背后的实用理论,包括装袋和提升模型结构、数据预处理、回归和分类模型、XGBoost基本模型及超参数微调;第2篇(第5~7章)为进阶篇,介绍XGBoost框架构成及超参数优化;第3篇(第8~10章)为进阶篇,着重讨论微调备选基学习器、创新技巧、特征工程,并使用稀疏矩阵、定制转换器和管道,练习构建适合行业部署的模型。全书提供了大量应用实例。本书适合作为高等院校计算机、软件工程专业高年级本科生、研究生的教材,同时适合有一定机器学习基础的数据科学家、机器学习工程师和研究人员阅读,为解决复杂问题提供实用指导。 |
梯度提升算法实战 : 基于XGBoost和scikit-learn / (美) 科里·韦德 (Corey Wade) 著 ; 张生军 译.
-- 北京 : 清华大学出版社, 2024.4
书名原文: Hands-On Gradient Boosting with XGBoost and scikit-learn ISBN 978-7-302-65951-8
Ⅰ. ①梯… Ⅱ. ①科… ②张… Ⅲ. ①机器学习-算法 Ⅳ. ①TP181
中国国家版本馆CIP数据核字(2024)第065073号
本书配套代码
出版社链接
购买链接
内容概览
问题和反馈
Click here 请发送电子邮件联系.
Title
Hands-On Gradient Boosting with XGBoost and scikit-learn
What is this book about?
XGBoost is an industry-proven, open-source software library that provides a gradient boosting framework for scaling billions of data points quickly and efficiently.(科里·韦德 (Corey Wade) & 张生军, 2024).
This book covers the following exciting features: <First 5 What you’ll learn points>
- Build gradient boosting models from scratch
- Develop XGBoost regressors and classifiers with accuracy and speed
- Analyze variance and bias in terms of fine-tuning XGBoost hyperparameters
- Automatically correct missing values and scale imbalanced data
- Apply alternative base learners like dart, linear models, and XGBoost random forests