题库机器学习专项面试题型介绍及解析--第6期

更新时间：2023-04-08 16:06:01 阅读量：实用文档文档下载

说明：文章内容仅供预览，部分内容可能不全。下载后的文档，内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的，是否完整无缺。

解释一下GBDT算法的过程?

GBDT(Gradient Boosting Decision Tree)，全名叫梯度提升决策树，使用的是Boosting的思想。

Boosting 的思想：

Boosting 方法训练基分类器时采用串行的方式，各个基分类器之间有依赖。它的基本思路是将基分类器层层叠加，每一层在训练的时候，对前一层基分类器分错的样本，给予更高的权重。测试时，根据各层分类器的结果的加权得到最终结果。

Bagging 与 Boosting 的串行训练方式不同，Bagging 方法在训练过程中，各基分类器之间无强依赖，可以进行并行训练。

GBDT 的原理很简单，就是所有弱分类器的结果相加等于预测值，然后下一个弱分类器去拟合误差函数对预测值的残差(这个残差就是预测值与真实值之间的误差)。当然了，它里面的弱分类器的表现形式就是各棵树。

举一个非常简单的例子，比如我今年30岁了，但计算机或者模型 GBDT 并不知道我今年多少岁，那 GBDT 咋办呢？

?它会在第一个弱分类器（或第一棵树中）随便用一个年龄比如20岁来拟合，然后发现误差有10岁；

?接下来在第二棵树中，用6岁去拟合剩下的损失，发现差距还有4岁；

?接着在第三棵树中用3岁拟合剩下的差距，发现差距只有1岁了；

?最后在第四课树中用1岁拟合剩下的残差，完美。

?最终，四棵树的结论加起来，就是真实年龄30岁（实际工程中，gbdt 是计算负梯度，用负梯度近似残差）。

为何 GBDT 可以用用负梯度近似残差呢？

回归任务下，GBDT 在每一轮的迭代时对每个样本都会有一个预测值，此时的损失函数为均方差损失函数，

那此时的负梯度是这样计算的

所以，当损失函数选用均方损失函数是时，每一次拟合的值就是（真实值 - 当前模型预测的值），即残差。此时的变量是，即“当前预测模型的值”，也就是对它求负梯度。

GBDT的优点和局限性有哪些？

优点：

?预测阶段的计算速度快，树与树之间可并行化计算。

?在分布稠密的数据集上，泛化能力和表达能力都很好，这使得GBDT在Kaggle的众多竞赛中，经常名列榜首。

?采用决策树作为弱分类器使得GBDT模型具有较好的解释性和鲁棒性，能够自动发现特征间的高阶关系。

局限性：

?GBDT在高维稀疏的数据集上，表现不如支持向量机或者神经网络。

?GBDT在处理文本分类特征问题上，相对其他模型的优势不如它在处理数值特征时明显。

?训练过程需要串行训练，只能在决策树内部采用一些局部并行的手段提高训练速度。

为什么需要代价函数？

1.为了得到训练逻辑回归模型的参数，需要一个代价函数，通过训练代价函数来得到参数。

2.用于找到最优解的目的函数。

为什么代价函数要非负？

目标函数存在一个下界，在优化过程当中，如果优化算法能够使目标函数不断减小，根据单调有界准则，这个优化算法就能证明是收敛有效的。只要设计的目标函数有下界，基本上都可以，代价函数非负更为方便。

相关文章：

正在阅读：