题库机器学习专项面试题型介绍及解析--第6期

更新时间:2023-04-08 16:06:01 阅读量: 实用文档 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

解释一下GBDT算法的过程?

GBDT(Gradient Boosting Decision Tree),全名叫梯度提升决策树,使用的是Boosting的思想。

Boosting 的思想:

Boosting 方法训练基分类器时采用串行的方式,各个基分类器之间有依赖。它的基本思路是将基分类器层层叠加,每一层在训练的时候,对前一层基分类器分错的样本,给予更高的权重。测试时,根据各层分类器的结果的加权得到最终结果。

Bagging 与 Boosting 的串行训练方式不同,Bagging 方法在训练过程中,各基分类器之间无强依赖,可以进行并行训练。

GBDT 的原理很简单,就是所有弱分类器的结果相加等于预测值,然后下一个弱分类器去拟合误差函数对预测值的残差(这个残差就是预测值与真实值之间的误差)。当然了,它里面的弱分类器的表现形式就是各棵树。

举一个非常简单的例子,比如我今年30岁了,但计算机或者模型 GBDT 并不知道我今年多少岁,那 GBDT 咋办呢?

?它会在第一个弱分类器(或第一棵树中)随便用一个年龄比如20岁来拟合,然后发现误差有10岁;

?接下来在第二棵树中,用6岁去拟合剩下的损失,发现差距还有4岁;

?接着在第三棵树中用3岁拟合剩下的差距,发现差距只有1岁了;

?最后在第四课树中用1岁拟合剩下的残差,完美。

?最终,四棵树的结论加起来,就是真实年龄30岁(实际工程中,gbdt 是计算负梯度,用负梯度近似残差)。

为何 GBDT 可以用用负梯度近似残差呢?

回归任务下,GBDT 在每一轮的迭代时对每个样本都会有一个预测值,此时的损失函数为均方差损失函数,

那此时的负梯度是这样计算的

所以,当损失函数选用均方损失函数是时,每一次拟合的值就是(真实值 - 当前模型预测的值),即残差。此时的变量是,即“当前预测模型的值”,也就是对它求负梯度。

GBDT的优点和局限性有哪些?

优点:

?预测阶段的计算速度快,树与树之间可并行化计算。

?在分布稠密的数据集上,泛化能力和表达能力都很好,这使得GBDT在Kaggle的众多竞赛中,经常名列榜首。

?采用决策树作为弱分类器使得GBDT模型具有较好的解释性和鲁棒性,能够自动发现特征间的高阶关系。

局限性:

?GBDT在高维稀疏的数据集上,表现不如支持向量机或者神经网络。

?GBDT在处理文本分类特征问题上,相对其他模型的优势不如它在处理数值特征时明显。

?训练过程需要串行训练,只能在决策树内部采用一些局部并行的手段提高训练速度。

为什么需要代价函数?

1.为了得到训练逻辑回归模型的参数,需要一个代价函数,通过训练代价函数来得到参数。

2.用于找到最优解的目的函数。

为什么代价函数要非负?

目标函数存在一个下界,在优化过程当中,如果优化算法能够使目标函数不断减小,根据单调有界准则,这个优化算法就能证明是收敛有效的。只要设计的目标函数有下界,基本上都可以,代价函数非负更为方便。

本文来源:https://www.bwwdw.com/article/wkol.html

Top