技术频道

公众号推荐

微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦！

提升树与GBDT的详细算法过程建议收藏版

时间：2022-08-25分类：常见问题作者：wzk4869

GBDT的全称为：梯度提升决策树，英文为：（Gradient Boosting Decison Tree）。

提升树核心思想：拟合残差

怎么拟合残差呢？

首先第一步是使用boosting技术，对残差使用决策树进行拟合，比如我们常用的CART算法。第二步是使用加法模型，将拟合好的决策树相加。

一、提升树算法步骤

输入： $D=\{(x_1,y_1),(x_2,y_2),\cdots,(x_N,y_N)\}$

（1）初始化 $f_0(x)=0$ ；

（2）对于 $m=1,2,\cdots,M$ ，针对每一个样本 $x_i,y_i)$ ，计算残差：
$r_{mi}=y_i-f_{m-1}(x_i)\quad ,i=1,2,\cdots,N$

（3）利用 $\{(x_i,r_{mi})\}_{i=1,2,\cdots,N}$ 训练一个决策树（回归树），得到 $T(x;\Theta_m)$

（4）更新 $f_m(x)=f_{m-1}(x)+T(x;\Theta_m)$

（5）完成以上迭代，得到提升树:
$f_M(x)=\sum_{i=1}^MT(x;\Theta_m)$

其中， $M$ 表示决策树个数； $R_{mi}$ 表示残差。

二、GBDT算法步骤

输入：训练数据集 $D=\{(x_1,y_1),(x_2,y_2),\cdots,(x_N,y_N)\}$ ；损失函数为: $L (y, f (x))$ 。

（1）初始化:
$f_0(x)=\arg\min_{c}\sum_{i=1}^NL(y_i,c)$

（2）对于 $m=1,2,\cdots,M$ ，针对每一个样本 $x_i,y_i)$ ，计算残差：
$r_{mi}=-[\frac{\partial L(y_i,f(x_i))}{\partial f(x_i)}]_{f(x)=f_{m-1}(x)}\;,i=1,2,\cdots,N$

（3）利用 $\{(x_i,r_{mi})\}_{i=1,2,\cdots,N}$ 训练出第 $m$ 棵决策树（回归树） $T_m$ ，其中叶节点划分的区域为: $R_{mj}\;,j=1,2,\cdots,J$

（4）对于回归树 $T_m$ 的每一个叶结点，计算其输出值：
$c_{mj}=\arg\min_{c}\sum_{x_i\in R_{mj}}L(y_i,f_{m-1}(x_i)+c)\;,j=1,2,\cdots,N$

（5）更新:
$f_m(x)=f_{m-1}(x)+\sum_{j=1}^Jc_{mj}I(x\in R_{mj})$

（6）得到最终提升回归树：
$\hat{f(x)}=f_M(x)=\sum_{m=1}^M\sum_{j=1}^Jc_{mj}I(x\in R_{mj})$

输出：提升回归树 $\hat{f(x)}$

三、两者之间的区别

1.梯度提升回归树的残差使用负梯度来代替；

2.梯度提升回归树多了一步在叶子节点loss求最优值的计算，这里应该是为了降低优化误差，优化回归树的结果。

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 dio@foxmail.com 举报，一经查实，本站将立刻删除。

GBDT 回归树机器学习梯度提升算法算法算法

上一篇：nacos配置中心下一篇：xib高效tip: 给你的view设置任意圆

相关推荐

显卡天梯图2024最新版显卡性能天梯图2024最新排行榜

显卡天梯图2024最新版，显卡是电脑进行图形处理的重要设备，显卡的性能高低决定了电脑的性能高低。显卡天梯图用数据直观地为我们展示了具体性能数据，让我们可以根据这些参数进行显卡性能的选择，让我们可以获得符合自己使用需求的显卡

作者：编程之家时间：2024-09-24

初始化电脑时出现问题怎么办初始化电脑时出现问题解决方法

初始化电脑时出现问题怎么办，可以使用win系统的安装介质，连接电脑后重启，选择从介质中引导，然后点击修复计算机-疑难解答-高级选项-自动修复，等待一段时间就可以了。有些小伙伴在初始化电脑是碰到了问题，下面小编给大家带来了初始化电脑时出现问题解决方法。

作者：编程之家时间：2024-09-24

todesk远程开机怎么设置 todesk远程开机教程

todesk远程开机怎么设置，两台电脑要在同一局域网内，然后需要修改BIOS，还要修改电源选项。我们在使用todesk软件时，有些小伙伴想要进行远程开机，那应该怎么设置呢，下面小编就给大家带来了todesk远程开机教程，一起来看看吧。

作者：编程之家时间：2024-09-24

油猴谷歌插件怎么安装油猴谷歌插件安装教程

油猴谷歌插件怎么安装，可以通过谷歌应用商店进行安装，需要才能打开应用商店，或者是下载插件到本地，解压后把Tampermonkey.crx文件拖到谷歌浏览器的程序扩展页面进行安装。小伙伴想知道谷歌浏览器怎么安装油猴，下面小编给大家带来了油猴谷歌插件安装教程。

作者：编程之家时间：2024-09-24

16g虚拟内存设置多少合适 16g虚拟内存最佳设置方法

虚拟内存这个名词想必很多人都听说过，我们在使用电脑的时候，特别是玩大型游戏时候，如果内存空间不足则会开启使用虚拟内存，这样就能够防止死机的情况。有不少的新用户在安装系统的时候，不知道16G的内存设置多大的虚拟内存，下面小编就详细给大家讲解下多少才

作者：编程之家时间：2024-09-24

win11本地账户怎么改名 win11本地账户改名图文介绍

win11本地账户怎么改名?win11很多操作都变了样，用户如果想要修改用户名称可能找不到具体的位置在哪。win11系统本地账户的名称都是默认的，很多用户为了有特征性想要更改一些有趣的名称，这样看起来更有个性点。win11本地账户怎么改名，我们可以通过打开控制面板，然后

作者：编程之家时间：2024-09-24

网速怎么看快慢k/s,b/s是什么意思网速怎么看快慢k/s,b/s哪个快

网速怎么看快慢k s,b s是什么意思，k b就是网速1kb每秒，b s就是网速1b每秒,1kb=1024b。很多小伙伴在下载或上传文件时都会看着kb s，b s等等单位，这些单位是什么意思呢，哪个比较快呢，下面小编给大家带来了网速怎么看快慢k s,b s哪个快的相关资讯。

作者：编程之家时间：2024-09-24

笔记本声卡驱动怎么更新笔记本声卡驱动更新方法

我们在使用电脑的时候，经常需要对各种驱动进行更新，如果长期不更新会导致无法正常的使用。有不少的用户在问，该怎么更新声卡驱动？其实很简单，我们右键“我的电脑”打开“设备管理器”，找到“声音”选项并右键“realtek audio”更新驱动程序即可，具体如下。

作者：编程之家时间：2024-09-24

应用程序无法正常启动0x0000142怎么办 0x0000142错误代码解决办法

应用程序无法正常启动0x0000142怎么办?我们的电脑在日经月累的使用下，难免会出现各种问题，最近有小伙伴反应自己的电脑出现应用程序无法正常启动0x0000142的错误代码，这要怎么解决呢?下面小编就告诉大家电脑遇到0x0000142错误代码的解决办法。

作者：编程之家时间：2024-09-24

wegame怎么不让别人看战绩 wegame隐藏战绩的方法

Wegame是国内腾讯旗下的一款游戏平台，有很多玩家都在这个平台上玩游戏，例如经典的英雄联盟。有不少的玩家不想让好友看到自己的游戏战绩，但是又不知道怎么隐藏。其实很简单，我们可以在个人设置中，将“我的应用”设置为“只对自己可见” 即可。

作者：编程之家时间：2024-09-24

小编推荐

苹果市值2025年有望达4万亿美元