Xgboost分类树参数详解

更新时间:2023-05-15 08:20:38 阅读: 评论:0

Xgboost分类树参数详解
⽂章⽬录
模型参数
横模n_estimators:
总共迭代的次数,即决策树的个数
early_stopping_rounds:
在验证集上,当连续n次迭代,分数没有提⾼后,提前终⽌训练。防⽌overfitting。
max_depth:
树的深度,默认值为6,典型值3-10。值越⼤,越容易过拟合;值越⼩,越容易⽋拟合。
min_child_weight:
默认值为1,。值越⼤,越容易⽋拟合;值越⼩,越容易过拟合(值较⼤时,避免模型学习到局部的特殊样本)。
用春天造句
subsample:
训练每棵树时,使⽤的数据占全部训练集的⽐例。默认值为1,典型值为0.5-1。防⽌overfitting。
colsample_bytree:
训练每棵树时,使⽤的特征占全部特征的⽐例。默认值为1,典型值为0.5-1。防⽌overfitting。
常规参数
booster:
gbtree 树模型做为基分类器(默认)
gbliner 线性模型做为基分类器
silent:
silent=0时,输出中间过程(默认)
silent=1时,不输出中间过程
verbosity:打印消息的详细程度
大兴野生动物园有效值为0(静默),1(警告),2(信息),3(调试)
nthread:
nthread=-1时,使⽤全部CPU进⾏并⾏运算(默认)
nthread=1时,使⽤1个CPU进⾏运算。
scale_pos_weight:明镜的意思
在⼆分类任务中,正样本的权重,当正负样本⽐例失衡时,设置正样本的权重,模型效果更好。例如,当正负样本⽐例为1:10时,scale_pos_weight=10。参数对多分类任务⽆⽤。
学习任务参数
learning_rate:
学习率,控制每次迭代更新权重时的步长,默认0.3。值越⼩,训练越慢。典型值为:0.01-0.2。
objective(⽬标函数):
回归任务
reg:linear (MSE)
⼆分类
binary:logistic  概率
维多利亚大学
多分类
multi:softprob  概率,还需要设置num_class(类数)
multi:softmax  类⽬,还需要设置num_class(类数)
eval_metric:
回归任务(默认rm)
rm--均⽅根误差
mae--平均绝对误差
寻找合作伙伴分类任务(默认error)
auc--roc曲线下⾯积日式榻榻米
error--错误率(⼆分类)
merror--错误率(多分类)
logloss--负对数似然函数(⼆分类)
胡桃夹子和四个王国
mlogloss--负对数似然函数(多分类)
gamma:
指定节点分裂所需的最⼩损失函数下降值,⽤于剪枝
alpha:
L1正则化系数,默认为1
lambda:
L2正则化系数,默认为1
gamma参数详解:

本文发布于:2023-05-15 08:20:38,感谢您对本站的认可!

本文链接:https://www.wtabcd.cn/fanwen/fan/89/898824.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:默认   分类   模型   样本   权重
相关文章
留言与评论(共有 0 条评论)
   
验证码:
推荐文章
排行榜
Copyright ©2019-2022 Comsenz Inc.Powered by © 专利检索| 网站地图