微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

h2o GBM:为什么我的网格搜索没有运行我想要的树数量 我的结果是:

如何解决h2o GBM:为什么我的网格搜索没有运行我想要的树数量 我的结果是:

我在网格(超参数)搜索方面遇到了一些困难。 我目前正在 R 中使用 h2o(最新版本)。我的问题是当我指定一个带有 2 个超参数的笛卡尔网格进行测试时:

hyper_grid <- list(max_depth = c(1,2),ntrees    = c(600,1000))

然后我使用函数 h2o.grid 启动搜索获取我的网格,它正在为我构建一个包含 107 个模型的网格。此外,当我指定 "multinomial" 分布时,它没有考虑在内。

最后,我不明白为什么网格向我显示具有 100 棵树的“最佳模型”,而我要求创建具有 600 或 1000 棵树的模型,最大深度为 3,而我要求最大深度应该是1 或 2。

我的代码是:

hyper_grid <- list(max_depth = c(1,1000))

# perform grid search 
grid <- h2o.grid(
  algorithm = "gbm",grid_id = "gbm_grid1",x = predicteurs,y = "strategie",distribution = "multinomial",auc_type = "WEIGHTED_OVO",training_frame = train_nav_80,# Containing 80% of all data
  validation_frame = valid_nav_80,# Containing 20% of all data 
  hyper_params = hyper_grid,seed = 1
  )

# collect the results and sort by our model performance metric of choice
grid_perf <- h2o.getGrid(
  grid_id = "gbm_grid1",sort_by = "auc",decreasing = F
  )
grid_perf

我的结果是:

Grid ID: gbm_grid1 
Used hyper parameters: 
  -  max_depth 
  -  ntrees
 
Number of models: 107,Number of Failed models: 0 
Hyper-Parameter Search Summary: ordered by increasing auc

H2OBinomialMetrics: gbm
** Reported on validation data. **

MSE:  0.2284556
RMSE:  0.4779703
LogLoss:  0.6495512
Mean Per-Class Error:  0.346857
AUC:  0.7472901
AUCPR:  0.7680425
Gini:  0.4945802
R^2:  0.082338

### Best model : ###
- Number of trees = 100,- number_of_internal_trees = 100
- max_depth = 3

提前致谢

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。