如何解决当某些迭代具有 NaN 值时,在 mlr3 ResampleResult 中聚合性能度量
对于单次迭代,该度量的结果只能是 0、1(如果预测为正类)或 NaN(如果预测为负类。
我想在整个重采样的现有值上进行聚合,但聚合结果始终为 NaN(自然,对于多次迭代,它将为 NaN)。我无法弄清楚(从 ResampleResult$aggregate() 的帮助页面)如何做到这一点:
gr = po(lrn("classif.kknn",predict_type = "prob"),param_vals = list(k = 10,distance=2,kernel='rectangular' )) %>>%
po("threshold",param_vals = list(thresholds = 0.5))
glrn = GraphLearner$new(gr)
resampling = rsmp("loo")
rr = resample(task,glrn,resampling,store_models = TRUE)
rr$aggregate(msr("classif.precision"))
解决方法
我怀疑这是否是一种统计上合理的方法,但从技术上讲,您可以通过覆盖 aggregator
槽来设置度量的聚合函数:
m = msr("classif.precision")
m$aggregator = function(x) mean(x,na.rm = TRUE)
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。