如何解决在弹性网络逻辑回归中选择最优 alpha
我正在使用 R 中的 glmnet 包对数据集执行弹性网络逻辑回归。 我正在通过交叉验证调整 Alpha。请参阅下面的 R 代码:
for(j in 1:length(a)){
for (i in 1:nAlphaIterations){
set.seed(i)
cv <- cv.glmnet(X_dataset,Y_dataset,nfold = 10,family = "binomial",type.measure = "deviance",standardize = TRUE,paralle = F,alpha = a[j])
currAlpha <- data.frame(
cvm = cv$cvm[cv$lambda == cv$lambda.1se],lambda.1se = cv$lambda.1se,alpha = a[j],seed = i)
allAlpha <- rbind(allAlpha,currAlpha) # all current alphas combined
}
print(j)
}
但是,我不确定应该使用哪种类型的度量来确定 alpha。偏差?还是 AUC 更好?
解决方法
假设您的目标是实现高分类准确率,您可以在 type.measure = "class"
函数中使用 cv.glmnet()
,该函数可以优化分类准确率。要解决评论中的随机数据拆分问题,您可以按照 (https://glmnet.stanford.edu/articles/glmnet.html#introduction-1) 中的建议,通过为每个观察值创建一个折叠索引向量来修复您的 foldid
:
用户可以通过 foldid 参数明确控制每个观察值分配到的折叠。这很有用,例如,在使用交叉验证为 $\alpha$
选择值时版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。