微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

在不知道阈值的情况下,逻辑回归如何确定“最佳”拟合?

如何解决在不知道阈值的情况下,逻辑回归如何确定“最佳”拟合?

我意识到标题本身没有多大意义,因为“阈值”只是我们在学习曲线上选择的一个点,所以如果不先确定曲线就不可能知道这个点,但希望你明白我在下面问什么。


我已经有一段时间没有研究逻辑回归背后的数学了,我有一个问题希望有人能帮助我。

假设我们正在训练一个 LR 模型来预测基于一个输入/特征的输出。那么逻辑回归可以调整两件事:

  1. “偏差”,即 sigmoid 的水平移动

    different bias logistic regression

  2. 以及输入系数,它决定了sigmoid的锐度

    different sharpness logistic regression

一旦模型学习这些参数,我们就可以然后确定我们想要选择哪个阈值进行分类。我们可以查看 ROC 并选择一个受我们的任务影响的值,例如如果我们正在诊断疾病,希望减少误报的频率,即使以更多的误报为代价。

我的问题是:在不知道我们将选择什么阈值的情况下,即在不知道我们认为“重要”的情况下,学习如何确定什么是“最佳”拟合。我认为答案在于,像往常一样,我们只是试图最小化损失,但是拥有一个的损失函数是否有意义?更关心一种类型的错误分类而不是另一种?

如果数学有助于澄清,那也很好,但我正在寻找一些直觉。

谢谢!

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。