将误报的成本设置为比LightGBM中的误报的成本高得多

我面临的情况是，误报比误报要昂贵得多。

想象一下一个模型的情况，该模型用于决定您是否将立即进行非常痛苦和危险的手术，或者您宁愿探索其他可能性，包括咨询更多的医学博士和尝试替代疗法。

虽然如果绝对必要的话您不会反对进行危险而痛苦的手术，但是如果模型建议您在没有非常严重的理由的情况下进行手术，您会很生气。毕竟，您可以在对特定病例进行更彻底的医学检查后，一个月后再进行手术。

因此，在这种情况下，至少对您来说，误报的成本要比误报的成本高得多。

所以我想以某种方式告知模型FP比FN差很多。

我对Stack Overflow进行了一些研究，他们提出了两种解决方案：

假设是，通过增加否定类的权重，您可以避免模型在涉及否定示例时犯错，即将其错误分类为肯定。

相反，该模型将不太愿意在正面示例将错误分类为负面的方面犯错。

但是当肯定类别只占整体数据的一小部分时-例如3％-否定类别的这种过度采样很可能导致分类器始终选择否定类别，这是Catch22的一种情况。

您有什么建议？