如何解决检测偏置列并消除机器学习中的偏置
我遇到了一个多元机器学习问题,我需要检测偏差列并在预测最终目标变量时消除该特定列的偏差。 训练数据-> [x1,x2,..xn,BiasColumn,y](BiasColumn 不包含所有 X 列。它只是 X 的一个固定子集)。 解决这个问题的标准方法应该是什么?
解决方法
我想到了一种方法
- 创建用于检测偏差列的分类模型
- 为 BiasColumns 中的每个值训练一个单独的模型。所以在每个 模型我们将只采用具有特定的训练数据子集 偏差列。我们从 X 中删除该列并在 y 上训练模型
- 对于预测,我们首先检测偏差列并选择 y 的各自回归模型
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。