微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

如何在某些属性方面比较 SMOTE 生成的重采样数据与原始训练数据?

如何解决如何在某些属性方面比较 SMOTE 生成的重采样数据与原始训练数据?

我使用 SMOTE 对我的训练集进行过采样。在训练集中,除了数值特征外,每一行还有多个分类属性,例如位置和类型。当我使用 SMOTE 重新采样我的数据时,如何将这些分类属性的分布与训练集中的那些进行比较?在 imblearn 的过采样策略中,sample_indices_ 使这成为可能,但我认为这在 SMOTE 中是不可能的。有没有办法解决这个问题?我们也可以让 SMOTE 基于分类属性创建合成示例吗?例如,在少数类实例较少的位置创建少数类的样本?

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。