如何解决整数分类功能,包括数值和分类
我正在处理表格数据集,实际上很难确定整数列是数值列还是分类列。我主要考虑的是我正在构建的模型的准确性(无深度学习)。因此,我想知道是否可以将整数列既视为数值(按原样使用)又作为类别(进行一次热编码或将决策树与基于集合的拆分一起使用)。即同时给出列的两种表示方式,并让模型找出合适的特征。
我的问题是:在任何情况下,采用这种多重表示方法是否有意义?如果是这样,它与您正在训练的模型以及偏差方差的权衡有何关系?例如,逻辑(高偏差)与随机森林(高方差)。有没有建立起来的优点或缺点的既定理论或最佳实践呢?我是在分类问题的背景下问这个问题的。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。