微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

如何使用我们选择的输入测试逻辑回归模型?

如何解决如何使用我们选择的输入测试逻辑回归模型?

我目前正在研究克利夫兰数据集,其中有 14 列......我在这个数据集上执行的一些步骤是

1.did 创建了虚拟变量,因为有分类值——将数据集分成 28 个特征

2.删除了一些高度相关的值——使其成为 22 个特征

3.Did递归特征消除--列/特征的最佳数量仍然是22

4.做了主成分分析

5.使用逻辑回归预测

6.达到 85% 的准确率

现在我想用我自己的一组基于 13 个特征[目标变量除外]的初始数据集来尝试它,它看起来像这样 =[[78,1,4,111,239,2,155,7]]

我将列表转换为数据框以遵循创建虚拟变量、删除相关值等类似步骤...

但我一直坚持创建虚拟变量,因为它给了我只有 13 列的数据框,而我期望的是 28..

谁能帮我解决这个问题? 或者我如何提供输入?

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。