如何解决数据集中子集的线性回归模型?
我有一个数据集,其中包含 300 多个不同车型、一些汽车、一些自行车和 10 多行特征(颜色、大小、mpg 等)的条目。
如果汽车/自行车实际上并未在数据集中进行分类(尽管它是有序的,即只有列1:200 是汽车,201:300 是自行车)。
我认为我需要创建数据集的子集,但我不知道如何将原始数据集中的特征与子集相关联。
抱歉,如果解释不当,感谢您的帮助!
解决方法
我认为您应该首先重构您的数据框(您可能希望在行中查看车辆模型,在列中查看特征。我建议使用 t()
作为转置函数,然后添加另一列包含虚拟变量(如果汽车类型为 1是汽车,如果不是,则为 0。现在,您可以使用 glm()
(如果要拟合逻辑回归)或使用 lm()
(线性回归)将汽车类型回归到 mpg。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。