如何解决在scikit-learn中使用不同数据子集进行回归
我试图估计一些权重,但是数据集中的每个条目每次仅包含权重的一个子集。我觉得这应该真的很容易,但是对于如何构造问题却一无所知。
数据来自一个物理过程,其中N个门各自允许不同的流量。但是,在整个数据集中,每个浇口的流量不应有很大波动。每个可用数据点都包含:
- 大门的开/关状态
- 整个系统的总流量
总流量只是通过闸门的流量之和。
所以我会有类似的东西
configs = np.array([
[1,0],[1,1,1],1] ])
totals = np.array([[
2003,236851,393559,5759,238656,395060 ]])
我试图将其作为联立线性方程组的基本系统来解决,因为与门数(即未知数)相比,数据点(即方程式)舒适得多。我可以对每个不同的数据点执行此操作,然后平均得出每个门的权重。
是否可以将其设置为回归问题,或者线性回归是否可以有效地完成我上面对联立方程所做的工作?
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。