微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

掩盖多元单变量回归中的NaN值

如何解决掩盖多元单变量回归中的NaN值

display

我正在使用上面的代码在许多列上进行迭代,并逐一进行回归。这样可以正常工作,并产生我想要的输出

但是,在实际数据集中,我正在读取Excel文件。我在许多列上进行回归,有些列比其他列具有更多的行。这将导致输出采用以下形式-

This is what the output looks like in the real dataset

我使用df [[0,1,2,3,5,6,7,8,9]] = float('nan')进行模拟,尽管并非所有列都具有NaN值。>

这里的错误对我来说很明显,但我不知道如何解决。回归仅在长度最大的一列上运行。也就是说,如果您要构造一个由该excel文件的值组成的10 * 10矩阵,则它将仅输出最长的列或与之相等的列。

是否可以屏蔽nan值,以便输出合理?我考虑过插补和插值,但两者都会使最终值失真。再次,问题在于公式仅计算具有最大维的列。由于其他列的维数较小(即,带有值的行较少),因此无法获得输出

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。