如何解决熊猫-每列和每行填充NaN的速度为0?
对于LSTM,我想
- 仅按列提取值,
- 将它们放在数据帧的开头,然后
- 在值开始至索引99之前填充0。
但是,请注意,并非每一列都有相同数量的值。有些已经很多,有些还没有。同样,在哪个时间戳上生成值是特定于列的。我确实使用以下代码实现了结果。但是,由于代码确实很慢(700小时),所以我正在寻找一种更快地执行计算逻辑的可能性。由于我希望每小时进行一次此类结果的计算,因此需要花费很长时间。从2008年到2020年的时间戳。
df1=pd.DataFrame(index=range(100),columns=dummydata.columns)
for j in dummydata.columns:
df1[j]=dummydata[(dummydata.index<=i)][j].dropna().iloc[-T:].iloc[::-1].reset_index(drop=True)
df1=df1.fillna(0).reset_index(drop=True)
解决方法
您可以尝试一下,看看是否更快?
dummydata.apply(lambda x: pd.Series(x.dropna().values)).fillna(0)
然后您可以使用dummydata.loc[0:100,:]
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。