微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

Pandas read_hdf 给出“只能在表上使用迭代器或块大小”错误

如何解决Pandas read_hdf 给出“只能在表上使用迭代器或块大小”错误

我有一个 h5 数据文件,其中包含键 rawreport

我可以读取 rawreport 并使用 read_hdf(filename,"rawreport") 保存为数据框,没有任何问题。但是数据有 1700 万行,我想使用分块

当我运行这段代码

chunksize = 10**6
someval = 100
df = pd.DataFrame()
for chunk in pd.read_hdf(filename,'rawreport',chunksize=chunksize,where='datetime < someval'):
    df = pd.concat([df,chunk],ignore_index=True)

我收到“类型错误:只能在表上使用迭代器或块大小”

rawreport 不是表格是什么意思,我该如何解决这个问题?我不是创建 h5 文件的人。

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。