如何解决如何索引PyArrow表?
我目前在我的机器学习模型中使用Arrow来读取Parquet中的数据。目前,我正在尝试弄清楚如何从Arrow表中获取某些记录。我看到箭头表具有“ Take” api,但是我不确定如何使用它。我尝试传递int索引,但是当我尝试Im时收到以下异常:
{
"compilerOptions": {
"baseUrl": "src"
},"include": ["src"]
}
有人知道我如何从箭头表中读取记录吗?
解决方法
金字塔表的take()
方法需要类似数组的索引(而不是单个整数索引):
>>> import pyarrow as pa
>>> table = pa.table({'a': range(5)})
>>> table.to_pandas()
a
0 0
1 1
2 2
3 3
4 4
>>> table.take([0,2]).to_pandas()
a
0 0
1 2
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。