微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

如何索引PyArrow表?

如何解决如何索引PyArrow表?

我目前在我的机器学习模型中使用Arrow来读取Parquet中的数据。目前,我正在尝试弄清楚如何从Arrow表中获取某些记录。我看到箭头表具有“ Take” api,但是我不确定如何使用它。我尝试传递int索引,但是当我尝试Im时收到以下异常:

{ "compilerOptions": { "baseUrl": "src" },"include": ["src"] }

有人知道我如何从箭头表中读取记录吗?

解决方法

金字塔表的take()方法需要类似数组的索引(而不是单个整数索引):

>>> import pyarrow as pa
>>> table = pa.table({'a': range(5)})
>>> table.to_pandas()
   a
0  0
1  1
2  2
3  3
4  4

>>> table.take([0,2]).to_pandas()
   a
0  0
1  2

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其他元素将获得点击?
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。)
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbcDriver发生异常。为什么?
这是用Java进行XML解析的最佳库。
Java的PriorityQueue的内置迭代器不会以任何特定顺序遍历数据结构。为什么?
如何在Java中聆听按键时移动图像。
Java“Program to an interface”。这是什么意思?