如何解决如何将包含字符串对象的熊猫数据框列转换为 numpy 数组?
拜托我正在做一个项目,我必须做一些数据预处理 我有一个看起来像这样的数据框(这只是一个简化的例子
index | pixels
0 | 10 20 30 40
1 | 11 12 13 14
并且我想将其转换为形状为 (2,2,1) 的 np 数组 像素列的类型是对象 有没有没有循环的解决方案,因为我有一个带有大图像的 28k 行数据框? 我试过循环,但在我的机器上执行需要很长时间
解决方法
使用 str.split
+ astype
+ to_numpy
+ reshape
:
explode()
a = (
df['pixels'].str.split(' ',expand=True)
.astype(int).to_numpy()
.reshape((2,2,1))
)
:
a
完整的工作示例:
[[[[10]
[20]]
[[30]
[40]]]
[[[11]
[12]]
[[13]
[14]]]]
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。