如何解决Numpy广播比较报告“'bool' object has no attribute 'sum'”在处理大数据帧时报错
我使用 numpy 广播从 Pandas 数据框中获取差异矩阵。我发现在处理大型数据帧时,它报告“'bool' 对象没有属性 'sum'”错误。在处理小数据帧时,它运行良好。
我在以下链接中发布了两个 csv 文件: large file small file
import numpy as np
import pandas as pd
df_small = pd.read_csv(r'test_small.csv',index_col='Key')
df_small.fillna(0,inplace=True)
a_small = df_small.to_numpy()
matrix = pd.DataFrame((a_small != a_small[:,None]).sum(2),index=df_small.index,columns=df_small.index)
print(matirx)
编辑:numpy 版本是 1.19.5
np.__version__
'1.19.5'
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。