微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

无法为大型数据集运行选择性的熊猫分析

如何解决无法为大型数据集运行选择性的熊猫分析

我有一个包含100列和100000行的大型数据集,我正在尝试运行熊猫配置文件报告,但它会生成一个非常大的html文件(300MB)。无法在任何浏览器上打开该文件

所以我尝试了minimal = True,但这仅提供了交互作用。

我可以运行选择性的熊猫分析报告来仅查看“交互”报告还是仅查看“ _values”报告

我尝试过但是遇到错误

ProfileReport(df,variables=False,Interactions=True,Correlations=False,Missing_values=False,Sample=False)

解决方法

通过调整配置可以有多种可能的改进:

  • 绘制与100列的交互将生成100 x 100 = 10.000的图。您可以通过指定目标(请参见文档)将其缩小到您感兴趣的目标
  • ProfileReport(df,variables=False,Interactions=True,Correlations=False,Missing_values=False,Sample=False)的语法不正确(请不要使用大写字母,请使用None而不是False,请参见this page)。

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。