微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

我如何访问熊猫数据框groupby对象中的数据?

使用以下代码创建了df_grouped.

df_grouped = df.groupby(by='Pclass')

在循环下面将打印Pclass值以及每个分组数量的长度.

for val,grp in df_grouped:
    print('There were',len(grp),'people traveling in',val,'class.')

代码如何访问信息? val& grp是否可以在不被引用的情况下使用?此信息如何存储在groupby对象中?

解决方法:

Group By: split-apply-combine文档中所述,数据存储在GroupBy对象中,该对象是具有特殊attributes的数据结构.

您可以自己验证:

>>> type(df_grouped)

应该返回:

<class 'pandas.core.groupby.DataFrameGroupBy'>

文档中的以下代码片段很好地说明了数据的结构:

The groups attribute is a dict whose keys are the computed unique groups and corresponding values being the axis labels belonging to each group.

如您所见,您可以轻松地遍历每个单独的组.但是,通常有矢量化方法可以很好地与groupby对象配合使用,并且可以更有效,更快速地访问信息并计算事物.

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐