使用以下代码创建了df_grouped.
df_grouped = df.groupby(by='Pclass')
在循环下面将打印Pclass值以及每个分组数量的长度.
for val,grp in df_grouped:
print('There were',len(grp),'people traveling in',val,'class.')
代码如何访问信息? val& grp是否可以在不被引用的情况下使用?此信息如何存储在groupby对象中?
解决方法:
如Group By: split-apply-combine文档中所述,数据存储在GroupBy对象中,该对象是具有特殊attributes的数据结构.
您可以自己验证:
>>> type(df_grouped)
应该返回:
<class 'pandas.core.groupby.DataFrameGroupBy'>
文档中的以下代码片段很好地说明了数据的结构:
The groups attribute is a dict whose keys are the computed unique groups and corresponding values being the axis labels belonging to each group.
如您所见,您可以轻松地遍历每个单独的组.但是,通常有矢量化方法可以很好地与groupby对象配合使用,并且可以更有效,更快速地访问信息并计算事物.
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。