微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

Python pandas – 对字段进行分组和汇总

我最近一直在玩Panda的DataFrames,并努力分析一些多维数据.

假设我有一些数据如下:

order | sample | feature1 | feature2
-------------------------------------
1234  | A      | 0.20     | 0.45
1234  | B      | 0.71     | 0.08
1234  | C      | 0.21     | 0.02
1234  | D      | 0.87     | 0.88
5678  | A      | 0.76     | 0.42
5678  | B      | 0.01     | 0.03
5678  | C      | 0.29     | 0.91
5678  | D      | 0.70     | 0.78

我希望输出按顺序分组的所有内容以及每个功能按样本汇总的位置:

order | feature1                  | feature2 
      | A    | B    | C    | D    | A    | B    | C    | D   
------------------------------------------------------------
1234  | 0.20 | 0.71 | 0.21 | 0.87 | 0.45 | 0.08 | 0.02 | 0.88
5678  | 0.76 | 0.01 | 0.29 | 0.70 | 0.42 | 0.03 | 0.91 | 0.78

这是我到目前为止:

from pandas import *
df = DataFrame({"order": [1234, 1234, 1234, 1234, 5678, 5678, 5678, 5678], "sample": ["A", "B", "C", "D", "A", "B", "C", "D"], "feature1": [0.20, 0.71, 0.21, 0.87, 0.76, 0.01, 0.29, 0.70], "feature2": [0.45, 0.08, 0.02, 0.88, 0.42, 0.03, 0.91, 0.78]})
byorder = df.groupby("order")
# not sure how to go from 1 groupby object to a new dataframe having what i need

您是否有任何关于如何最终获得包含我需要的聚合数据的新DataFrame的想法?也许DataFrames不是进行这种操作的正确工具?

解决方法:

你可以使用pivot

>>> df.pivot(index='order', columns='sample')
       feature1                   feature2
sample        A     B     C     D        A     B     C     D
order
1234       0.20  0.71  0.21  0.87     0.45  0.08  0.02  0.88
5678       0.76  0.01  0.29  0.70     0.42  0.03  0.91  0.78

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。

相关推荐