假设我有这个数据框:
df = pd.DataFrame({'col1': [1, 2, 3, 4, 5],
'col2': [7, 45, 12, 56, 14],
'col3': [56, 67, 8, 12, 39],
'col4': [16, np.nan, 25, 6, 19],
'col5': [1, 9, 23, 56, np.nan],
'col6': [13, 3, 53, 72, 88]})
我想要的只是计算这个数据帧的偶数列和奇数列的平均值.我试过这些代码:
df['avg_odd'] = df[[df.columns[0],df.columns[2],df.columns[4]]].mean(axis=1)
df['avg_even'] = df[[df.columns[1],df.columns[3],df.columns[5]]].mean(axis=1)
但有没有办法更快地做到这一点?如果我有100列或更多列,我该如何计算?
解决方法:
使用modulo按列长度创建辅助arange,并创建新列:
arr = np.arange(len(df.columns)) % 2
df['avg_odd'] = df.iloc[:, arr == 0].mean(axis=1)
df['avg_even'] = df.iloc[:, arr == 1].mean(axis=1)
print (df)
col1 col2 col3 col4 col5 col6 avg_odd avg_even
0 1 7 56 16.0 1.0 13 19.333333 12.000000
1 2 45 67 NaN 9.0 3 26.000000 24.000000
2 3 12 8 25.0 23.0 53 11.333333 30.000000
3 4 56 12 6.0 56.0 72 24.000000 44.666667
4 5 14 39 19.0 NaN 88 22.000000 40.333333
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。