将函数应用于数据框的块

如何解决将函数应用于数据框的块

我有一个Dataframe (df)（例如-简化版）

              A    B 
 0           2.0   3.0
 1           3.0   4.0

并生成了20个引导程序重采样，这些重采样现在都在同一df中，但在 Resample Nr中有所不同。

                                A    B 
   
0     1             0           2.0   3.0
1     1             1           3.0   4.0
2     2             1           3.0   4.0
3     2             1           3.0   4.0
..    ..
..    .. 
39    20            0           2.0    3.0
40    20            0           2.0    3.0

现在，我想在每个 Reample Nr 上应用特定功能。说：

C = sum(df['A'] * df['B']) / sum(df['B'] ** 2)

前景将如下所示：

                                 A    B           C
0     1             0           2.0   3.0   Calculated Value X1
1     1             1           3.0   4.0   Calculated Value X1
2     2             1           3.0   4.0   Calculated Value X2
3     2             1           3.0   4.0   Calculated Value X2
..    ..
..    .. 
39    20            0           2.0    3.0  Calculated Value  X20
40    20            0           2.0    3.0  Calculated Value  X20

所以有20个不同的新值。

我知道有一个df.iloc命令，可以在其中指定行选择df.iloc[row,column]，但是我想找到一个命令，无需重复20个示例的代码。我的目标是找到一个自动识别 Resample Nr。的命令，然后为每个 Resample Nr。

计算功能。

我该怎么做？

谢谢！

解决方法

使用DataFrame.assign创建两个与x和y对应的新列df['A'] * df['B']和df['B']**2，然后在{{ 1}}（或Resample Nr.）和level=1使用transform：

sum

结果：

s = df.assign(x=df['A'].mul(df['B']),y=df['B']**2)\
      .groupby(level=1)[['x','y']].transform('sum')
df['C'] = s['x'].div(s['y'])