如何解决具有自适应窗口大小的移动平均
我有一个包含两列 df
和 x
的 DataFrame y
,我想将其绘制为线图,如下所示:
import matplotlib.pyplot as plt
import seaborn as sns
fig = plt.figure(figsize=(9,7))
ax = plt.subplot(111)
df = df.groupby(x,as_index=False).mean()
df = df.sort_values(x)
df[y] = df[y].rolling(1000).mean()
df = df.dropna()
sns.lineplot(data=df,x=x,y=y)
plt.tight_layout()
结果图如下所示:
可以看出,有更多的数据点具有较低的 x 值,即随着 x 值的增加,数据点越来越少。因此,使用固定窗口大小为 1000 的滚动平均值会为大 x 值平均太多数据点,而为低 x 值平均太少数据点。
是否有可能使滚动平均值的窗口随着 x 值的增大而减小或适应数据点的数量?或者对于这种数据,是否存在比滚动平均更好的方法?
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。