我有一个表示每日产品需求的数据框.
由于该产品的需求是不规则的,因此先知模型的性能不佳,如下所示:
因此,我将其转换为每周时间序列,并且该模型更合适.
df.resample('W',how={'y': 'sum'},
loffset=pd.offsets.timedelta(days=-6))
我现在想做的是:
1-再次转换为每日,请注意以下每周的季节性:
工作日优先:
>星期六
>周二
>星期五
>星期一
>星期四
>星期三
>周日
因此,如果我对第一周的预测是需求等于3,我希望发生这种情况:
>星期六:1
>星期二:1
>星期五:1
>星期一:0
>星期四:0
>星期三:0
>周日:0
我的意思是,将每周的预测转换为尊重本周的每日顺序以分配值:
ds y
0 2018-01-07 5.0
1 2018-01-14 5.0
2 2018-01-21 4.0
预期结果:
ds y
0 2018-01-01 1
1 2018-01-02 1
2 2018-01-03 0 (Wednesday)
3 2018-01-04 1
4 2018-01-05 1
5 2018-01-06 1
6 2018-01-07 0 (Sunday)
解决方法:
由于您的数据是按日期编制索引的,所以我猜它不会那么长.因此,我们可以构造一个函数并应用:
def to_daily(val):
# order of the day in a week
order = np.argsort([5, 1, 4, 0, 3, 2, 6])
b, r = val//7, val%7
ret = np.array([b+1]*r + [b]*(7-r))
return ret[order]
to_daily(5)
# array([1, 1, 0, 1, 1, 1, 0])
ret_df = pd.DataFrame({'ds': pd.date_range(df.ds[0]-pd.to_timedelta('6d'),
df.ds.values[-1], freq='d'),
'y' : np.array([to_daily(val)
for val in df.y.astype(int)]).flatten()})
ret_df
输出:
ds y
-- ------------------- ---
0 2018-01-01 00:00:00 1
1 2018-01-02 00:00:00 1
2 2018-01-03 00:00:00 0
3 2018-01-04 00:00:00 1
4 2018-01-05 00:00:00 1
5 2018-01-06 00:00:00 1
6 2018-01-07 00:00:00 0
7 2018-01-08 00:00:00 1
8 2018-01-09 00:00:00 1
9 2018-01-10 00:00:00 0
10 2018-01-11 00:00:00 0
11 2018-01-12 00:00:00 1
12 2018-01-13 00:00:00 1
13 2018-01-14 00:00:00 0
14 2018-01-15 00:00:00 1
15 2018-01-16 00:00:00 1
16 2018-01-17 00:00:00 1
17 2018-01-18 00:00:00 1
18 2018-01-19 00:00:00 1
19 2018-01-20 00:00:00 2
20 2018-01-21 00:00:00 1
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。