如何解决sktime ARIMA 无效频率
我尝试从 sktime 包中拟合 ARIMA 模型。我导入一些数据集并将其转换为熊猫系列。然后我在训练样本上拟合模型,当我尝试预测错误发生时。
from sktime.forecasting.base import ForecastingHorizon
from sktime.forecasting.model_selection import temporal_train_test_split
from sktime.forecasting.arima import ARIMA
import numpy as np,pandas as pd
df = pd.read_csv('https://raw.githubusercontent.com/selva86/datasets/master/a10.csv',parse_dates=['date']).set_index('date').T.iloc[0]
p,d,q = 3,1,2
y_train,y_test = temporal_train_test_split(df,test_size=24)
model = ARIMA((p,q))
results = model.fit(y_train)
fh = ForecastingHorizon(y_test.index,is_relative=False,)
# the error is here !!
y_pred_vals,y_pred_int = results.predict(fh,return_pred_int=True)
错误信息如下:
ValueError: Invalid frequency. Please select a frequency that can be converted to a regular
`pd.Periodindex`. For other frequencies,basic arithmetic operation to compute durations
currently do not work reliably.
我在读取数据集时尝试使用 .asfreq("M")
,但是,该系列中的所有值都变成了 NaN
。
有趣的是,此代码适用于来自 load_airline
的默认 sktime.datasets
数据集,但不适用于我来自 github 的数据集。
解决方法
我收到一个不同的错误:ValueError: ``unit`` missing
,可能是由于版本差异。无论如何,我认为最好将数据帧的索引设为 pd.PeriodIndex
而不是 pd.DatetimeIndex
。前者我认为更明确(例如,每月系列的时间步长不是确切的日期)并且工作更顺畅。所以在阅读了 csv 之后,
df.index = pd.PeriodIndex(df.index,freq="M")
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。