如何解决如何使用scikit-learn高斯过程回归器重现GPy GPRegression的结果?
GPRegression(GPy)和高斯过程回归器(scikit-learn)都使用相似的初始值和相同的优化器(lbfgs)。为什么结果差异很大?
#!pip -qq install pods
#!pip -qq install GPy
from sklearn.gaussian_process import GaussianProcessRegressor
from sklearn.gaussian_process.kernels import RBF,ConstantKernel as C
from sklearn.preprocessing import StandardScaler
import pods
data = pods.datasets.olympic_marathon_men()
X = StandardScaler().fit_transform(data['X'])
y = data['Y']
# scikit-learn
model = GaussianProcessRegressor(C()*RBF(),n_restarts_optimizer=20,random_state=0)
model.fit(X,y)
print(model.kernel_)
# GPy
from GPy.models import GPRegression
from GPy.kern import RBF as GPyRBF
model = GPRegression(X,y,GPyRBF(1))
model.optimize_restarts(20,verbose=0)
print(model.kern)
结果
2.89**2 * RBF(length_scale=0.173)
rbf. | value | constraints | priors
variance | 25.399509298957504 | +ve |
lengthscale | 4.279767394389103 | +ve |
解决方法
GPy RBF()
内核等效于scikit-learn ConstantKernel()*RBF() + WhiteKernel()
。使用此工具,我可以在两者中获得可比的结果。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。