如何解决Sklearn - 我们可以在同一模型中使用交叉验证和批量训练吗?
是否可以通过逐批提供输入集来使用 k 折交叉验证来训练 sklearn 随机森林模型?因为我有一些内存问题。我不能一次拟合所有训练数据。此外,我想使用交叉验证(不是训练测试拆分)。是否有任何使用示例?
更新:我发现 this website 他们提供了一个图书馆来做到这一点。其中,示例如下:
from dask_ml.wrappers import Incremental
from dask_ml.datasets import make_classification
import sklearn.linear_model
X,y = make_classification(chunks=25)
est = sklearn.linear_model.SGDClassifier()
clf = Incremental(est,scoring='accuracy')
clf.fit(X,y,classes=[0,1])
但是,我无法理解将自己的 X 和 y 数据提供给模型的位置。我看不出他们是从哪里来的。如何将我自己的训练数据拟合到模型中?
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。