微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

训练不能泛化以很好地预测验证和测试集,如何提高泛化?

如何解决训练不能泛化以很好地预测验证和测试集,如何提高泛化?

我使用 keras 嵌入层的特征构建了一个 1D CNN 回归模型,以预测某些序列的分数。

我的模型在训练后的典型性能如下:

enter image description here

enter image description here

如您所见,预测训练数据的性能非常好,但似乎不能推广到预测验证和测试数据。

您对如何提高验证/测试集预测性能有任何建议,可能是通过交易训练数据的预测性能吗?(这可能吗?)

谢谢!

解决方法

这种差异可以用过度拟合来解释(很可能)。我要说的是,在拆分为训练、测试和验证之前的数据似乎没有被正确地打乱。否则,您的机器似乎足够强大,可以学习,因为您对它在训练集中的性能感到满意,所以只需尝试调整其超参数以平衡偏差-方差权衡。我不能肯定地告诉你它的过度拟合的原因是因为你的指标存在平均绝对误差,所以尽管这些曲线看起来非常不同,但差异可以通过涉及百分比这一事实来解释。

避免过度拟合的方法是 Dropout 层、权重正则化等。

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。