微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

多大的数据应该适合微调 GPT-2

如何解决多大的数据应该适合微调 GPT-2

我正在尝试使用一些用于英语考试数据的文本来微调 GPT-2。 但是,我没有很多数据,因为考试仅每年执行一次,并且有很多类型的问题,例如填空,在某些上下文中选择正确的单词等。 在我的数据中,文本的长度大约在 800 到 1200 之间,每种类型的问题大约有 100 到 400 个文本。

可能,我不了解使用 GPT-2 微调数据的正确过程。只是我检查了 GPT-2 对于一些大型和适当的文本数据集具有绝对强大的能力。

我必须如何设置训练模型的大小?我需要再买一些吗?

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。