如何解决寻求日语中 MWE 识别/语义消歧的现状
我想知道日本 MWE 的研究现状如何。似乎没有可靠的工具正在开发中,可以识别这种或不同的词义。我知道后者是一个更高级的任务,但特别是考虑到 MECAb,最著名的词素化器太老了,并且很久没有更新了,我不确定当前的兴趣是什么,或者如何真正去改进什么我们已经有了。
我想象一个小型的类似变压器的模型 GPT2/3 训练一个小的非休闲和表现良好的日本子集可以完成工作。 一个棘手的部分是弄清楚如何从完全无监督的模型转变为可以进行标记化的模型,但也许这是未经研究的东西。
对于像我这样试图改进这些问题的人来说,有哪些相关材料可以让自己了解一下?我是机器学习和数学的初学者,所以我必须从一个非常介绍性的点开始。欢迎任何帮助。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。