如何解决是否可以将自定义实体标签添加到 Spacy 3.0 配置文件?
我正在使用 spacy-transformers 和 roBERTa 开发自定义 NER 模型。我实际上只是为此使用 CLI,并且正在尝试更改我的 Spacy config.cfg 文件以考虑管道中的自定义实体标签。
我是 Spacy 的新手,但我发现人们通常使用 ner.add_label 来完成此操作。我想知道我是否可以更改配置的 [initialize.components.ner.labels] 中的某些内容,但还没有找到一个好的方法。
我似乎找不到任何以类似方式更改配置文件的选项 - 有谁知道这是否可行,或者实现这些自定义标签的最简洁方法是什么?
为清晰起见进行了编辑:我的问题可能与我的配置理论不同。现在我得到了一个输出,但它们不是文本标签,而是数字标签,例如:
('Oct',383) ('2019',383) ('February',383)
预先感谢您的帮助!
解决方法
如果您正在使用基于配置的训练,通常您不必在任何地方指定标签 - spaCy 将查看训练数据并从那里获取标签列表。
在某些情况下这不起作用。
您的训练数据中没有标签。这些无法学习,所以我认为这是一个错误,但有时您必须使用您使用过的数据给。
您的训练数据非常大。在这种情况下,阅读所有训练数据以获得完整的标签列表可能是一个问题。您可以使用 init labels 命令生成数据,这样每次开始训练时都不必扫描输入数据。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。