如何解决在共同引用解析中重复命名实体
我正在尝试使用Neurocoref查找以下文本的辅助符号:
艾伦和布鲁德是克里斯和唐纳德的好朋友。艾伦和布鲁德想前往黎巴嫩,而克里斯和唐纳德则希望留在美国。克里斯和唐纳德尚未下定决心,但很快就会实现目标。艾伦和布鲁德不想分开,但似乎别无选择。
代码:
case_a_bi = 'Alan and Bruder are great friends with Chris and Donald. Alan
and Bruder want to head to Lebanon while Chris and Donald wish to stay in
United States. Chris and Donald have not made up their mind yet,but will
get there soon. Alan and Bruder do not want to separate but there seems to
be no choice.'
nlp = spacy.load('en')
neuralcoref.add_to_pipe(nlp)
case_a_bi = unidecode(case_a_bi)
doc = nlp(case_a_bi)
doc._.coref_clusters
doc._.coref_resolved
coref集群的输出:
[Alan and Bruder: [Alan and Bruder,Alan,Alan and Bruder,Alan and Bruder],Chris: [Chris,Chris,Chris],Chris and Donald: [Chris and Donald,Chris and Donald,their],Donald: [Donald,Donald,Donald]]
用于coref分辨率的输出:
艾伦和布鲁德是克里斯和唐纳德的好朋友。艾伦和布鲁德想前往黎巴嫩,而克里斯和唐纳德·唐纳德则希望留在美国。 Chris和Donald Donald 尚未决定Chris和Donald的想法,但很快就会实现。艾伦和布鲁德不想分开,但似乎别无选择。
根据提到的输出,我得到了Chris和Donald的正确聚类,但是当我尝试解析这些共指关系时,Donald在结果中重复两次。
有人可以帮助我了解这里出了什么问题吗?
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。