如何解决一组单词共享的最低常见上位词
给出一组10个单词([“ dog”,“ cat”,“ rabbit” ....]),如果有一个,我想找到最低的常用上位词。
我知道WordNet可以让您在两个同义词集中找到一个,但是在多个单词中找到它的一个好方法是什么?
我的问题来自每个单词都有一组sysnet,其中该组的每个成员可以具有不同的上位词,每个上位词都具有一组同义词集,依此类推。因此,幼稚的算法最终会进行很多迭代。
解决方法
给出WordNet中的两个单词(同义词),找到它们的最低共同上位字母(LCH)。然后找到该上位词的LCH和下一个单词。重复直到完成所有单词。在代码中,可能看起来像这样:
syns = [...] # list of synsets
lch = syns[0]
for word in syns[1:]:
lch = find_lch(lch,word)
您必须进行N次迭代,其中N是列表的大小,但是没有办法解决。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。