微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

POS 标签元组中的词形还原 - python

如何解决POS 标签元组中的词形还原 - python

我想对字符串列表中的字符串进行 POS 标记和词形还原。 所以我选择了例如第一个字符串和 pos 标记它:

temp = nltk.pos_tag(nltk.word_tokenize(str),tagset = 'universal')

>>> [('check','VERB'),('test','NOUN'),('failures',('next','ADJ'),('days',('send',('back','ADV')]

现在我想对所有单词进行词形还原,但我想保留 pos 标签。通过使用 wordnetlemmatizer,至少据我所知,pos 标签将被删除。我只想将元组字符串添加到字典中。

有人可以帮我解决这个问题吗?提前致谢!

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。