微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

nltk 标签问题

如何解决nltk 标签问题

我正在尝试使用 NLTK 将一组单词标记为词性,然后将该单词保存在文件中。它似乎适用于 VB 作为关键字和 NN,但我无法让 VBD 工作。它返回一个空集。

import nltk
f = open("F:\\...\\testFile.txt","r")
fp = open("F:\\...\\writetoSmaller.txt","w")
dctRead = f.read()
lines = dctRead
tokenized = nltk.word_tokenize(lines)
verbs = [word for (word,pos) in nltk.pos_tag(tokenized) if(pos[:2] == 'VB')]
fp.write(str(verbs))
f.close()
fp.close()

是我的关键字列表错误吗,我正在使用这个列表。 (只是列表的摘录)。该列表来自Categorizing and POS Tagging with NLTK Python VB 动词,基本形式 take VBD 动词,过去时,采取 VBG 动词,动名词/现在分词 VBN 动词,采用过去分词 VBP 动词,唱歌。现在,已知的 3d 拍摄 VBZ 动词,第三人称唱。现在需要

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。