微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

如何优化NLTK pos_tag 操作?

如何解决如何优化NLTK pos_tag 操作?

正如标题所说,我正在执行 pos_tag 操作以从我的 Python 列表中删除所有专有名词,但由于我的笔记本电脑规格较低,因此需要花费很长时间。这是代码

final 是一个包含 7000 个单词字符串的列表。

final2 = []
for x in final :
    tag = pos_tag(final)
    final2 = [word for word,pos in tag if pos != 'NNP']

如您所见,目前的方法效率不高,它是 O(n^2) 而且我不是专家,这可以在更短的时间内完成吗?

解决方法

final2 = []
#for x in final : (turns out this was not doing anything)
tag = pos_tag(final)
final2 = [word for word,pos in tag if pos != 'NNP']

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。