如何解决Python:如何在删除后将停用词重新放入一段文本中?
如果我有一段文字:
我打算在面包店买一张沙发,并在我的橡树上换门 树。
并在其上运行此脚本:
import nltk
from nltk.corpus import stopwords
from nltk.tokenize import sent_tokenize,word_tokenize
from nltk.tokenize import PunktSentenceTokenizer
from nltk.stem import WordNetLemmatizer
import re
import time
from nltk.tokenize.treebank import TreebankWordDetokenizer
import string
stp_wrd = set(stopwords.words("english"))
wrd_tkn = [word_tokenize(s) for s in sent_tokenize(txt)]
flt_snt = [[w for w in s if not w in stp_wrd]for s in wrd_tkn]
返回:
[['im','going','buy','couch','bakery','change','door','oak','tree']]
然后我将如何将停用词放回文本中,返回:
[['im','to','a','at','the','and','in','my','tree']]
而不是仅仅打印wrd_tkn
?
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。