如何解决如何在python中根据句子及其频率创建一个bigram
每个人 我想根据句子及其频率在python中创建双字母组,但是当计算每个双字母组的频率时,我不知道如何计算句子的频率,而没有为每个句子做内循环。 例如:
grams = []
sents = [["Hello World",5],["How are you",2]] # here for eg the sentence "Hello world" is of frequency 5
for sent in sents: grams += nltk.ngrams(sent[0].split(" "),2)
fdist = nltk.FreqDist(grams) # here the bigrams will be of frequency 1 each
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。