微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

NLP 构建语料库

如何解决NLP 构建语料库

大家下午好!

我在从给定的 Pandas df 构建语料库时遇到问题。 我的数据集看起来像这样 10 entries,其中前 2 列是这些词的类型和频率分布。

谁能帮我创建一个语料库,通过能够“合并”这两列,这样就会有一个包含所有这些单词的列表。

我尝试制作 2 个列表:

words_in_list = list (words['Word'])
frequency_list = list (words['FREQcount'])

然后这个:

my_lst = []

for word in range(len(words_in_list)):
    my_lst.append(frequency_list[word] * words_in_list[word])
print(my_lst)

但是ram买不起那么多,代码也行不通。

谁能建议我更好的方法解决这个问题? 非常感谢您的帮助。

祝你有美好的一天:)

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。