NLP 构建语料库 - 编程之家

大家下午好！

我在从给定的 Pandas df 构建语料库时遇到问题。我的数据集看起来像这样 10 entries，其中前 2 列是这些词的类型和频率分布。

谁能帮我创建一个语料库，通过能够“合并”这两列，这样就会有一个包含所有这些单词的列表。

我尝试制作 2 个列表：

words_in_list = list (words['Word'])
frequency_list = list (words['FREQcount'])

然后这个：

my_lst = []

for word in range(len(words_in_list)):
    my_lst.append(frequency_list[word] * words_in_list[word])
print(my_lst)

但是ram买不起那么多，代码也行不通。

谁能建议我更好的方法来解决这个问题？非常感谢您的帮助。

祝你有美好的一天:)