如何解决如何从 Python 中的 csv 构建多类列表?
我正在尝试基于这样的数据框构建一个列表
TRAINING_DATA = [
["accepted",{"APP": True,"FEE": False,"THY": False}],["change accepted",["yes i approve these changes","THY": False}]
]
从 Jupyter 我可以毫无问题地创建它。但是,我需要从 csv 文件构建它。目前,我正在尝试使用以下内容:
text;class
"accepted"; {'APP': True,'FEE': False,'THY': False}
"change accepted";{'APP': True,'THY': False}
而且,在 Python 中,我使用以下命令加载文件:
df = pd.read_csv("prueba.csv",usecols=['text','class'],delimiter=";")
但是,如标题所述,我需要构建一个将类列作为对象而不是文本的列表。我使用这句话创建了列表:
newList = df.values.tolist()
newList
但是,结果不是预期的:
[['accepted'," {'APP': True,'THY': False}"],['change accepted',"{'APP': True,'THY': False}"]]
可以看出,列表的第二个“列”被转换为字符串。我需要的是这个(没有“):
[['accepted',{'APP': True,'THY': False}],'THY': False}]]
值得一提的是,我已经执行了以下句子:
df['class'] = df['class'].astype(object)
df['class'] = df['class'].astype('category')
但没有任何成功。
我需要知道的是应该如何编写csv文件,以及应该对数据框进行什么处理才能完成此任务?
解决方法
您需要做的是将包含字典的字符串转换为字典,这可以使用 ast.literal_eval()
来完成。
在列表理解 data_
中,您在第二个索引(即字符串 ast.literal_eval
)上使用 "{'APP': True,'FEE': False,'THY': False}"
循环遍历数组,然后将其转换为字典。之后创建一个新数组并将第一个元素(即字符串 accepted
)放在第二个位置,然后将新字典放在第二个位置。
注意:
这仅在包含字典的字符串中没有不必要的空格时才有效。因此,请确保删除此字符串 " {'APP': True,'THY': False}"
前面的空格并将其更改为 "{'APP': True,'THY': False}"
。
import ast
data = [
["accepted","{'APP': True,'THY': False}"],["change accepted",]
data_ = [[d[0],ast.literal_eval(d[1])] for d in data]
print(data_)
输出:
[['accepted',{'APP': True,'THY': False}],['change accepted','THY': False}]]
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。