如何解决在python中使用分号分隔符拆分文本
我正在尝试使用分号分隔符分隔文本。 我有一个包含大量 sql 查询的源文本文件。例如:
new SecureRandom()
这 3 个示例查询必须拆分为数据框的 3 行 - 每行包含一个查询。
如您所见,本文中有复杂的查询,我发现正则表达式的问题在于 \n 字符。
我发现没有直接的方法可以做到这一点,原始文件包含大约 2000 个 sql 查询。
解决方法
我能够使用 Pandas 实现一个不错的解决方案。
将数据存储在同一文件中的“”“data1”“”
data1 = data.replace('\n','').split(';')
df = pd.DataFrame.from_dict({'column': data1})
for i in range(len(df)):
df['column'][i] = df['column'][i].strip('-')
# convert the entire dataframe to a pandas DF and store in CSV
df.to_csv('file_name.csv',index=False)
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。