微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

为多个 CSV 文件导出 Pandas 输出

如何解决为多个 CSV 文件导出 Pandas 输出

我在一个文件夹的子目录下有很多 CSV 文件。它们都包含推文和其他元数据。我有兴趣删除大部分元数据并保留推文本身及其时间。我使用 glob 读取文件删除部分似乎工作正常。但是,我不确定如何保存输出,以便保存所有文件并使用其原始文件名。

import pandas as pd
import glob
path = r'D:\tweets'
myfiles= glob.glob(r'D:\tweets\**\*.csv',recursive=True)
for f in myfiles:
    df = pd.read_csv(f)
df = df.drop(["name","id","conversation_id","created_at","date"],axis=1)
df = df[df["language"].str.contains("bn|ca|ckbu|id||zh")==False]
df.to_csv("output_filename.csv",index=False,encoding='utf8')

解决方法

如果你这样做,它会覆盖同一个文件:

for f in myfiles:
    df = pd.read_csv(f)
    df = df.drop(["name","id","conversation_id","created_at","date"],axis=1)
    df = df[df["language"].str.contains("bn|ca|ckbu|id||zh")==False]
    df.to_csv(f,index=False,encoding='utf8')

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。