微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

Python 遍历 CSV 工作簿文件夹,并仅将具有关键字和日期范围的工作簿名称附加到主表

如何解决Python 遍历 CSV 工作簿文件夹,并仅将具有关键字和日期范围的工作簿名称附加到主表

我对这个脚本的目标是遍历数百个 Excel 和 CSV 文件,并只找到带有“cash”的文件字符串名称,即 CSV 文件,并且在 2 个日期周期之间,格式为 YYYYMMDD。找到后,脚本会将第一个工作表的第二行拉到最后一行并将其附加到主工作表。

到目前为止,我能把这一切放在一起,但代码出错了。任何帮助表示赞赏。提前致谢!

import pandas as pd
from glob import glob
from datetime import datetime

path = r'\\base\sub1\sub2\sub3\sub4\sub5\sub6\SearchFolder'

base_date = datetime(2020,10,1,00,00)
dates = pd.date_range(base_date,periods=92).tolist()
dates = [i.strftime("%Y%m%d") for i in dates]
list_of_csvs = glob(path+'*.csv')
print (list_of_csvs)
csvs_to_keep = []
for csv in list_of_csvs:
    if 'cash activities' in str(csv).lower():
        print ('cash activities found')
        for date in dates:
            if str(date) in csv:
                print (csv)
                csvs_to_keep.append(csv)
                    
master_df = pd.DataFrame()
for csv in csvs_to_keep:
    df = pd.read_csv(csv)
    master_df = master_df.append(df)
master_df.to_excel('master_file.xlsx',index=False)

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。