微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

使用 glob 读取多个 CSV 导致顺序错误

如何解决使用 glob 读取多个 CSV 导致顺序错误

我需要以正确的顺序读取多个 CSV 文件。这些文件以序列号命名,如“file_0.csv”、“file_1.csv”、“file_2.csv”等,并以相同的顺序创建。

运行我的代码时,文件不是按这个顺序保存的,而是完全混合在一起。 路径文件夹中没有其他文件

path = "stored_files"
filenames = glob.iglob(path + "/*.csv")
dataframes = []

for filename in filenames:
    dataframes.append(pd.read_csv(filename))

解决方法

AFAIK,glob 提供对文件夹的随机排序访问。您可以随时对 filenames:

进行排序
path = "stored_files"
filenames = glob.iglob(path + "/*.csv")
dataframes = []

for filename in sorted(filenames):
    dataframes.append(pd.read_csv(filename))
,

字符串排序不会按照您期望的方式对带有数字的字符串进行排序(特别是 10 在 2 之前)。因此,如果您知道您的文件名是什么样的,请遍历数字并将 "foo"+str(i)+".csv" 或其他任何内容附加到您的文件列表中。

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。