微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

python3 获取文件夹中的文件列表

问题

获取文件系统中某个目录下的所有文件列表。

解决方

使用 os.listdir() 函数获取某个目录中的文件列表,比如:

import os

file_name = os.listdir('/Users/xz/test')
print(file_name)
['Bath.txt','test.py','2.txt','1.txt','cook.txt']

结果会返回目录中所有文件列表,包括所有文件,子目录,符号链接等等。 如果需要通过某种方式过滤数据,可以考虑结合 os.path 库中的一些函数来使用列表推导。比如:

import os.path

names = [name for name in os.listdir('/Users/xz/test') 
        if os.path.isfile(os.path.join('/Users/xz/test',name))]
        
print(names)
['Bath.txt','cook.txt']

字符串的 startswith()endswith() 方法对于过滤一个目录的内容也是很有用的。比如:

pyname = [name for name in os.listdir('/Users/xz/test') if name.endswith('.py')]
print(pyname)
['test.py']

对于文件名的匹配,你可能会考虑使用 globfnmatch 模块。比如:

import glob
pyname = glob.glob('/Users/xz/test/*.py')
print(pyname)
['/Users/xz/test/test.py']

from fnmatch import fnmatch
pyname = [name for name in os.listdir('/Users/xz/test') if fnmatch(name,'*.py')]
print(pyname)
['test.py']

讨论

通过上述的几种方法,均可以获取目录中的文件列表,但是其返回结果只是目录中实体名列表而已。

如果想获取文件的其他元数据,比如文件大小,修改时间等等,需要使用到 os.path 模块中的函数,或os.stat() 函数来收集数据。比如:

# Get file sizes and modification dates
name_sz_dt = [(name,os.path.getsize(name),ar.get(os.path.getmtime(name)).format("YYYY-MM-DD HH:mm:ss")) 
              for name in pyfile]
for name,sizes,date in name_sz_dt:
    print(name,date)
/Users/xz/test/test.py 214 2018-11-29 14:03:02

# Alternative: Get file Metadata
file_Metadata = [(name,os.stat(name)) for name in pyfile]
for name,Meta in file_Metadata:
    print(name,Meta.st_size,ar.get(Meta.st_mtime).format("YYYY-MM-DD HH:mm:ss"))

/Users/xz/test/test.py 214 2018-11-29 14:03:02

需要注意的是,有时候在处理文件名编码问题时,可能会出现一些问题。 通常,函数 os.listdir()返回的实体列表是根据系统认的文件名编码进行解码。 但有时候也会遇到一些不能正常解码的文件名。


 

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐