微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

Python的shutil模块中文件的复制操作函数详解

copy()
chutil.copy(source,destination)
shutil.copy() 函数实现文件复制功能,将 source 文件复制到 destination 文件夹中,两个参数都是字符串格式。如果 destination 是一个文件名称,那么它会被用来当作复制后的文件名称,即等于 复制 + 重命名。举例如下:

 >> import shutil
 >> import os
 >> os.chdir('C:\\')
 >> shutil.copy('C:\\spam.txt','C:\\delicIoUs')
 'C:\\delicIoUs\\spam.txt'
 >> shutil.copy('eggs.txt','C:\\delicIoUs\\eggs2.txt')
 'C:\\delicIoUs\\eggs2.txt'

代码所示,该函数的返回值是复制成功后的字符串格式的文件路径。

copyfile()
copyfile()将源的内容复制给目标,如果没有权限写目标文件则产生IoError

from shutil import *
from glob import glob
print 'BEFORE:',glob('huanhuan.*')
copyfile('huanhuan.txt','huanhuan.txt.copy')
print 'AFTER:',glob('huanhuan.*')

这个函数会打开输入文件进行读写,而不论其类型,所以某些特殊文件不可以用copyfile()复制为新的特殊文件

>>> ================================ RESTART ================================
>>> 
BEFORE: ['huanhuan.txt']
AFTER: ['huanhuan.txt','huanhuan.txt.copy']

copyfile()实际是使用了底层函数copyfileobj()。copyfile()的参数是文件名,copyfileobj()的参数是打开的文件句柄。第三个参数可选,用于读入块的缓冲区长度。

from shutil import *
import os
from StringIO import StringIO
import sys
class VerboseStringIO(StringIO):
  def read(self,n=-1):
    next = StringIO.read(self,n)
    print 'read(%d) bytes' % n
    return next
lorem_ipsum = '''This makes the dependency explicit,limits the scope to the current file and provides faster access to the bit.* functions,too.
It's good programming practice not to rely on the global variable bit being set (assuming some other part of your application has already loaded the module).
The require function ensures the module is only loaded once,in any case.'''
print 'Defalut:'
input = VerboseStringIO(lorem_ipsum)
output = StringIO()
copyfileobj(input,output)
print
print 'All at once:'
input = VerboseStringIO(lorem_ipsum)
output = StringIO()
copyfileobj(input,output,-1)
print
print 'Blocks of 256:'
input = VerboseStringIO(lorem_ipsum)
output = StringIO()
copyfileobj(input,256)

认行为是使用大数据块读取。使用-1会一次性读取所有输入,或者使用其他正数可以设置特定块的大小。

>>> ================================ RESTART ================================
>>> 
Defalut:
read(16384) bytes
read(16384) bytes

All at once:
read(-1) bytes
read(-1) bytes

Blocks of 256:
read(256) bytes
read(256) bytes
read(256) bytes

类似于UNIX命令行工具cp,copy()函数会用同样的方式解释输出名。如果指定的目标指示一个目录而不是一个文件,会使用源文件的基名在该目录中创建一个文件

from shutil import *
import os
dir = os.getcwd()
if not os.path.exists('%s\\example' % dir):
  os.mkdir('%s\\example' % dir)
print 'BEFORE:',os.listdir('example')
copy('huanhuan.txt','example')
print 'AFTER:',os.listdir('example')
>>> ================================ RESTART ================================
>>> 
BEFORE: []
AFTER: ['huanhuan.txt']

copy2()

copy2()工作类似copy(),不过复制到新文件的元数据会包含访问和修改时间。

from shutil import *
import os
import time
dir = os.getcwd()
if not os.path.exists('%s\\example' % dir):
  os.mkdir('%s\\example' % dir)
  
def show_file_info(filename):
  stat_info = os.stat(filename)
  print '\tMode  :',stat_info.st_mode
  print '\tCreated :',time.ctime(stat_info.st_ctime)
  print '\tAccessed:',time.ctime(stat_info.st_atime)
  print '\tModified:',time.ctime(stat_info.st_mtime)

print 'SOURCE:'
show_file_info('huanhuan.txt')
copy2('huanhuan.txt','example')
print 'DEST:'
show_file_info('%s\\example\\huanhuan.txt' % dir)

文件特性和原文件完全相同。

>>> ================================ RESTART ================================
>>> 
SOURCE:
  Mode  : 33206
  Created : Thu Feb 13 17:42:46 2014
  Accessed: Thu Feb 13 17:42:46 2014
  Modified: Thu Feb 13 17:42:46 2014
DEST:
  Mode  : 33206
  Created : Thu Feb 13 18:29:14 2014
  Accessed: Thu Feb 13 17:42:46 2014
  Modified: Thu Feb 13 17:42:46 2014

   

复制文件元数据
在UNIX创建一个文件,会根据当前用户的umask接受权限。要把权限从一个文件复制到另一个文件,可以使用copymode()。

from shutil import *
import os
from commands import *
with open('file_to_change.txt','wt') as f:
  f.write('i love you')
os.chmod('file_to_change.txt',0444)
print 'BEFORE:'
print getstatus('file_to_change.txt')
copymode('shutil_copymode.py','file_to_change.txt')
print 'AFTER:'
print getstatus('file_to_change.txt')

要复制其他元数据,可以使用copystat()。

from shutil import *
import os
import time
def show_file_info(filename):
  stat_info = os.stat(filename)
  print '\tMode    :',stat_info.st_mode
  print '\tCreated  :',time.ctime(stat_info.st_ctime)
  print '\tAccessed  :',time.ctime(stat_info.st_atime)
  print '\tModified  :',time.ctime(stat_info.st_mtime)
with open('file_to_change.txt','wt') as f:
  f.write('i love you')
os.chmod('file_to_Change.txt',0444)
print 'BEFORE:'
show_file_info('file_to_Change.txt')
copystat('shutil_copystat.py','file_to_Change.txt')
print 'AFTER:'
show_file_info('file_to_Change.txt')

使用copystat()只会复制与文件关联的权限和日期。


处理目录树
shutil包含三个函数处理目录树。要把一个目录从一个位置复制到另一个位置,使用copytree()。这会递归遍历源目录树,将文件复制到目标。
copytree()可以将当前这个实现当作起点,在使用前要让它更健壮,可以增加一些特性,如进度条。

from shutil import *
from commands import *
print 'BEFORE:'
print getoutput('ls -rlast /tmp/example')
copytree('../shutil','/tmp/example')
print '\nAFTER:'
print getoutput('ls -rlast /tmp/example')

symlinks参数控制着符号链接作为链接复制还是文件复制。认将内容复制到新文件,如果选项为true,会在目标中创建新的符号链接
删除一个目录及其内容,可以使用rmtree()。

from shutil import *
from commands import *
print 'BEFORE:'
print getoutput('ls -rlast /tmp/example')
rmtree('/tmp/example')
print '\nAFTER:'
print getoutput('ls -rlast /tmp/example')

一个文件或目录从一个位置移动到另一个位置,可以使用move()。

from shutil import *
from glob import glob
with open('example.txt','wt') as f:
  f.write('i love you')
print 'BEFORE: ',glob('example*')
move('example.txt','example.out')
print 'AFTER: ',glob('example*')

其语义与UNIX命令mv类似。如果源与目标都在同一个文件系统内,则会重命名文件。否则,源文件会复制到目标文件,将源文件删除

>>> ================================ RESTART ================================
>>> 
BEFORE: ['example','example.txt']
AFTER: ['example','example.out']

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


使用爬虫利器 Playwright,轻松爬取抖查查数据 我们先分析登录的接口,其中 url 有一些非业务参数:ts、he、sign、secret。 然后根据这些参数作为关键词,定位到相关的 js 代码。 最后,逐步进行代码的跟踪,发现大部分的代码被混淆加密了。 花费了大半天,来还原这些混淆加密的代码
轻松爬取灰豚数据的抖音商品数据 调用两次登录接口实现模拟登录 我们分析登录接口,发现调用了两次不同的接口;而且,需要先调用 https://login.huitun.com/weChat/userLogin,然后再调用 https://dyapi.huitun.com/userLogin 接口。 登
成功绕过阿里无痕验证码,一键爬取飞瓜数据 飞瓜数据的登录接口,接入了阿里云的无痕验证码;通过接口方式模拟登录,难度比较高。所以,我们使用自动化的方式来实现模拟登录,并且获取到 cookie 数据。 [阿里无痕验证码] https://help.aliyun.com/document_detail/1
一文教你从零开始入门蝉妈妈数据爬取,成功逆向破解数据加密算法 通过接口进行模拟登录 我们先通过正常登录的方式,分析对应的登录接口。通过 F12 打开谷歌浏览器的调试面板,可以看到登录需要传递的一些参数;其中看到密码是被加密了。 不过我们通过经验可以大概猜测一下,应该是通过 md5 算法加密了。 接下
抽丝剥茧成功破解红人点集的签名加密算法 抽丝剥茧破解登录签名算法,成功实现模拟登录 headers = {} phone_num = "xxxx" password = "xxxx" md5_hash = hashlib.md5() md5_hash.upda
轻松绕过 Graphql 接口爬取有米有数的商品数据 有米有数数据的 API 接口,使用的是一种 API 查询语言 graphql。所有的 API 只有一个入口,具体的操作隐藏在请求数据体里面传输。 模拟登录,获取 sessionId 调用登录接口,进行模拟登录。 cookies = {} head
我最近重新拾起了计算机视觉,借助Python的opencv还有face_recognition库写了个简单的图像识别demo,额外定制了一些内容,原本想打包成exe然后发给朋友,不过在这当中遇到了许多小问题,都解决了,记录一下踩过的坑。 1、Pyinstaller打包过程当中出现warning,跟d
说到Pooling,相信学习过CNN的朋友们都不会感到陌生。Pooling在中文当中的意思是“池化”,在神经网络当中非常常见,通常用的比较多的一种是Max Pooling,具体操作如下图: 结合图像理解,相信你也会大概明白其中的本意。不过Pooling并不是只可以选取2x2的窗口大小,即便是3x3,
记得大一学Python的时候,有一个题目是判断一个数是否是复数。当时觉得比较复杂不好写,就琢磨了一个偷懒的好办法,用异常处理的手段便可以大大程度帮助你简短代码(偷懒)。以下是判断整数和复数的两段小代码: 相信看到这里,你也有所顿悟,能拓展出更多有意思的方法~
文章目录 3 直方图Histogramplot1. 基本直方图的绘制 Basic histogram2. 数据分布与密度信息显示 Control rug and density on seaborn histogram3. 带箱形图的直方图 Histogram with a boxplot on t