微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

linux – 压缩文件夹以创建tgz文件

我有一个文件夹,我想创建tgz文件并计算其sha256:

使用以下命令将文件夹转换为tgz

"tar -c -C #{Shellwords.escape dir} #{Shellwords.escape basename} " \
        "--owner=0 --group=0 --mtime='2000-01-01 00:00:00' | gzip -n > #{Shellwords.escape file}"

现在我使用2个单独的用户运行上述过程,它给了我2个文件:1和2

两个tgz文件的大小不同:

-rw-r--r--@ 1 myuser  \Domain Users  9024 Jul 31 14:28 1.tgz
-rw-r--r--@ 1 myuser  \Domain Users  9037 Jul 31 14:29 2.tgz

如果我尝试计算文件间的差异,我没有看到任何diff.Diff是使用以下命令获得的.

diff  <(tar -tvf 1.tgz | sort) <(tar -tvf 2.tgz | sort)

如果我使用这两个文件的ruby计算sha256,那么它会有所不同.

问题是:为什么我从不同用户运行时获得tgz文件的差异.

编辑:
阅读评论和一些谷歌搜索后,我发现每次添加文件的顺序并不固定.

看这https://reproducible-builds.org/docs/archives/#file-ordering.

我会尝试这个并添加细节.

解决方法

这可能是有很多原因造成的.

> tar存储的元数据(以及gzip存储的元数据,可能包括tar存档的修改时间).我看到你正在使用一些可能会重置此元数据的某些部分的GNU tar选项,但我打赌这些选项并非穷尽所有变量属性.
>文件的顺序.当您将文件解压缩到文件系统时,对于大多数应用程序来说,顺序几乎不重要(尽管每个目录条目通常在基础文件系统的同一个dirent中的任何其他条目之前或之后).但是,不保证tar存档中文件的顺序.
> gzip压缩.通过文件格式保证压缩文件将被解压缩到原始文件,但是,不一定保证它们的压缩格式必须相同.此外,如果输入内容不同(即使它保持相同的大小),那么同样地,您将看到两个档案甚至可能因文件大小不同而不同.

总之,如果您尝试确定两个文件夹的内容是否相同,使用.tgz存档可能不是最好的方法.

原文地址:https://www.jb51.cc/linux/396830.html

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐