微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

bash – 如何找到两个文件的集合差异?

我有两个文件A和B.我想找到A中不在B中的所有行.在bash /使用标准 linux实用程序中,最快的方法是什么?这是我到目前为止所尝试的:
for line in `cat file1`
 do
   if [ `grep -c "^$line$" file2` -eq 0]; then
   echo $line
   fi
 done

它有效,但速度很慢.有更快的方法吗?

The BashFAQ describes doing exactly this with comm,这是规范正确的方法.
# Subtraction of file1 from file2
# (i.e.,only the lines unique to file2)
comm -13 <(sort file1) <(sort file2)

diff不太适合这个任务,因为它试图在块而不是单独的行上操作;因此,它必须使用的算法更复杂,内存效率更低.

从SUS2(1997)开始,comm一直是part of the Single Unix Specification.

原文地址:https://www.jb51.cc/bash/385302.html

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐