技术频道

公众号推荐

微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦！

linux – 如何在bash中比较2个范围列表？

时间：2022-09-02分类：Bash作者：编程之家原文地址

使用bash脚本(Ubuntu 16.04),我试图比较2个范围列表：file1中任何范围内的任何数字是否与file2中任何范围内的任何数字一致？如果是这样,请在第二个文件中打印该行.这里我将每个范围作为2个制表符分隔的列(在file1中,第1行表示范围1-4,即1,2,3,4).真实的文件非常大.

3 4 
8 13 
20 24

期望的输出：

3 4 
8 13

我最好的尝试是：

awk 'NR=FNR { x[$1] = $1+0; y[$2] = $2+0; next}; 
{for (i in x) {if (x[i] > $1+0); then
{for (i in y) {if (y[i] <$2+0); then            
{print $1, $2}}}}}' file1 file2 > output.txt

这将返回一个空文件.

我认为脚本需要使用if-then条件进行范围比较,并遍历两个文件中的每一行.我找到了每个概念的例子,但无法弄清楚如何将它们结合起来.

任何帮助赞赏！

当然,这取决于你的文件有多大.如果它们不足以耗尽内存,您可以尝试这种100％bash解决方案：

declare -a min=() # array of lower bounds of ranges
declare -a max=() # array of upper bounds of ranges

# read ranges in second file, store then in arrays min and max
while read a b; do
    min+=( "$a" );
    max+=( "$b" );
done < file2

# read ranges in first file    
while read a b; do
    # loop over indexes of min (and max) array
    for i in "${!min[@]}"; do
        if (( max[i] >= a && min[i] <= b )); then # if ranges overlap
            echo "${min[i]} ${max[i]}" # print range
            unset min[i] max[i]        # performance optimization
        fi
    done
done < file1

这只是一个起点.有许多可能的性能/内存占用改进.但它们在很大程度上取决于文件的大小和范围的分布.

编辑1：改进了范围重叠测试.

编辑2：重用RomanPerekhrest提出的优秀优化(未设置已从file2打印的范围).当范围重叠的概率很高时,性能应该更好.

编辑3：与RomanPerekhrest提出的awk版本的性能比较(在修复了最初的小错误之后)：awk比bash在这个问题上快10到20倍.如果性能很重要且你在awk和bash之间犹豫不决,那么更喜欢：

awk 'NR == FNR { a[FNR] = $1; b[FNR] = $2; next; }
    { for (i in a)
          if ($1 <= b[i] && a[i] <= $2) {
              print a[i], b[i]; delete a[i]; delete b[i];
          } 
    }' file2 file1

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 dio@foxmail.com 举报，一经查实，本站将立刻删除。

上一篇：linux – 如何在Bash中将秒转换为下一篇：linux – 如何使脚本执行git pull

相关推荐

openwrt临时封禁ip

用的openwrt路由器，家里宽带申请了动态公网ip，为了方便把2280端口映射到公网，发现经常被暴力破解，自己写了个临时封禁ip功能的脚本，实现5分钟内同一个ip登录密码错误10次就封禁这个ip5分钟，并且进行邮件通知使用步骤openwrt为19.07.03版本，其他版本没有测试过安装bashmsmtpopkg

作者：编程之家时间：2022-10-07

使用bash脚本并行运行多个程序

#!/bin/bashcommand1&command2&wait从Shell脚本并行运行多个程序–杨河老李(kviccn.github.io)

作者：编程之家时间：2022-10-07

三步将Mac系统默认PHP版本切换为MAMP等扩展环境中的PHP版本

1.先查出MAMP下面集成的PHP版本cd/Applications/MAMP/bin/phpls-ls 2.编辑修改.bash_profile文件（没有.bash_profile文件的情况下回自动创建）sudovim~/.bash_profile在文件的最后输入以下信息，然后保存退出exportPATH="/Applications/MAMP/bin/php/php7.2.20/b

作者：编程之家时间：2022-10-07

ubuntu16.04中文乱码问题解决

1、先输入locale-a，查看一下现在已安装的语言2、若不存在如zh_CN之类的语言包，进行中文语言包装:apt-getinstalllanguage-pack-zh-hans3、安装好后我们可以进行临时修改：然后添加中文支持: locale-genzh_CN.UTF-8临时修改> export LC_ALL='zh_CN.utf8'> locale永久

作者：编程之家时间：2022-10-07

Bash Perl Tcl syntax diff

BashPerlTclsyntaxdiff1.进制数表示Languagebinaryoctalhexadecimalbash2#[0~1]0[0~7]0x[0~f]or0X[0~f]perl0b[0~1]0[0~7]0x[0~f]tcl0b[0~1]0o[0~7]0x[0~f]bashdifferentbaserepresntationreference2.StringlengthLanguageStr

作者：编程之家时间：2022-10-07

k8s命令补全方法

正常安装了k8s后，使用kubect工具后接的命令不能直接tab补全命令补全方法：yum-yinstallbash-completionsource/usr/share/bash-completion/bash_completionsource<(kubectlcompletionbash)echo"source<(kubectlcompletionbash)">>~/.bashrc

作者：编程之家时间：2022-10-07

linux应用重启脚本

参考这里启动jar包shell脚本修改过来的#!/bin/bash#默认应用名称defaultAppName='./gadmin'appName=''if[[$1&&$1!=0]]thenappName=$1elseappName=$defaultAppNamefiecho">>>>>>本次重启的应用：$appName<

作者：编程之家时间：2022-10-07

SHELL训练营--day19_shell练习36-40

#一个数字的行#!/bin/bashwhilereadlinedon=`echo$line|sed's/[^0-9]//g'|wc-L`if[$n-eq1]thenecho$linefidone<1.txt#日志切割归档#!/bin/bashcd/data/logslog=1.logmv_log(){[-f$1]&&mv$1$2

作者：编程之家时间：2022-09-02

SHELL训练营--day23_shell练习56-60

#文件增加内容#!/bin/bashn=0cat1.txt|whilereadlinedon=[$n+1]if[$n-eq5]thenecho$lineecho-e"#Thisisatestfile.\n#Testinsertlineintothisfile."elseecho$linefidone#备份/etc目录#

作者：编程之家时间：2022-09-02

linux 用户异常shell-》ksh

# su - oraclesu: /usr/bin/ksh: No such file or directory根据报错信息：显示无法找到文件 /usr/bin/ksh果然没有该文件，但是发现存在文件/bin/ksh,于是创建了一个软连接，可以规避问题，可以成功切换到用户下，但无法执行系统自带命令。$. .bash_profile-ksh: .: .b

作者：编程之家时间：2022-09-02

小编推荐

苹果市值2025年有望达4万亿美元