微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

正则表达式 – 如何在正则表达式中使用awk for循环的索引

我把问题缩短了.实际上我的数据比这长得多.

我有一个像这样的文件

aa,bb,cc,dd,ee,4
ff,gg,hh,ii,jj,5
kk,ll,mm,nn,oo,3
pp,qq,rr,ss,tt,2
uu,vv,ww,xx,yy,5
aa,2

现在我想使用awk选择最后一列中具有相同编号的每一行并将其重定向一个文件,这些新文件将根据最后一列中的数字而有所不同.
例如. t2.txt,t3.txt,t4.txt,t5.txt将分别保留最后一个数字为2,3,4,5的行.

在t2.txt中:

pp,2
aa,2

在t3.txt中:

kk,3

在t4.txt中:

aa,4

在t5.txt中:

ff,5
uu,5

我想我需要这样的东西:

BEGIN   {FS=","}
        {
        for (n=2; n<=5; n++)
        if ($6 ~/\$n/) {print > "t\$n.txt"}
        }

但我只是不知道如何使它工作.

这个bash文件做我想要的,但问题是,每次它提取具有特定数字的行时,它必须读入所有行.如何仅查看文件的时间并提取所有数字的文件

#!/bin/bash
for num in {2..5}; do      
gawk --assign FS="," "\$6 ~/${num}/" infile >> t${num}.txt
done

解决方法

尝试使用下一个命令:

awk '{ print $0 > ("t" $NF ".txt") }' infile

无需更改FS,因为它认为空格字符.并且您可以使用NF变量进行最后一个字段的访问.

注意:文件名字符串连接需要包含在parens中,否则awk会因非法语法而混淆.

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐