技术频道

公众号推荐

微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦！

perl – 删除第N次出现后的内容使用单行

时间：2020-09-22分类：Perl作者：编程之家

我想删除在第四次出现的字符“：”之后的任何字段中包含它.看例子：

输入：

1 10975     A C    1/1:137,105:245:99:1007,102,0   0/1:219,27:248:20:222,20 
1 19938     T TA   ./.                             1/1:0,167:167:99:4432,422,12,12
12 20043112 C G    1/2:3,5,0:15:92                 2/2:3,15:20:8

预期产量：

1 10975     A C    1/1:137,105:245:99   0/1:219,27:248:20 
1 19938     T TA   ./.                  1/1:0,167:167:99
12 20043112 C G    1/2:3,0:15:92      2/2:3,15:20:8

所以基本上任何具有“：”的字段都应该被删除.请注意,第三行没有任何变化,因为“：”仅出现三次.我试过并找到了一个解决方案(不好),它不仅适用于第一行而不适用于secod,因为它有更多的逗号“,”

不完整的解决方案：

sed 's/:[0-9]*,[0-9]*,[0-9]*//g'

提前致谢

解决方法

在字段5到最后一个字段,这将删除第四次出现的正则表达式：[^：]

< file.txt awk '{ for (i=5; i<=NF; i++) $i = gensub(/:[^:]+/,"",4,$i) }1' | column -t

在字段5到最后一个字段,这将删除第四个字段后的所有内容：

< file awk '{ for (i=5; i<=NF; i++) $i = gensub(/((:[^:]+){3}).*/,"\\1",1,$i) }1' | column -t

说明：

在重新阅读您的问题后,第二种解决方案可能正是您所寻找的.第一个解决方案是查找冒号后跟一个或多个字符而不是冒号并删除它们. gensub()的第三个参数描述了要替换的正则表达式的匹配.所以4告诉gensub()删除模式的第四个匹配.第二个解决方案,查找第一个答案中描述的三组正则表达式.此时值得一提的是gensub()提供了一个使用sub()或gsub()不可用的附加功能.这是在替换文本中指定正则表达式的组件的能力,就像其他语言如何使用括号来执行捕获一样. gensub()是一个非常强大的命令,只能使用GNU awk.提供的描述和示例here非常有用. HTH.

结果：

1   10975     A  C   1/1:137,105:245:99  0/1:219,27:248:20
1   19938     T  TA  ./.                 1/1:0,167:167:99
12  20043112  C  G   1/2:3,0:15:92     2/2:3,15:20:8

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 dio@foxmail.com 举报，一经查实，本站将立刻删除。

上一篇：如何使用非regexable版权胡椒可执行下一篇：我怎样才能在Perl源代码中找到某些

相关推荐

1. 如何去重 #!/usr/bin/perl use strict; my %hash; while(<>){ chomp; print "$_n" unless

作者：iVictor 时间：2021-08-15

如何用perl将表格中不同列的数据进行拼凑，然后将拼凑后的数据用“|”连接在一起

最近写了一个perl脚本，实现的功能是将表格中其中两列的数据进行拼凑，然后将拼凑后的数据用“|”连接在一起。表格内容如下：员工号码员工姓名职位入职日期1001张三销售1980/12/17 0:00:

作者：iVictor 时间：2021-08-15

基于表的数据字典构造MySQL建表语句

表的数据字典格式如下：如果手动写MySQL建表语句，确认麻烦，还不能保证书写一定正确。写了个Perl脚本，可快速构造MySQL脚本语句。脚本如下：#!/usr/bin/perluse strict;m

作者：iVictor 时间：2021-08-15

如何用Perl对Excel的数据进行提取并分析

巡检类工作经常会出具日报，最近在原有日报的基础上又新增了一个表的数据量统计日报，主要是针对数据库中使用较频繁，数据量又较大的31张表。该日报有两个sheet组成，第一个sheet是数据填写，第二个sh

作者：iVictor 时间：2021-08-15

如何用Perl截取报文

在实际生产环境中，常常需要从后台日志中截取报文，报文的形式类似于.........一个后台日志有多个报文，每个报文可由操作流水唯一确定。以前用AWK写过一个，程序如下：beginline=`awk &

作者：iVictor 时间：2021-08-15

如何通过关键词匹配统计其出现的频率

最近写的一个perl程序，通过关键词匹配统计其出现的频率，让人领略到perl正则表达式的强大，程序如下：#!/usr/bin/perluse strict;my (%hash,%hash1,@arra

作者：iVictor 时间：2021-08-15

漫谈 Perl 的 web 应用开发框架

忍不住在 PerlChina 邮件列表中盘点了一下 Perl 里的 Web 应用框架（巧的是 PerlBuzz 最近也有一篇相关的讨论帖），于是乎，决定在我自己的 blog 上也贴一下 :) 原生 CGI/FastCGI 的 web app 对于较小的应用非常合适，但稍复杂一些就有些痛苦，但运行效率是最高的 ;) 如果是自己用 Perl 开发高性能的站，多推荐之。 Catalyst, CGI::A

作者：编程之家时间：2020-08-13

perl中bless的理解

bless有两个参数：对象的引用、类的名称。类的名称是一个字符串，代表了类的类型信息，这是理解bless的关键。所谓bless就是把类型信息赋予实例变量。程序包括5个文件： person.pm ：实现了person类 dog.pm ：实现了dog类 bless.pl ：正确的使用bless bless.wrong.pl ：错误的使用bless bless.cc ：使用C++语言实

作者：编程之家时间：2020-08-13

PERL GB2312 UTF-8 编码转换

gb2312转Utf的方法： use Encode; my $str = "中文"; $str_cnsoftware = encode("utf-8", decode("gb2312", $str)); Utf转 gb2312的方法： use Encode; my $str = "utf8中文"; $str_cnsoftware = encode("gb2312", decode("utf-8

作者：编程之家时间：2020-08-13

perl 计算硬盘利用率

perl 计算硬盘利用率，以%来查看硬盘资源是否存在IO消耗cpu资源情况；部份代码参考了iostat源码； #!/usr/bin/perl use Time::HiRes qw(gettimeofday); use POSIX; $SLEEPTIME=3; sub getDiskUtl() { $clock_ticks = POSIX::sysconf( &POSIX::_SC_

作者：编程之家时间：2020-08-13

小编推荐

苹果市值2025年有望达4万亿美元