微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

正则表达式 – 合并线条之间,不包括重复模式与sed

我有一个包含时间戳的行数的文件,中间有几行.例如,

TIMESTAMP MESSAGE
TRAIL 1
TRAIL 2
TIMESTAMP MESSAGE2
TRAIL 21
TRAIL 22 ...

我想将所有跟踪消息添加到一行中,或者更好的是将两个时间戳之间的所有行添加到一行中,以便我的输出看起来像

TIMESTAMP MESSAGE TRAIL 1 TRAIL 2
TIMESTAMP MESSAGE2 TRAIL 21 TRAIL 22 ...

在这里经历了几个类似的问题,但在我的案例中没有任何问题.我试过用

sed -i '/pattern_for_timestamp/{n;:l N;/pattern_for_timestamp/b ; s/\n// ; bl}'

但它只会改变模式的每个替代事件.跟踪消息中不需要任何模式.在这种情况下,我更喜欢使用sed或awk.

解决方法

我会去收集空间中的线条直到完成,然后修改和打印,例如:

parse.sed

/^TIMESTAMP/ b prn            # Run the prn subroutine
H                             # Anything else is appended to hold-space
$b prn                       # Also run prn at end-of-input
b                             # Process next line

:prn
x                             # Swap pattern-space and hold-space
s/\n/ /g                      # Replace \n with space
1!p                           # Print the result if not on the first line

像这样运行:

sed -nf parse.sed infile

或者作为一个单行:

sed -n '/^TIMESTAMP/bp;H;$bp;b;:p;x;s/\n/ /g;1!p' infile

输出

TIMESTAMP MESSAGE TRAIL 1 TRAIL 2
TIMESTAMP MESSAGE2 TRAIL 21 TRAIL 22 ...

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐