微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

如何区分正则表达式的第 m 个捕获组的第 n 个匹配模式与 bash 中较早或较晚的匹配?

如何解决如何区分正则表达式的第 m 个捕获组的第 n 个匹配模式与 bash 中较早或较晚的匹配?

这个问题是关于 bash 可以处理的正则表达式。

我有一个正则表达式,它在文本中查找日期的所有匹配项,如果它恰好在选项卡之间或在至少两个空格:

(?<=\t|\s{2,})(\d{1,2}\.\d{1,2}\.\d{4})(?=\t|\s{2,})

我如何替换所有的结果(让我们先假设)根据 ISO 8601 格式的日期捕获组,即在符号 yyyy-mm- dd?

由于分隔制表符或至少双空格处于环视状态,因此它们不属于我的捕获组。它们将保持在原始字符串中的状态。

问题分解为:

1.如何解决 $1 的第 n 次匹配

2.在这种情况下,如何重新排列由点分隔的三个组件?

解决方法

如果您想使用 bash 处理它,请尝试以下操作:

#!/bin/bash

str=$'foo\t27.6.2021  bar'                      # example of the input line
pat=$'^(.*)(\t| {2,})([0-9]{1,2})\.([0-9]{1,2})\.([0-9]{4})(\t| {2,})(.*)$'
if [[ $str =~ $pat ]]; then
    a=("${BASH_REMATCH[@]:1}")                  # assign array "a" to the matched substrings excluding "${BASH_REMATCH[0]}" (entire match)
    y=${a[4]}; a[4]=${a[2]}; a[2]=$y;           # swap year and date
    printf "%s%s%04d-%02d-%02d%s%s\n" "${a[@]}" # print the formatted result
fi

正如所评论的,bash 正则表达式不支持环视。您需要将整行捕获为子字符串并重用它们。

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其他元素将获得点击?
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。)
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbcDriver发生异常。为什么?
这是用Java进行XML解析的最佳库。
Java的PriorityQueue的内置迭代器不会以任何特定顺序遍历数据结构。为什么?
如何在Java中聆听按键时移动图像。
Java“Program to an interface”。这是什么意思?