如何解决如何区分正则表达式的第 m 个捕获组的第 n 个匹配模式与 bash 中较早或较晚的匹配?
这个问题是关于 bash 可以处理的正则表达式。
我有一个正则表达式,它在文本中查找日期的所有匹配项,如果它恰好在选项卡之间或在至少两个空格:
(?<=\t|\s{2,})(\d{1,2}\.\d{1,2}\.\d{4})(?=\t|\s{2,})
我如何替换所有的结果(让我们先假设)根据 ISO 8601 格式的日期捕获组,即在符号 yyyy-mm- dd?
由于分隔制表符或至少双空格处于环视状态,因此它们不属于我的捕获组。它们将保持在原始字符串中的状态。
问题分解为:
1.如何解决 $1 的第 n 次匹配
2.在这种情况下,如何重新排列由点分隔的三个组件?
解决方法
如果您想使用 bash
处理它,请尝试以下操作:
#!/bin/bash
str=$'foo\t27.6.2021 bar' # example of the input line
pat=$'^(.*)(\t| {2,})([0-9]{1,2})\.([0-9]{1,2})\.([0-9]{4})(\t| {2,})(.*)$'
if [[ $str =~ $pat ]]; then
a=("${BASH_REMATCH[@]:1}") # assign array "a" to the matched substrings excluding "${BASH_REMATCH[0]}" (entire match)
y=${a[4]}; a[4]=${a[2]}; a[2]=$y; # swap year and date
printf "%s%s%04d-%02d-%02d%s%s\n" "${a[@]}" # print the formatted result
fi
正如所评论的,bash 正则表达式不支持环视。您需要将整行捕获为子字符串并重用它们。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。