如何解决Azure KQL 正则表达式使用extract_all() 为命名捕获组捕获句子
我正在尝试使用 extract_all() 函数从具有以下格式的日志中提取多个值:
v1=value1 v2=May 18 2021 v3=value3 v4=The dog jumps over the fence v5=192.168.1.1
extract_all() 格式如下:
extract_all(@"(?P<key>\w+)?=(?P<value>\S*)?",dynamic(["key","value"]),restconvert)
我尝试了多种方法来捕获 v4 的完整句子,但我一直无法做到。其中,我使用过 (?P<value>\w+)?
、(?P<value>\S* \d* \d*)?
。后者能够捕获日期而不会对字符串的连续性造成任何问题。我还尝试了正则表达式的第二部分中的逻辑 or 以区分没有成功的情况。
\w+( \w+)*
和类似的变体混淆了其他值,例如 IP 地址和字符串的连续性。
我没有使用解析运算符,因为字段会随时间变化。
有什么提示吗?
解决方法
如果使用负前瞻,这会容易得多,但 RE2 显然不支持它。这会处理单词之间的许多空格并跳过空格,但有时会在值上包含一个额外的空格,如果值和下一个键标记之间有多个空格。
print text="v1=value1 v2=May 18 2021 v3=value3 v4=The dog jumps over the fence"
| extend values = extract_all(@"(?P<key>\w+)=(?P<value>(?:\w+(?:\s?|\z))+)(?:\s|\z)",dynamic(["key","value"]
结果:
[
[
""v1"",""value1 ""
],[
""v2"",""May 18 2021 ""
],[
""v3"",""value3 ""
],[
""v4"",""The dog jumps over the fence""
]
]
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。