如何解决查找带有可选前置字符串后跟可选空格的字符串,两者都带有负向后视
我不确定这个问题的标题是否有意义。我正在寻找一个字符串(“string”),它可以有一个可选的前置字符串(“a”),它可以或不能跟有空格。所有这些都应该带有否定的回顾——这基本上是针对整个以下表达式。
我的正则表达式开始因否定的后视而失败,这对我来说很有意义,我想知道如何解决这个问题。
这可以在任何地方,不必在开头。
x <- c("string not false","this is not a string","this is a string","not a string","not astring","a string","astring","string")
# all the below fail
grepl("(?<!not\\s{1})a?\\s?string",x,perl = TRUE)
#> [1] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
grepl("(?<!not\\s{1})a\\s?string",perl = TRUE)
#> [1] FALSE FALSE TRUE FALSE FALSE TRUE TRUE FALSE
grepl("(?<!not\\s{1})(\\b|a)\\s?string",perl = TRUE)
#> [1] TRUE TRUE TRUE TRUE FALSE TRUE TRUE TRUE
# expected output
#> [1] TRUE FALSE TRUE FALSE FALSE TRUE TRUE TRUE
解决方法
为什么不避免回头看,而选择简单的方法,在两个单独的调用中询问您想要什么和不想要什么?
grepl("a?\\s?string",x) & !grepl("not\\s?a?\\s?string",x)
#[1] TRUE FALSE TRUE FALSE FALSE TRUE TRUE TRUE
注意:
如果你真的只想调用一次 grepl
,你需要详细说明你想要什么和你不想要什么:如果你只是要求不要 "not"
但没有具体说明"not "
(“not”后跟一个空格)也不行,它不起作用,你需要把它放在lookbehind中。您还需要在前瞻中详细说明您想要的内容,因为如果您在 regex
中过于灵活(可以有带或不带空格的“a”等),grepl
仍然会找到匹配项。
以下代码(比 2 个 grepl
调用更复杂)适用于您的示例:
grepl("(?<!(not)|(not ))(?=(^string)|(a string)|(astring))",x,perl=TRUE)
#[1] TRUE FALSE TRUE FALSE FALSE TRUE TRUE TRUE
数据:x <- c("string not false","this is not a string","this is a string","not a string","not astring","a string","astring","string")
grepl
解决方案:
grepl("^(?!not).*string",perl = TRUE)
或者,查看:
library(stringr)
str_detect(x,"\\bnot\\b",negate = TRUE)
[1] TRUE FALSE FALSE TRUE TRUE TRUE
grepl
不允许模式否定(但 grep
允许!)
数据:
x <- c("this is a string","string")
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。