如何解决是否可以编写一个使用分组但不进行回溯的正则表达式引擎?
我正在尝试详细了解 redos 并且或多或少清楚为什么 (a|a)+x
在 aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaab
字符串上失败,但我很好奇是否有任何示例不使用分组?我读到 Thompson 引擎 is not vulnerable 解决这个问题,因为它不进行回溯,但据我所知,这意味着它也不能进行分组。是否可以在不回溯的情况下进行分组以及随之而来的漏洞?
解决方法
好的,根据 Wiktor Stribiżew 的说法,答案是 Re2。可以在不回溯的情况下支持分组。 Re2 不支持反向引用之类的东西,这是完全可以理解的,至少我怀疑许多引擎是否为这样的模式准备了 /(a)(a|\1)+b/.test("aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaax")
。他们写道,因此也不完全支持环视。所以这些引擎有局限性,但它们已经足够好了。许多人试图用单一模式解决所有问题,这加剧了这个问题。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。