微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

正则表达式 – 数学中的错误:正则表达式应用于非常长的字符串

在下面的代码中,如果字符串被附加到10或2万个字符,则Mathematica内核可能会出现故障.
s = "This is the first line.
MAGIC_STRING
Everything after this line should get removed.
12345678901234567890123456789012345678901234567890123456789012345678901234567890
12345678901234567890123456789012345678901234567890123456789012345678901234567890
12345678901234567890123456789012345678901234567890123456789012345678901234567890
12345678901234567890123456789012345678901234567890123456789012345678901234567890
12345678901234567890123456789012345678901234567890123456789012345678901234567890
...";

s = StringReplace[s,RegularExpression@"(^|\\n)[^\\n]*MAGIC_STRING(.|\\n)*"->""]

我认为这主要是Mathematica的错,我已经提交了一个错误报告,如果我得到一个回应,将在后面跟进.但我也想知道我是否以愚蠢/低效的方式这样做.即使没有,数字化问题的想法也将不胜感激.

Mathematica使用PCRE语法,所以它确实有/ s也称为DOTALL aka Singleline修饰符,你只需要在你想要应用的表达式的部分之前加上(?s)修饰符.

请参阅这里的RegularExpression文档:(展开标题为“更多信息”的部分)
http://reference.wolfram.com/mathematica/ref/RegularExpression.html

The following set options for all regular expression elements that follow them:
(?i) treat uppercase and lowercase as equivalent (ignore case)
(?m) make ^ and $match start and end of lines (multiline mode)
(?s) allow . to match newline
(?-c) unset options

这个修改的输入并不会为我(原来的)使用一个长度为15,000个字符的字符串,为我创建了数学Mathematica 7.0.1,产生与你的表达式相同的输出

s = StringReplace [s,RegularExpression @“.* MAGIC_STRING(?s).*” – >“”]

由于@AlanMoore解释的原因,它也应该更快一些

原文地址:https://www.jb51.cc/regex/356704.html

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐