参见英文答案 >
How do you parse and process HTML/XML in PHP?29个
我在使用正则表达式匹配html属性(在各种html标签中)时遇到问题.为此,我使用模式:
我在使用正则表达式匹配html属性(在各种html标签中)时遇到问题.为此,我使用模式:
myAttr=\"([^']*)\"
HTML片段:
<img alt="" src="1-p2.jpg" myAttr="http://example.com" class="alignleft" />
它从myAttr中选择文本结束/>但我需要选择myAttr =“…”(“http://example.com”)
你的角色类中有一个撇号(‘),但你想要一个引号(“).
myAttr=\"([^"]*)\"
那就是说,你真的是shouldn’t be parsing HTML with regexes.(很抱歉再次链接到那个答案.对于那个问题还有其他答案,更多的是“如果你知道你在做什么……”变种.但是要注意这一点很好.)
请注意,即使您将regexing限制为仅属性,您还需要考虑很多因素:
>注意不要在评论内部匹配.
>小心不要匹配CDATA部分内部.
>如果属性用单引号而不是双引号括起来怎么办?
>如果属性没有引号怎么办?
这就是为什么通常需要预先构建的,严肃的解析器的原因.
原文地址:https://www.jb51.cc/regex/356992.html
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。