微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

正则表达式 – HTML代码中的匹配属性

参见英文答案 > How do you parse and process HTML/XML in PHP?29个
我在使用正则表达式匹配html属性(在各种html标签中)时遇到问题.为此,我使用模式:
myAttr=\"([^']*)\"

HTML片段:

<img alt="" src="1-p2.jpg" myAttr="http://example.com" class="alignleft" />

它从myAttr中选择文本结束/>但我需要选择myAttr =“…”(“http://example.com”)

你的角色类中有一个撇号(‘),但你想要一个引号(“).
myAttr=\"([^"]*)\"

那就是说,你真的是shouldn’t be parsing HTML with regexes.(很抱歉再次链接到那个答案.对于那个问题还有其他答案,更多的是“如果你知道你在做什么……”变种.但是要注意这一点很好.)

请注意,即使您将regexing限制为仅属性,您还需要考虑很多因素:

>注意不要在评论内部匹配.
>小心不要匹配CDATA部分内部.
>如果属性用单引号而不是双引号括起来怎么办?
>如果属性没有引号怎么办?

这就是为什么通常需要预先构建的,严肃的解析器的原因.

原文地址:https://www.jb51.cc/regex/356992.html

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐