技术频道

公众号推荐

微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦！

php – 正则表达式/ DOMDocument – 匹配和替换不在链接中的文本

时间：2020-07-03分类：PHP作者：编程之家

我需要以不区分大小写的方式查找和替换所有文本匹配,除非文本在锚标签内,例如：

<p>Match this text and replace it</p>
<p>Don't <a href="/">match this text</a></p>
<p>We still need to match this text and replace it</p>

搜索“匹配此文本”将仅替换第一个实例和最后一个实例.

根据Gordon的评论,在这种情况下可能会使用DOMDocument.我完全不熟悉DOMDocument扩展,并且非常感谢这个功能的一些基本示例.

这是一个UTF-8安全解决方案,它不仅适用于正确格式化的文档,而且与文档片段一起使用.

需要mb_convert_encoding,因为loadHtml()似乎有一个UTF-8编码的错误(见here和here).

mb_substr从输出中修剪body标签,这样你就可以获得原始内容,而无需任何额外的标记.

<?PHP
$html = '<p>Match this text and replace it</p>
<p>Don\'t <a href="/">match this text</a></p>
<p>We still need to match this text and replace itŐŰ</p>
<p>This is <a href="#">a link <span>with <strong>don\'t match this text</strong> content</span></a></p>';

$dom = new DOMDocument();
// loadXml needs properly formatted documents,so it's better to use loadHtml,but it needs a hack to properly handle UTF-8 encoding
$dom->loadHtml(mb_convert_encoding($html,'HTML-ENTITIES',"UTF-8"));

$xpath = new DOMXPath($dom);

foreach($xpath->query('//text()[not(ancestor::a)]') as $node)
{
    $replaced = str_ireplace('match this text','MATCH',$node->wholeText);
    $newNode  = $dom->createDocumentFragment();
    $newNode->appendXML($replaced);
    $node->parentNode->replaceChild($newNode,$node);
}

// get only the body tag with its contents,then trim the body tag itself to get only the original content
echo mb_substr($dom->saveXML($xpath->query('//body')->item(0)),6,-7,"UTF-8");

参考文献：
1. find and replace keywords by hyperlinks in an html fragment,via php dom
2. Regex / DOMDocument – match and replace text not in a link
3. php problem with russian language
4. Why Does DOM Change Encoding?

我读了几十个答案,所以我很抱歉,如果我忘了某人(请评论,我会在这种情况下添加你的).

感谢Gordon和my other answer的评论.

原文地址：https://www.jb51.cc/php/138203.html

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 dio@foxmail.com 举报，一经查实，本站将立刻删除。

上一篇：php – 一个javascript字符串变量的下一篇：php – 找到一个“最佳拟合”方程

相关推荐

vue+thinkphp5实现微信扫码支付(NATIVE支付)

统一支付是JSAPI/NATIVE/APP各种支付场景下生成支付订单，返回预支付订单号的接口，目前微信支付所有场景均使用这一接口。下面介绍的是其中NATIVE的支付实现流程与PC端实现扫码支付流程

作者：我恨bug 时间：2024-07-30

uniapp+thinkphp5实现微信扫码支付(APP支付)

统一支付是JSAPI/NATIVE/APP各种支付场景下生成支付订单，返回预支付订单号的接口，目前微信支付所有场景均使用这一接口。下面介绍的是其中APP的支付的配置与实现流程

作者：我恨bug 时间：2024-07-30

uniapp+thinkphp5实现微信登录

前言之前做了微信登录，所以总结一下微信授权登录并获取用户信息这个功能的开发流程。配置 1.首先得在微信公众平台申请一下微信小程序账号并获取到小程序的AppID和AppSecret https://mp.weixin.qq.com/cgi-bin/loginpage?url=%2Fwxamp%2F

作者：我恨bug 时间：2024-07-30

【PHP】关于fastadmin框架中使用with进行连表查询时setEagerlyType字段的理解

FastAdmin是我第一个接触的后台管理系统框架。FastAdmin是一款开源且免费商用的后台开发框架，它基于ThinkPHP和Bootstrap两大主流技术构建的极速后台开发框架，它有着非常完善且强大的功能和便捷的开发体验，使我逐渐喜欢上了它。

作者：我恨bug 时间：2024-07-30

【workerman】uniapp+thinkPHP5使用GatewayWorker实现实时通讯

之前公司需要一个内部的通讯软件，就叫我做一个。通讯软件嘛，就离不开通讯了，然后我就想到了长连接。这里本人用的是GatewayWorker框架。

作者：我恨bug 时间：2024-07-30

uniapp+thinkphp5实现微信支付(JSAPI支付)

统一支付是JSAPI/NATIVE/APP各种支付场景下生成支付订单，返回预支付订单号的接口，目前微信支付所有场景均使用这一接口。下面介绍的是其中JSAPI的支付实现流程

作者：我恨bug 时间：2024-07-30

服务器优化必备：深入了解PHP8底层开发原理

服务器优化必备：深入了解PHP8底层开发原理

作者：编程之家时间：2023-09-11

Golang的网络编程：如何快速构建高性能的网络应用？

Golang的网络编程：如何快速构建高性能的网络应用？

作者：编程之家时间：2023-09-11

Golang和其他编程语言的对比：为什么它的开发效率更高？

Golang和其他编程语言的对比：为什么它的开发效率更高？

作者：编程之家时间：2023-09-11

PHP8底层开发原理揭秘：如何利用新特性创建出色的Web应用

PHP8底层开发原理揭秘：如何利用新特性创建出色的Web应用

作者：编程之家时间：2023-09-11

小编推荐

苹果市值2025年有望达4万亿美元