技术频道

公众号推荐

微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦！

UTF-8与PHP DOMDocument loadHTML？

时间：2021-11-30分类：PHP作者：编程之家AI导航网

考虑这个例子,test.PHP：

<?PHP
$mystr = "<p>Hello, με काचं  ça øy jeść</p>";
var_dump($mystr);
$domdoc = new DOMDocument('1.0', 'utf-8'); //DOMDocument();
$domdoc->loadHTML($mystr); // already here corrupt UTF-8?
var_dump($domdoc);
?>

如果我用PHP 5.5.9(cli)运行它,我进入终端：

$PHP test.PHP 
string(50) "<p>Hello, με काचं  ça øy jeść</p>"
object(DOMDocument)#1 (34) {
  ["doctype"]=>
  string(22) "(object value omitted)"
...
  ["actualEncoding"]=>
  NULL
  ["encoding"]=>
  NULL
  ["xmlEncoding"]=>
  NULL
...
  ["textContent"]=>
  string(70) "Hello, Î¼Îµ ï»¿à¤à¤¾à¤à¤  Ã§a Ã¸y jeÅÄ"
}

显然,原始字符串正确为UTF-8,但DOMDocument的textContent编码不正确.

那么,如何在DOMDocument中将内容作为正确的UTF-8获取？

DOM extension构建于libxml2,其HTML解析器是为HTML 4制作的 – 默认编码为ISO-8859-1.除非遇到相应的元标记或XML声明,否则loadHTML()将假定内容为ISO-8859-1.

在创建DOMDocument时指定编码不会影响解析器的作用 – 加载HTML(或XML)会替换您为其构造函数提供的xml版本和编码.

解决方法：

首先使用mb_convert_encoding()将ASCII范围以上的任何内容转换为其等效的html实体.

$domdoc->loadHTML(mb_convert_encoding($mystr, 'HTML-ENTITIES', 'UTF-8'));

或者破解指定UTF-8的元标记或xml声明.

$domdoc->loadHTML('<Meta http-equiv="Content-Type" content="charset=utf-8" />' . $mystr);

$domdoc->loadHTML('<?xml encoding="UTF-8">' . $mystr);

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 dio@foxmail.com 举报，一经查实，本站将立刻删除。

上一篇：php – 在medoo中运行LIKE 下一篇：php – 使用Alice Fixtures为嵌套

相关推荐

vue+thinkphp5实现微信扫码支付(NATIVE支付)

统一支付是JSAPI/NATIVE/APP各种支付场景下生成支付订单，返回预支付订单号的接口，目前微信支付所有场景均使用这一接口。下面介绍的是其中NATIVE的支付实现流程与PC端实现扫码支付流程

作者：我恨bug 时间：2024-07-30

uniapp+thinkphp5实现微信扫码支付(APP支付)

统一支付是JSAPI/NATIVE/APP各种支付场景下生成支付订单，返回预支付订单号的接口，目前微信支付所有场景均使用这一接口。下面介绍的是其中APP的支付的配置与实现流程

作者：我恨bug 时间：2024-07-30

uniapp+thinkphp5实现微信登录

前言之前做了微信登录，所以总结一下微信授权登录并获取用户信息这个功能的开发流程。配置 1.首先得在微信公众平台申请一下微信小程序账号并获取到小程序的AppID和AppSecret https://mp.weixin.qq.com/cgi-bin/loginpage?url=%2Fwxamp%2F

作者：我恨bug 时间：2024-07-30

【PHP】关于fastadmin框架中使用with进行连表查询时setEagerlyType字段的理解

FastAdmin是我第一个接触的后台管理系统框架。FastAdmin是一款开源且免费商用的后台开发框架，它基于ThinkPHP和Bootstrap两大主流技术构建的极速后台开发框架，它有着非常完善且强大的功能和便捷的开发体验，使我逐渐喜欢上了它。

作者：我恨bug 时间：2024-07-30

【workerman】uniapp+thinkPHP5使用GatewayWorker实现实时通讯

之前公司需要一个内部的通讯软件，就叫我做一个。通讯软件嘛，就离不开通讯了，然后我就想到了长连接。这里本人用的是GatewayWorker框架。

作者：我恨bug 时间：2024-07-30

uniapp+thinkphp5实现微信支付(JSAPI支付)

统一支付是JSAPI/NATIVE/APP各种支付场景下生成支付订单，返回预支付订单号的接口，目前微信支付所有场景均使用这一接口。下面介绍的是其中JSAPI的支付实现流程

作者：我恨bug 时间：2024-07-30

服务器优化必备：深入了解PHP8底层开发原理

服务器优化必备：深入了解PHP8底层开发原理

作者：编程之家时间：2023-09-11

Golang的网络编程：如何快速构建高性能的网络应用？

Golang的网络编程：如何快速构建高性能的网络应用？

作者：编程之家时间：2023-09-11

Golang和其他编程语言的对比：为什么它的开发效率更高？

Golang和其他编程语言的对比：为什么它的开发效率更高？

作者：编程之家时间：2023-09-11

PHP8底层开发原理揭秘：如何利用新特性创建出色的Web应用

PHP8底层开发原理揭秘：如何利用新特性创建出色的Web应用

作者：编程之家时间：2023-09-11

小编推荐

苹果市值2025年有望达4万亿美元