微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

XML编码规则整理,值得收藏

W3C定义了三条XML解析器如何正确读取XML文件的编码的规则: 1,如果文挡有BOM(字节顺序标记,一般来说,如果保存为unicode格式,则包含BOM,ANSI则无),就定义了文件编码 2,如果没有BOM,就查看XML声明的编码属性 3,如果上述两个都没有,就假定XML文挡采用UTF-8编码 有了这三条规则,那这个规则就清楚多了。 首先,XML解析器根据文件的BOM来解析文件;如果没找到BOM,由用XML里的encoding属性指定的编码;如果xml里encoding没指定的话,就认用utf-8来解析文档。然后又可以推出,BOM和ENCODING都有的话,则以BOM指定的为准。 为了避免发生错误,可以在XML文档声明加上一个encoding属性,指明此XML文档的编码类型,但是不要使用Unicode编码。 在ANSI下,下面的编码类型不会导致错误,并且汉字显示正常: <?xml version="1.0" encoding="gb2312"?> <?xml version="1.0" encoding="gbk"?> 下面的编码类型不会导致错误,并且汉字显示不正常(乱码): <?xml version="1.0" encoding="windows-1252"?> <?xml version="1.0" encoding="ISO-8859-1"?> <?xml version="1.0" encoding="UTF-8"?> <?xml version="1.0" encoding="UTF-16"?>

原文地址:https://www.jb51.cc/xml/297162.html

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。