XML编码规则整理，值得收藏

W3C定义了三条XML解析器如何正确读取XML文件的编码的规则： 1，如果文挡有BOM(字节顺序标记，一般来说，如果保存为unicode格式，则包含BOM，ANSI则无)，就定义了文件编码 2，如果没有BOM，就查看XML声明的编码属性 3，如果上述两个都没有，就假定XML文挡采用UTF-8编码有了这三条规则，那这个规则就清楚多了。首先，XML解析器根据文件的BOM来解析文件；如果没找到BOM，由用XML里的encoding属性指定的编码；如果xml里encoding没指定的话，就默认用utf-8来解析文档。然后又可以推出，BOM和ENCODING都有的话，则以BOM指定的为准。为了避免发生错误，可以在XML文档声明中加上一个encoding属性，指明此XML文档的编码类型，但是不要使用Unicode编码。在ANSI下，下面的编码类型不会导致错误，并且汉字显示正常: <?xml version="1.0" encoding="gb2312"?> <?xml version="1.0" encoding="gbk"?> 下面的编码类型不会导致错误，并且汉字显示不正常(乱码): <?xml version="1.0" encoding="windows-1252"?> <?xml version="1.0" encoding="ISO-8859-1"?> <?xml version="1.0" encoding="UTF-8"?> <?xml version="1.0" encoding="UTF-16"?>

原文地址：https://www.jb51.cc/xml/297162.html

XML编码规则整理，值得收藏

相关推荐