微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

详解xml型字符串解析时存在& < >符号时的解决方案

问题产生:

接口调用得出一个xml字符串,一直报错

The entityname must immediately follow the '&' in the entity reference

经查发现 xml的内容里存在有 &符号 而 通过dom4j读取时 会发生错误

在xml中 “&”“<”“>”这样的标签存放在内容里是不合法的,会经常出问题。

下面找到解决方法:实测 替换 & 是可行的。

public void chartReplace(){
        String str2 = <logentry revision='1'> +
                <msg>In this comment, I fixed a <bug>, and <added> file1&&file2.</msg> +
                </logentry>;
        System.out.println(original string: +str2);
         
        //替换“&”:$1表示与(<msg>.*)的匹配子序列;$4表示与(.*</msg>)匹配的。
                     //&(?!amp;)表示匹配&而且后面不是amp;的字符串
        //$1&amp;$3$4得到的结果就是替换了<msg></msg>中的“&”为“&amp;”
        //由于每次只能替换掉一个“&”,所以循环执行替换,直到替换后与替换前的字符串相等。
        String str1 = ;
        while(!str2.equals(str1)){
            str1 = str2;
            str2 = str1.replaceAll((<msg>.*)(&(?!amp;))(.*</msg>), $1&amp;$3);
        }
        System.out.println(firstly replace \&\: +str2);
         
        //替换“<”
        str1 = ;
        while(!str2.equals(str1)){
            str1 = str2;
            str2 = str1.replaceAll((<msg>.*)(<)(.*</msg>), $1&lt;$3);
        }
        System.out.println(then replace \<\: +str2);
         
        //替换“<”
        str1 = ;
        while(!str2.equals(str1)){
            str1 = str2;
            str2 = str1.replaceAll((<msg>.*)(>)(.*</msg>), $1&gt;$3);
        }
        System.out.println(finally replace \>\: +str2);
    }

原文地址:https://www.jb51.cc/xml/1194160.html

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。