微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

正则表达式处理img标签

文章内容中包含有<img>标签内容,但有时候不需要显示图片,只需要显示内容,需要将内容中的图片替换掉,这个正则表达式,我可花了些时间,百度了一下,没有合适的,就自己费时间写了,

还可以用吧。 这里是java的,但正则表达式应该是一样的吧。

在网上找一段js的处理代码,异常简洁,相当好,这里和大家共享。

<script>

var content='${item.content}';
re = new RegExp("<(?!img|br|p|/p).*?>","g"); // 创建正则表达式对象。
r = content.match(re); // 在字符串 s 中查找匹配。
var contentValue = content.replace(/<[^>]+>/g,""); //去掉所有的html标记
if(contentValue.length>80){
contentValue=contentValue.substring(0,80)+"...";
}

</script>

以下是java代码:这里还真费了我不少脑筋,因为我们的文档发布者,总是从别处复制粘贴到编辑器里,带上了很多的各种复杂样式。在界面列表中,只显示一少部分内容,这时候需要对文档做处理之后再支截取少部分内容显示。不处理直接截取部分内容显示就有各种异常。

String content="<img src=\"http://192.168.1.162/upload/pu_68.jpg\" alt=\"\" />象个洋娃娃吗33333<img src=\"http://192.168.1.152/upload/33288.jpg\" alt=\"\" />888rrrrrr";

// String regex="<img\\s*([\\w]*=(\"|\')([^\"\']*)(\"|\')\\s*)*/>";//这样更简单
// String regex="<img\\s*src=(\"|\')([^\"\']+)(\"|\')\\s*([\\w]+=(\"|\')([^\"\']*)(\"|\')\\s*)*/>";
Pattern p = Pattern.compile("<img\\s*src=(\"|\')([^\"\']+)(\"|\')\\s*([\\w]+=(\"|\')([^\"\']*)(\"|\')\\s*)*/>");
Matcher m = p.matcher(content);
上面是单纯图片的,下面处理比较全面了。


String regex="<(img|a|p|b|div|br)\\s*([\\w]*=(\"|\')([^\"\'<]*)(\"|\')\\s*)*(/>|>)";
content=content.replaceAll(regex,"");
String regex2="<span\\s*([\\w]*=(\"|\')(([^\"\'/>><']*)(\"|\'))*\\s*)*(/>|>)";
content=content.replaceAll(regex2,"");
content=content.replaceAll("<(/a|b|/b|p|/p|/span|/div)>","");
content=content.replaceAll("\r|\n|\t|&nbsp;","");
if(content.length()>100){
content=content.substring(0,100)+"...";
}


System.out.println(content);

至此,可以基本满足需要了,虽然不能解决全部问题。

//<img\\s*([\\w]*=(\"|\')([^\"\']*)(\"|\')\\s*)*/>

原文地址:https://www.jb51.cc/regex/361695.html

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐