微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

regex – sed – 在模式中包含换行符

我仍然是 shell脚本的菜鸟,但我正在努力.下面是一个部分工作的shell脚本,它应该通过匹配标记删除其附带的内容来从* .htm文档中删除所有JS.例如. < script src =“”>,< script>< / script>和< script type =“text / javascript”>

find $1 -name "*.htm" > ./patterns
for p in $(cat ./patterns)
do
sed -e "s/<script.*[.>]//g" $p #> tmp.htm ; mv tmp.htm $p
done

这个问题是脚本是因为sed逐行读取文本输入,这个脚本将无法按预期使用新行.运行:

<script>
//Foo
</script>

删除一个脚本标记,但将省略我不想要的“foo”和结束标记.

有没有办法匹配我的正则表达式中的换行符?或者如果sed不合适,还有什么我可以使用的吗?

解决方法

假设你有< script>不同行上的标记,例如就像是:

foo
bar
<script type="text/javascript">
some JS
</script>
foo

以下应该有效:

sed '/<script/,/<\/script>/d' inputfile

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐