我仍然是
shell脚本的菜鸟,但我正在努力.下面是一个部分工作的shell脚本,它应该通过匹配标记并删除其附带的内容来从* .htm文档中删除所有JS.例如. < script src =“”>,< script>< / script>和< script type =“text /
javascript”>
find $1 -name "*.htm" > ./patterns for p in $(cat ./patterns) do sed -e "s/<script.*[.>]//g" $p #> tmp.htm ; mv tmp.htm $p done
这个问题是脚本是因为sed逐行读取文本输入,这个脚本将无法按预期使用新行.运行:
<script> //Foo </script>
将删除第一个脚本标记,但将省略我不想要的“foo”和结束标记.
有没有办法匹配我的正则表达式中的换行符?或者如果sed不合适,还有什么我可以使用的吗?
解决方法
假设你有< script>不同行上的标记,例如就像是:
foo bar <script type="text/javascript"> some JS </script> foo
以下应该有效:
sed '/<script/,/<\/script>/d' inputfile
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。