linux下去掉tppabs冗余代码
今天在对一些静态页面做处理时,发现里面包含了很多tppabs代码。刚上查了下,该代码一般为离线浏览器(如Teleport Pro)下载时记录下来的。说白了,基本上是无用的代码。我看了下代码里包含该内容的一般有如下两种:
1<a href="index.htm" tppabs="index.htm">快乐强盗</a>
2或
3<a href="index.htm" tppabs="http://xxx.com/xxxx/xxx/index.htm">快乐强盗</a>
既然找能到规律,处理起来就简单 。直接通过正则利用sed处理掉就行了。
上面一种的直接:
1sed -i 's/btppabs="[^"]*"//g' xxx.html
第二种的为:
1sed -i 's/btppabs="h[^"]*"//g' xxx.html
注:如果没确定把握的最先不用-i参数,因为该参数直接就在原文件里修改掉了。
要查找所有的html文件并直接替换所有,也很简单,配合一个for循环就可以搞定:
1#!/bin/bash
2for i in `grep -r 'tppabs' *|awk -F: '{print $1}'|sort |uniq`
3do
4sed -i 's/btppabs="h[^"]*"//g' $i
5done
捐赠本站(Donate)
如您感觉文章有用,可扫码捐赠本站!(If the article useful, you can scan the QR code to donate))
- Author: shisekong
- Link: https://blog.361way.com/tppabs-sed/2822.html
- License: This work is under a 知识共享署名-非商业性使用-禁止演绎 4.0 国际许可协议. Kindly fulfill the requirements of the aforementioned License when adapting or creating a derivative of this work.