通过php代码来实现一些功能时或通过php代码来实现采集数据时,采集到的数据或多或少都会带有html代码以及一些冗余杂乱数据,要经过处理下替换或者过滤掉这些不需要的数据,为了效率可以使用php正则表达式来进行替换或者过滤,下面是一些实用的替换或者过滤数据的正则表达式php代码,使用这些正则表达式就可以很好的替换或者过滤一些不想要的冗余杂乱数据。$str=preg_replace("/<[\/\!]*?[^<>]*?>/","",$str); //替换或过滤所有html代码
$str=preg_replace("/\s+/", " ", $str); //替换或过滤多余回车
$str=preg_replace("/<[ ]+/si","<",$str); //替换或过滤<__("<"号后面带空格)
$str=preg_replace("/<\!--.*?-->/si","",$str); //注释
$str=preg_replace("/<(\!.*?)>/si","",$str); //替换或过滤DOCTYPE
$str=preg_replace("/<(\/?html.*?)>/si","",$str); //替换或过滤html标签
$str=preg_replace("/<(\/?head.*?)>/si","",$str); //替换或过滤head标签
$str=preg_replace("/<(\/?meta.*?)>/si","",$str); //替换或过滤meta标签
$str=preg_replace("/<(\/?body.*?)>/si","",$str); //替换或过滤body标签
$str=preg_replace("/<(\/?link.*?)>/si","",$str); //替换或过滤link标签
$str=preg_replace("/<(\/?form.*?)>/si","",$str); //替换或过滤form标签
$str=preg_replace("/cookie/si","COOKIE",$str); //替换或过滤COOKIE标签
$str=preg_replace("/<(applet.*?)>(.*?)<(\/applet.*?)>/si","",$str); //替换或过滤applet标签
$str=preg_replace("/<(\/?applet.*?)>/si","",$str); //替换或过滤applet标签
$str=preg_replace("/<(style.*?)>(.*?)<(\/style.*?)>/si","",$str); //替换或过滤style标签
$str=preg_replace("/<(\/?style.*?)>/si","",$str); //替换或过滤style标签
$str=preg_replace("/<(title.*?)>(.*?)<(\/title.*?)>/si","",$str); //替换或过滤title标签
$str=preg_replace("/<(\/?title.*?)>/si","",$str); //替换或过滤title标签
$str=preg_replace("/<(object.*?)>(.*?)<(\/object.*?)>/si","",$str); //替换或过滤object标签
$str=preg_replace("/<(\/?objec.*?)>/si","",$str); //替换或过滤object标签
$str=preg_replace("/<(noframes.*?)>(.*?)<(\/noframes.*?)>/si","",$str); //替换或过滤noframes标签
$str=preg_replace("/<(\/?noframes.*?)>/si","",$str); //替换或过滤noframes标签
$str=preg_replace("/<(i?frame.*?)>(.*?)<(\/i?frame.*?)>/si","",$str); //替换或过滤frame标签
$str=preg_replace("/<(\/?i?frame.*?)>/si","",$str); //替换或过滤frame标签
$str=preg_replace("/<(script.*?)>(.*?)<(\/script.*?)>/si","",$str); //替换或过滤script标签
$str=preg_replace("/<(\/?script.*?)>/si","",$str); //替换或过滤script标签
$str=preg_replace("/javascript/si","Javascript",$str); //替换或过滤script标签
$str=preg_replace("/vbscript/si","Vbscript",$str); //替换或过滤script标签
$str=preg_replace("/on([a-z]+)\s*=/si","On\\1=",$str); //替换或过滤script标签
$str=preg_replace("/&#/si","&#",$str); //替换或过滤script标签,如javAsCript:alert(
评论
33条评论★霍伟东★ Lv.1
Chrome 110.0.0.0
Windows 回复
四川省绵阳市 电信
超 Lv.1
Chrome 103.0.0.0
Windows 7 回复
厉害
浙江省嘉兴市 电信
磊 Lv.1
Firefox 109.0
Windows 回复
厉害回复了
山西省太原市 联通
ZHDC Lv.1
Chrome 96.0.4664.110
Windows 回复
广东省深圳市 联通
哒哒 Lv.1
Chrome 63.0.3239.132
Windows 回复
学习
中国 移动
356572119 Lv.1
Chrome 107.0.0.0
Windows 回复
学习
河南省驻马店市 电信
1111 Lv.1
Chrome 95.0.4638.69
Windows 回复
学习
河南省驻马店市 联通
京帮帮 Lv.1
Chrome 86.0.4240.198
Windows 回复
新人报道
福建省厦门市 电信
12345 Lv.1
Chrome 99.0.4844.84
Windows 回复
新人报道
学习一下
美国 Computer
轨迹 Lv.1
Chrome 86.0.4240.198
Windows 回复
学习
浙江省温州市 联通