后端开发|php教程
php过滤html标签,正则表达式过滤
后端开发-php教程
过滤html标签在php中可以有内置的函数了,但它过滤的太干净了,我们就整理了一下些利用正则来过滤指定html标签的例子,具体如下所示。
健康管理 源码,vscode 文件过滤,ubuntu测评,tomcat 缓存过期,表行数sqlite c,jquery 图片多选插件,java 管理系统前端框架,农村墙角爬虫,php 会员,seo 站内链接,网站推荐优惠订单系统源码,带网页播放器,手机响应式商城模板,捕鱼达人的页面代码,mvc 管理系统,robobasic源程序lzw
采集的时候有时候需要过滤掉多余的标签属性,比如 img标签过滤掉除了src属性之外的所有属性例如删除titile alt等属性以及一些脚的onclick属性等。
九九棋牌源码,ubuntu缩小终端字体,tomcat更改默认页面,夏季厕所爬虫,php采集商品,神马百科排名千年seolzw
例如
android手机商城源码,ubuntu18.04qt,爬虫 cnki 登陆,php如何打开php网页,seo119lzw
代码如下:
$str= preg_replace(‘/\s(?!src)[a-zA-Z]+=[\’\”]{1}[^\’\”]+[\’\”]{1}/iu’,’ $str);
上面的实例代码是过滤掉除了src属性外的所有标签属性.
代码如下:
$str = preg_replace(‘/\s(?!(src|alt))[a-zA-Z]+=[^\s]*/iu’,’ ‘, $str);
代码如下:
$str = preg_replace(“/]*>/i”,””,$str );
代码如下:
(\s)alt=[^\s]*
代码如下:
$search = array (“‘]*?>.*?’si”, // 去掉 javascript
“‘<[\/\!]*?[^]*?>’si”, // 去掉 HTML 标记
“‘([\r\n])[\s]+”, // 去掉空白字符
“‘&(quot|#34);’i”, // 替换 HTML 实体
“‘&(amp|#38);’i”,
“‘&(lt|#60);’i”,
“‘&(gt|#62);’i”,
“‘&(nbsp|#160);’i”
); // 作为 PHP 代码运行
$replace = array (“”,””,”\\1″,”\””,”&”,””,” “);
$html = preg_replace($search, $replace, $html);