PHP实现网页内容html标签补全和过滤的方法小结【2种方法】

2018-09-07 17:45

阅读:297

  本文实例讲述了PHP实现网页内容html标签补全和过滤的方法。分享给大家供大家参考,具体如下:

  如果你的网页内容的html标签显示不全,有些表格标签不完整而导致页面混乱,或者把你的内容之外的局部html页面给包含进去了,我们可以写个函数方法来补全html标签以及过滤掉无用的html标签.

  php使HTML标签自动补全,闭合,过滤函数方法一:

  代码:

   function closetags($html) { preg_match_all(#<(?!metaimgbrhrinput\b)\b([a-z]+)(?: .*)?(?<![// ])>#iU, $html, $result); $openedtags = $result[1]; preg_match_all(#</([a-z]+)>#iU, $html, $result); $closedtags = $result[1]; $len_opened = count($openedtags); if (count($closedtags) == $len_opened) { return $html; } $openedtags = array_reverse($openedtags); for ($i=0; $i < $len_opened; $i++) { if (!in_array($openedtags[$i], $closedtags)) { $html .= </.$openedtags[$i].>; }else { unset($closedtags[array_search($openedtags[$i], $closedtags)]); } } return $html; }

  closetags()解析:

  array_reverse() : 此函数将原数组中的元素顺序翻转,创建新的数组并返回。如果第二个参数指定为 true,则元素的键名保持不变,否则键名将丢失。

  array_search() : array_search(value,array,strict),此函数与in_array()一样在数组中查找一个键值。如果找到了该值,匹配元素的键名会被返回。如果没找到,则返回 false。 如果第三个参数strict被指定为 true,则只有在数据类型和值都一致时才返回相应元素的键名。

  php使HTML标签自动补全,闭合,过滤函数方法二:

   function checkhtml($html) { $html = stripslashes($html); preg_match_all(/\<([^\<]+)\>/is, $html, $ms); $searchs[] = <; $replaces[] = <; $searchs[] = >; $replaces[] = >; if($ms[1]) { $allowtags = imgfontdivtabletbodytrtdthbrpbstrongiuemspanolulli;//允许的标签 $ms[1] = array_unique($ms[1]); foreach ($ms[1] as $value) { $searchs[] = <.$value.>; $value = shtmlspecialchars($value); $value = str_replace(array(\\,/*), array(.,/.), $value); $value = preg_replace(array(/(javascriptscriptevalbehaviourexpression)/i, /(\s+)on/i), array(., .), $value); if(!preg_match(/^[\/\s]?($allowtags)(\s+$)/is, $value)) { $value = ; } $replaces[] = empty($value)?:<.str_replace(, , $value).>; } } $html = str_replace($searchs, $replaces, $html); return $html; } //取消HTML代码 function shtmlspecialchars($string) { if(is_array($string)) { foreach($string as $key => $val) { $string[$key] = shtmlspecialchars($val); } } else { $string = preg_replace(/&((#(\d{3,5}x[a-fA-F0-9]{4})[a-zA-Z][a-z0-9]{2,5});)/, &\\1, str_replace(array(&, , <, >), array(&, , <, >), $string)); } return $string; }

  checkhtml($html)解析:

  stripslashes():函数删除由addslashes()函数添加的反斜杠。该函数用于清理从数据库或HTML表单中取回的数据。

  更多关于PHP相关内容感兴趣的读者可查看本站专题:《PHP数据结构与算法教程》、《php程序设计算法总结》、《php排序算法总结》、《PHP常用遍历算法与技巧总结》、《PHP数学运算技巧总结》、《PHP数组(Array)操作技巧大全》、《php字符串(string)用法总结》及《php常见数据库操作技巧汇总》

  希望本文所述对大家PHP程序设计有所帮助。


评论


亲,登录后才可以留言!