淺析php插件 HTMLPurifier HTML解析器_PHP教程
推薦:解析php根據(jù)ip查詢所在地區(qū)dat文件,關(guān)于ip對(duì)應(yīng)地區(qū)的信息文件 qqwry.dat文件 網(wǎng)上自己下載 class類文件,解析qqwry.data文件的 IpLocation.php文件 復(fù)制代碼 代碼如下: ?php class IpLocation { /** * @var resource 指針 */ private $fp; /** * 第一條IP記錄的偏移地址 * @var int */ private
本篇文章是對(duì)php插件 HTMLPurifier HTML解析器進(jìn)行了詳細(xì)的分析介紹,需要的朋友參考下HTMLPurifier插件的使用
下載HTMLPurifier插件
HTMLPurifier插件有用的部分是 library
使用HTMLPurifier library類庫(kù)
第一種方式
<?php
require_once 'HTMLPurifier.auto.php';
$config = HTMLPurifier_Config::createDefault();
?>
或者
<?php
require_once 'HTMLPurifier.includes.php';
require_once 'HTMLPurifier.autoload.php';
$config = HTMLPurifier_Config::createDefault();
?>
官網(wǎng)給出的例子是
require_once 'HTMLPurifier.auto.php';
我同事常用的是
require_once 'HTMLPurifier.includes.php';
require_once 'HTMLPurifier.autoload.php';
設(shè)置$config
configdoc
http://htmlpurifier.org/live/configdoc/plain.html
例子
$config->set('HTML.AllowedElements', array('div'=>true, 'table'=>true, 'tr'=>true, 'td'=>true, 'br'=>true));
$config->set('HTML.Doctype', 'XHTML 1.0 Transitional') //html文檔類型(常設(shè))
$config->set('Core.Encoding', 'UTF-8') //字符編碼(常設(shè))
HTML允許的元素
div元素,table元素,tr元素,td元素,br元素
new HTMLPurifier對(duì)象
$purifier = new HTMLPurifier($config);
調(diào)用HTMLPurifier對(duì)象的purify方法
$puri_html = $purifier->purify($html);
第二種方式
自定義一個(gè)類 HtmlPurifier.php
<?php
require_once 'HTMLPurifier.includes.php';
require_once 'HTMLPurifier.autoload.php';
class Resume_HtmlPurifier implements Zend_Filter_Interface{
protected $_htmlPurifier = null;
public function __construct($options = null)
{
$config = HTMLPurifier_Config::createDefault();
$config->set('Code.Encoding', 'UTF-8');
$config->set('HTML.Doctype', 'XHTML 1.0 Transitional')
if(!is_null($options)){
foreach($options as $option){
$config->set($option[0], $option[1], $option[2]);
}
}
$this->_htmlPurifier = new HTMLPurifier($config);
}
public function filter($value)
{
return $this->_htmlPurifier->purify($value);
}
}
?>
設(shè)置config信息
例如:
$conf = array(
array('HTML.AllowedElements',
array(
'div' => true,
'table' => true,
'tr' => true,
'td' => true,
'br' => true,
),
false), //允許屬性 div table tr td br元素
array('HTML.AllowedAttributes', array('class' => TRUE), false), //允許屬性 class
array('Attr.ForbiddenClasses', array('resume_p' => TRUE), false), //禁止classes如
array('AutoFormat.RemoveEmpty', true, false), //去空格
array('AutoFormat.RemoveEmpty.RemoveNbsp', true, false), //去nbsp
array('URI.Disable', true, false),
);
調(diào)用
$p = new Resume_HtmlPurifier($conf);
$puri_html = $p->filter($html);
分享:淺析php插件 Simple HTML DOM 用DOM方式處理HTML本篇文章是對(duì)php插件Simple HTML DOM 用DOM方式處理HTML進(jìn)行了詳細(xì)的分析介紹,需要的朋友參考下 simple_html_dom插件 用dom處理html文件的利器 使用: 加載simple_html_dom.php文件 復(fù)制代碼 代碼如下: require_once 'simple_html_dom.php' new simple_html_dom對(duì)象 復(fù)
- PHPNOW安裝Memcached擴(kuò)展方法詳解
- php記錄頁(yè)面代碼執(zhí)行時(shí)間
- PHP中獎(jiǎng)概率的抽獎(jiǎng)算法程序代碼
- apache設(shè)置靜態(tài)文件緩存方法介紹
- php對(duì)圖像的各種處理函數(shù)代碼小結(jié)
- PHP 關(guān)于訪問(wèn)控制的和運(yùn)算符優(yōu)先級(jí)介紹
- 關(guān)于PHP語(yǔ)言構(gòu)造器介紹
- php/js獲取客戶端mac地址的實(shí)現(xiàn)代碼
- php5.5新數(shù)組函數(shù)array_column使用
- PHP preg_match的匹配多國(guó)語(yǔ)言的技巧
- php 中序列化和json使用介紹
- php采集文章中的圖片獲取替換到本地
- 相關(guān)鏈接:
- 教程說(shuō)明:
PHP教程-淺析php插件 HTMLPurifier HTML解析器。