淺析php插件 HTMLPurifier HTML解析器_PHP教程

      編輯Tag賺U幣
      教程Tag:暫無(wú)Tag,歡迎添加,賺取U幣!

      推薦:解析php根據(jù)ip查詢所在地區(qū)
      dat文件,關(guān)于ip對(duì)應(yīng)地區(qū)的信息文件 qqwry.dat文件 網(wǎng)上自己下載 class類文件,解析qqwry.data文件的 IpLocation.php文件 復(fù)制代碼 代碼如下: ?php class IpLocation { /** * @var resource 指針 */ private $fp; /** * 第一條IP記錄的偏移地址 * @var int */ private

      本篇文章是對(duì)php插件 HTMLPurifier HTML解析器進(jìn)行了詳細(xì)的分析介紹,需要的朋友參考下  

      HTMLPurifier插件的使用
      下載HTMLPurifier插件
      HTMLPurifier插件有用的部分是 library


      使用HTMLPurifier library類庫(kù)
      第一種方式

      復(fù)制代碼 代碼如下:
      <?php
      require_once 'HTMLPurifier.auto.php';
      $config = HTMLPurifier_Config::createDefault();
      ?>


      或者

      復(fù)制代碼 代碼如下:
      <?php
      require_once 'HTMLPurifier.includes.php';
      require_once 'HTMLPurifier.autoload.php';
      $config = HTMLPurifier_Config::createDefault();
      ?>


      官網(wǎng)給出的例子是

      復(fù)制代碼 代碼如下:
      require_once 'HTMLPurifier.auto.php';


      我同事常用的是

      復(fù)制代碼 代碼如下:
      require_once 'HTMLPurifier.includes.php';
      require_once 'HTMLPurifier.autoload.php';


      設(shè)置$config
      configdoc
      http://htmlpurifier.org/live/configdoc/plain.html
      例子

      復(fù)制代碼 代碼如下:
      $config->set('HTML.AllowedElements', array('div'=>true, 'table'=>true, 'tr'=>true, 'td'=>true, 'br'=>true));
      $config->set('HTML.Doctype', 'XHTML 1.0 Transitional') //html文檔類型(常設(shè))
      $config->set('Core.Encoding', 'UTF-8') //字符編碼(常設(shè))


      HTML允許的元素
      div元素,table元素,tr元素,td元素,br元素
      new HTMLPurifier對(duì)象

      復(fù)制代碼 代碼如下:
      $purifier = new HTMLPurifier($config);


      調(diào)用HTMLPurifier對(duì)象的purify方法

      復(fù)制代碼 代碼如下:
      $puri_html = $purifier->purify($html);


      第二種方式
      自定義一個(gè)類 HtmlPurifier.php

      復(fù)制代碼 代碼如下:
      <?php
      require_once 'HTMLPurifier.includes.php';
      require_once 'HTMLPurifier.autoload.php';
      class Resume_HtmlPurifier implements Zend_Filter_Interface{
      protected $_htmlPurifier = null;
      public function __construct($options = null)
      {
      $config = HTMLPurifier_Config::createDefault();
      $config->set('Code.Encoding', 'UTF-8');
      $config->set('HTML.Doctype', 'XHTML 1.0 Transitional')
      if(!is_null($options)){
      foreach($options as $option){
      $config->set($option[0], $option[1], $option[2]);
      }
      }
      $this->_htmlPurifier = new HTMLPurifier($config);
      }
      public function filter($value)
      {
      return $this->_htmlPurifier->purify($value);

      }
      }
      ?>


      設(shè)置config信息
      例如:

      復(fù)制代碼 代碼如下:
      $conf = array(
      array('HTML.AllowedElements',
      array(
      'div' => true,
      'table' => true,
      'tr' => true,
      'td' => true,
      'br' => true,
      ),
      false), //允許屬性 div table tr td br元素
      array('HTML.AllowedAttributes', array('class' => TRUE), false), //允許屬性 class
      array('Attr.ForbiddenClasses', array('resume_p' => TRUE), false), //禁止classes如
      array('AutoFormat.RemoveEmpty', true, false), //去空格
      array('AutoFormat.RemoveEmpty.RemoveNbsp', true, false), //去nbsp
      array('URI.Disable', true, false),
      );


      調(diào)用

      復(fù)制代碼 代碼如下:


      $p = new Resume_HtmlPurifier($conf);
      $puri_html = $p->filter($html);

      分享:淺析php插件 Simple HTML DOM 用DOM方式處理HTML
      本篇文章是對(duì)php插件Simple HTML DOM 用DOM方式處理HTML進(jìn)行了詳細(xì)的分析介紹,需要的朋友參考下 simple_html_dom插件 用dom處理html文件的利器 使用: 加載simple_html_dom.php文件 復(fù)制代碼 代碼如下: require_once 'simple_html_dom.php' new simple_html_dom對(duì)象 復(fù)

      來(lái)源:模板無(wú)憂//所屬分類:PHP教程/更新時(shí)間:2013-07-02
      相關(guān)PHP教程