XML教程一:XML是什么? (轉自IBM)_動易Cms教程

      編輯Tag賺U幣
      教程Tag:暫無Tag,歡迎添加,賺取U幣!


      簡介

        XML,或稱為可擴展標記語言(Extensible Markup Language),是一種您可以用來創建自己的標記的標記語言。它由萬維網協會(W3C)創建,用來克服 HTML(即超文本標記語言(Hypertext Markup Language),它是所有網頁的基礎)的局限。和 HTML 一樣,XML 基于 SGML ― 標準通用標記語言(Standard Generalized Markup Language)。盡管 SGML 已在出版業使用了數十年,但其理解方面的復雜性使許多本打算使用它的人望而卻步(SGML 也代表“聽起來很棒,但或許以后會用(Sounds great, maybe later)”)。XML 是為 Web 設計的。

      我們為什么需要 XML?

        HTML 始終是最成功的標記語言。您幾乎可以在任何設備(從掌上電腦到大型機)上查看最簡單的 HTML 標記,并且您甚至可以用合適的工具將 HTML 標記轉換成語音和其它格式。既然 HTML 成功了,為什么 W3C 還要創建 XML 呢?為了回答這個問題,請查看下面這個文檔:


      <p><b>Mrs. Mary McGoon</b>
      <br>
      1401 Main Street
      <br>
      Anytown, NC 34829</p>

        HTML 的問題在于它是為人設計的。即使不用瀏覽器查看上面的 HTML 文檔,您和我也會知道那是某個人的郵政地址。(具體而言,它是美國某個人的郵政地址;即使您一點也不熟悉美國郵政地址的格式,您可能也會猜出這表示什么。)作為人,您和我具有理解大多數文檔的含義和意圖的聰明。遺憾的是機器不能做到。盡管這個文檔中的標記告訴瀏覽器如何顯示該信息,但標記沒有告訴瀏覽器信息是什么。您和我知道它是一個地址,但機器不知道。

      顯示 HTML

        要顯示 HTML,瀏覽器只需遵循 HTML 文檔中的指令即可。段標記告訴瀏覽器在新的一行顯示,并且通常在前面有一個空行,而兩個換行標記則告訴瀏覽器前進到下一行,并且行之間沒有空行。盡管瀏覽器出色地將文檔格式化,但機器仍不知道這是地址。
      處理 HTML

        為了完成對樣本 HTML 文檔的討論,請考慮從該地址抽取郵政編碼的任務。下面是一個在 HTML 標記中查找郵政編碼的算法(我有意使用脆弱的算法),假如您找到有兩個 <br> 標記的段落,那么郵政編碼就是第二個換行標記下面第一個逗號之后的第二個詞。

        盡管該算法對于這個示例起作用,但對于全世界許多完全有效的地址,該算法根本不起作用。即使您可以編寫算法來找出任何用 HTML 編寫的地址的郵政編碼,但許多具有兩個換行標記的段落根本不包含地址。即便有可能編寫算法來查看任意 HTML 段落并找出其中的任意郵政編碼,也是極其困難的。

      樣本 XML 文檔

        現在讓我們來看一個樣本 XML 文檔。使用 XML,您可以給文檔中的標記賦予某種含意。更重要的是,機器也輕易處理這樣的信息。您只需通過找到 <postal-code> 和 </postal-code> 標記之間的內容(技術上稱為 <postal-code> 元素),就可以從該文檔抽取郵政編碼。
      <address>
      <name>
      <title>Mrs.</title>
      <first-name>
      Mary
      </first-name>
      <last-name>
      McGoon
      </last-name>
      </name>
      <street>
      1401 Main Street
      </street>
      <city>Anytown</city>
      <state>NC</state>
      <postal-code>
      34829
      </postal-code>

      查看更多 動易Cms教程  動易Cms模板

      共2頁上一頁12下一頁
      來源:模板無憂//所屬分類:動易Cms教程/更新時間:2005-05-18
      相關動易Cms教程