XML教程一:XML是什么? (轉自IBM)_動易Cms教程
簡介
XML,或稱為可擴展標記語言(Extensible Markup Language),是一種您可以用來創建自己的標記的標記語言。它由萬維網協會(W3C)創建,用來克服 HTML(即超文本標記語言(Hypertext Markup Language),它是所有網頁的基礎)的局限。和 HTML 一樣,XML 基于 SGML ― 標準通用標記語言(Standard Generalized Markup Language)。盡管 SGML 已在出版業使用了數十年,但其理解方面的復雜性使許多本打算使用它的人望而卻步(SGML 也代表“聽起來很棒,但或許以后會用(Sounds great, maybe later)”)。XML 是為 Web 設計的。
我們為什么需要 XML?
HTML 始終是最成功的標記語言。您幾乎可以在任何設備(從掌上電腦到大型機)上查看最簡單的 HTML 標記,并且您甚至可以用合適的工具將 HTML 標記轉換成語音和其它格式。既然 HTML 成功了,為什么 W3C 還要創建 XML 呢?為了回答這個問題,請查看下面這個文檔:
<p><b>Mrs. Mary McGoon</b>
<br>
1401 Main Street
<br>
Anytown, NC 34829</p>
HTML 的問題在于它是為人設計的。即使不用瀏覽器查看上面的 HTML 文檔,您和我也會知道那是某個人的郵政地址。(具體而言,它是美國某個人的郵政地址;即使您一點也不熟悉美國郵政地址的格式,您可能也會猜出這表示什么。)作為人,您和我具有理解大多數文檔的含義和意圖的聰明。遺憾的是機器不能做到。盡管這個文檔中的標記告訴瀏覽器如何顯示該信息,但標記沒有告訴瀏覽器信息是什么。您和我知道它是一個地址,但機器不知道。
顯示 HTML
要顯示 HTML,瀏覽器只需遵循 HTML 文檔中的指令即可。段標記告訴瀏覽器在新的一行顯示,并且通常在前面有一個空行,而兩個換行標記則告訴瀏覽器前進到下一行,并且行之間沒有空行。盡管瀏覽器出色地將文檔格式化,但機器仍不知道這是地址。
處理 HTML
為了完成對樣本 HTML 文檔的討論,請考慮從該地址抽取郵政編碼的任務。下面是一個在 HTML 標記中查找郵政編碼的算法(我有意使用脆弱的算法),假如您找到有兩個 <br> 標記的段落,那么郵政編碼就是第二個換行標記下面第一個逗號之后的第二個詞。
盡管該算法對于這個示例起作用,但對于全世界許多完全有效的地址,該算法根本不起作用。即使您可以編寫算法來找出任何用 HTML 編寫的地址的郵政編碼,但許多具有兩個換行標記的段落根本不包含地址。即便有可能編寫算法來查看任意 HTML 段落并找出其中的任意郵政編碼,也是極其困難的。
樣本 XML 文檔
現在讓我們來看一個樣本 XML 文檔。使用 XML,您可以給文檔中的標記賦予某種含意。更重要的是,機器也輕易處理這樣的信息。您只需通過找到 <postal-code> 和 </postal-code> 標記之間的內容(技術上稱為 <postal-code> 元素),就可以從該文檔抽取郵政編碼。
<address>
<name>
<title>Mrs.</title>
<first-name>
Mary
</first-name>
<last-name>
McGoon
</last-name>
</name>
<street>
1401 Main Street
</street>
<city>Anytown</city>
<state>NC</state>
<postal-code>
34829
</postal-code>
- MAC錯誤的解決方法
- 如何屏蔽動易后臺導航里的某個功能菜單?
- 動易.NET版本留言自動選定欄目方法
- 動易SiteFactoty整合Discuz!NT3.0
- 在任意位置獲取根節點ID標簽
- 如何開啟SiteWeaver6.8的支持,反對功能
- Windows 2008安裝動易.NET系統之四----動易系統安裝篇
- Windows 2008安裝動易.NET系統之三----數據庫篇
- Windows 2008安裝動易.NET系統之二----IIS、目錄環境配置篇
- 數據庫修復,SQL Server 2005內部操作不一致的處理
- 如何安裝動易.net程序權限配置
- 為什么提示對Windows系統文件夾下的Temp目錄沒有訪問權限?
- 相關鏈接:
- 教程說明:
動易Cms教程-XML教程一:XML是什么? (轉自IBM)。