XML輕松學習手冊(4)XML語法_Xml教程

      編輯Tag賺U幣
      教程Tag:暫無Tag,歡迎添加,賺取U幣!

      推薦:XML to DDL的項目關鍵:與數據庫同步
      對于xml2ddl項目,Freshmeat.org提供了一整套基于GNU或者GPL通用公共許可證下的Python程序。在一個運行的Python環境下,這套工具能夠在許多操作系統上工作,包括Windows, Linux, 以及UNIX平臺上

      通過前面三章的學習,我們已經對什么是XML,它的實現原理以及相關的術語有所了解。接下來我們就開始學習XML的語法規范,動手寫自己的XML文檔。

      一、XML語法規則

      XML的文檔和HTML的原代碼類似,也是用標識來標識內容。創建XML文檔必須遵守下列重要規則:

      規則1:必須有XML聲明語句

      這一點我們在上一章學習時已經提到過。聲明是XML文檔的第一句,其格式如下:

      <?xml version="1.0" standalone="yes/no" encoding="UTF-8"?>

      聲明的作用是告訴瀏覽器或者其它處理程序:這個文檔是XML文檔。聲明語句中的version表示文檔遵守的XML規范的版本;standalone表示文檔是否附帶DTD文件,如果有,參數為no;encoding表示文檔所用的語言編碼,默認是UTF-8。

      規則2:是否有DTD文件

      如果文檔是一個“有效的XML文檔”,那么文檔一定要有相應DTD文件,并且嚴格遵守DTD文件制定的規范。DTD文件的聲明語句緊跟在XML聲明語句后面,格式如下:

      <!DOCTYPE type-of-doc SYSTEM/PUBLIC "dtd-name">

      其中:

      "!DOCTYPE"是指你要定義一個DOCTYPE;

      "type-of-doc"是文檔類型的名稱,由你自己定義,通常于DTD文件名相同;

      "SYSTEM/PUBLIC"這兩個參數只用其一。SYSTEM是指文檔使用的私有DTD文件的網址,而PUBLIC則指文檔調用一個公用的DTD文件的網址。

      "dtd-name" 就是DTD文件的網址和名稱。所有DTD文件的后綴名為".dtd"。

      我們還是用上面的例子,應該寫成這樣:

      <?xml version="1.0" standalone="no" encode="UTF-8"?>

      <!DOCTYPE filelist SYSTEM "filelist.dtd">

      規則3:注意你的大小寫

      在XML文檔中,大小寫是有區別的。<P>和<p>是不同的標識。注意在寫元素時,前后標識大小寫要保持一樣。例如:<Author>ajie</Author>,寫成<Author>ajie</author>是錯誤的。

      你最好養成一種習慣,或者全部大寫,或者全部小寫,或者大寫第一個字母。這樣可以減少因為大小寫不匹配產生的文檔錯誤。

      規則4:給屬性值加引號

      在HTML代碼里面,屬性值可以加引號,也可以不加。例如:<font color=red>word</font>和<font color="red">word</font>都可以被瀏覽器正確解釋。

      但是在XML中則規定,所有屬性值必須加引號(可以是單引號,也可以是雙引號),否則將被視為錯誤。

      規則5:所有的標識必須有相應的結束標識

      在HTML中,標識可能不是成對出現的,比?lt;br>。而在XML中規定,所有標識必須成對出現,有一個開始標識,就必須有一個結束標識。否則將被視為錯誤。

      規則6:所有的空標識也必須被關閉

      空標識就是標識對之間沒有內容的標識。比如<br>,<img>等標識。在XML中,規定所有的標識必須有結束標識,針對這樣的空標識,XML中處理的方法是在原標識最后加/,就可以了。例如:

      以下為引用的內容:
      <br>應寫為<br />;
      <META name="keywords" content="XML, SGML, HTML">應寫為<META name="keywords" content="XML, SGML, HTML" />;
      <IMG src= "cool.gif">應寫為<IMG src= "cool.gif" />

      二、元素的語法

      元素由一對標識以及其中的內容組成。就象這樣:ajie。元素的名稱和標識的名稱是一樣的。標識可以用屬性來進一步描述。

      在XML中,沒有任何保留字,所以你可以隨心所欲的用任何詞語來作為元素名稱。但是也必須遵守下列規范:

      1.名稱中可以包含字母、數字以及其它字母;

      2.名稱不能以數字或"_" (下劃線)開頭;

      3.名稱不能以字母 xml(或 XML 或 Xml ..)開頭

      4.名稱中不能包含空格

      5.名稱中間不能包含":"(冒號)

      為了使元素更容易閱讀理解和操作,我們還有一些建議:

      1.名稱中不要使用"."。因為在很多程序語言中,"."是作為對象的屬性,例如:font.color。同樣的原因"-"也最好不要用,必須使用的,以"_"代替;

      2.名稱盡量簡短。

      3.名稱的大小寫盡量采用同一標準。

      4.名稱可以使用非英文字符,比如用中文。但是有些軟件可能不支持。(IE5目前是支持中文元素的。)

      另外,補充一點關于屬性的說明。在HTML中,屬性可以用來定義元素的顯示格式,比如:<font color="red">word</font>將把word顯示為紅色。而在XML中,屬性只是對標識的描述,與元素內容的顯示無關。例如同樣一句:<font color="red">word</font>,并不會將word顯示為紅色。(那么,有網友會問:如何在XML中將文字顯示為紅色呢?這就需要使用CSS或者XSL,我們在下面詳細講述。)

      三、注釋的語法

      注釋是為了便于閱讀和理解,在XML文檔添加的附加信息,將不會被程序解釋或則瀏覽器顯示。

      注釋的語法如下:

      <!-- 這里是注釋信息 -->

      可以看到,它和HTML中的注釋語法是一樣的,非常容易。養成良好的注釋習慣將使你的文檔更加便于維護,共享,看起來也更專業。

      四、CDATA的語法

      CDATA全稱character data,翻譯為字符數據。我們在寫XML文檔時,有時需要顯示字母,數字和其它的符號本身,比如"<",而在XML中,這些字符已經有特殊的含義,我們怎么辦呢?這就需要用到CDATA語法。語法格式如下:

      <![CDATA[這里放置需要顯示的字符]]>

      例如:

      <![CDATA[<AUTHOR sex="female">ajie</AUTHOR>]]>

      在頁面上顯示的內容將是"<AUTHOR sex="female">ajie</AUTHOR>"

      五、Namespaces的語法

      Namespaces翻譯為名字空間。名字空間有什么作用呢?當我們在一個XML文檔中使用他人的或者多個DTD文件,就會出現這樣的矛盾:因為XML中標識都是自己創建的,在不同的DTD文件中,標識名可能相同但表示的含義不同,這就可能引起數據混亂。

      比如在一個文檔<table>wood table</table>中<table>表示桌子,而在另一個文檔<table>namelist</table>中<table>表示表格。如果我需要同時處理這兩個文檔,就會發生名字沖突。

      了解決這個問題,我們引進了namespaces這個概念。namespaces通過給標識名稱加一個網址(URL)定位的方法來區別這些名稱相同的標識。

      Namespaces同樣需要在XML文檔的開頭部分聲明,聲明的語法如下:

      <document xmlns:yourname='URL'>

      其中yourname是由你定義的namespaces的名稱,URL就是名字空間的網址。

      假設上面的"桌子<table>"文檔來自http://www.zhuozi.com,我們就可以聲明為

      <document xmlns:zhuozi='http://www.zhuozi.com'>

      然后在后面的標識中使用定義好的名字空間:

      <zhuozi:table>wood table</table>

      這樣就將這兩個<table>區分開來。注意的是:設置URL并不是說這個標識真的要到那個網址去讀取,僅僅作為一種區別的標志而已。

      六、entity的語法

      entity翻譯為"實體"。它的作用類似word中的"宏",也可以理解為DW中的摸板,你可以預先定義一個entity,然后在一個文檔中多次調用,或者在多個文檔中調用同一個entity。

      entity可以包含字符,文字等等,使用entity的好處在于:1.它可以減少差錯,文檔中多個相同的部分只需要輸入一遍就可以了。2.它提高維護效率。比如你有40個文檔都包含copyright的entity,如果需要修改這個copyright,不需要所有的文件都修改,只要改最初定義的entity語句就可以了。

      XML定義了兩種類型的entity。一種是我們這里說的普通entity,在XML文檔中使用;另一種是參數entity,在DTD文件中使用。

      entity的定義語法為:

      以下為引用的內容:
      <!DOCTYPE filename [
      <!ENTITY entity-name "entity-content"
      ]
      >

      例如我要定義一段版權信息:

      以下為引用的內容:
      <!DOCTYPE copyright [
      <!ENTITY copyright "Copyright 2001, Ajie. All rights reserved"
      ]
      >

      如果我的版權信息內容和他人共享一個XML文件,也可以使用外部調用的方法,語法象這樣:

      以下為引用的內容:
      <!DOCTYPE copyright [
      <!ENTITY copyright SYSTEM "http://www.sample.com/copyright.xml">
      ]
      >

      定義好的entity在文檔中的引用語法為:&entity-name;

      例如,上面定義的版權信息,調用時寫作?copyright;

      完整的例子如下,你可以copy下來存為copyright.xml觀看實例:

      以下為引用的內容:
      <?xml version="1.0" encoding="GB2312"?>
      <!DOCTYPE copyright [
      <!ENTITY copyright "Copyright 2001, Ajie. All rights reserved">
      ]>
      <myfile>
      <title>XML</title>
      <author>ajie</author>
      <email>ajie@aolhoo.com</email>
      <date>20010115</date>
      ©right;
      </myfile>

      七、DTD的語法

      DTD是"有效XML文檔"的必須文件,我們通過DTD文件來定義文檔中元素和標識的規則及相互關系。如何建立一個DTD文件呢?讓我們一起來學習:

      1.設置元素

      元素是XML文檔的基本組成部分。你要在DTD中定義一個元素,然后在XML文檔中使用。元素的定義語法為:<!ELEMENT DESCRIPTION (#PCDATA, DEFINITION)*>

      說明:

      "<!ELEMENT" 是元素的聲明,說明你要定義的是一個元素;

      聲明后面的"DESCRIPTION",是元素的名稱;

      "(#PCDATA, DEFINITION)*>"則是該元素的使用規則。規則定義了元素可以包含的內容以及相互的關系。下面的表格概要列出了元素的規則:

      2、元素規則表:

      #PCDATA 包含字符或文本數據 <MYFILE(#PCDATA)> 元素MYFILE包含一個文本數據

      #PCDATA, element-name 包含文本和其它子元素 <MYFILE(#PCDTATA,TITLE)> MYFILE元素必須包含文本和TITLE子元素

      , 使用逗號分隔排序 <MYFILE (TITLE,AUTHOR,EMAIL)> MYFILE元素必須依次包含TITILE,AUTHOR,EMAIL三個子元素

      | 使用"|"表示或者 <MYFILE (TITLE | AUTHOR | EMAIL)> MYFILE元素必須包含TITLE,或者AUTHOR或者EMAIL子元素。

      name 只能使用一次 <MYFILE (TITLE)> MYFILE元素必須包含TITLE子元素,而且只能使用一次。

      name? 使用一次或者不使用 <MYFILE (TITLE,AUTHOR?,EMAIL?)> MYFILE元素必須包含TITLE子元素,而且只能使用一次;可以包含或者不包含AUTHOR和EMAIL子元素,但是如果使用,只能一次。

      name 使用至少一次或多次 <MYFILE (TITLE ,AUTHOR?,EMAIL)> MYFILE元素必須包含TITLE子元素,而且使用至少一次;接下來可以跟隨AUTHOR子元素,也可以不跟;最后必須包含EMAIL子元素,而且只能使用一次。

      name* 使用一次,多次,或者根本不使用 <MYFILE (TITLE*)> MYFILE元素可以包含一個,多個或者不包含TITLE子元素

      ( ) 設置組,可以嵌套 <MYFILE(#PCDATA | TITLE)*> 元素MYFILE包含一個或者更多的文本或者TITLE子元素。

      <MYFILE((TITLE*, AUTHOR?, EMAIL)* | COMMENT)> MYFILE元素必須包含一些內容,內容或者是一個注釋;也或者是多個組,組里包含:一個,多個或者沒有TITLE子元素,接著是一個或者沒有AUTHOR子元素,再接著是一個必須的EMAIL子元素。

      另外,我們還可以為元素定義屬性,因為我們不推薦使用屬性,在這里就不詳細展開了。

      最后,我們來總結一些前四章學習的內容,寫一個包含DTD,XML,以及Script的簡單實例,便于讀者理解:

      1.將下面文件存為myfile.dtd

      以下為引用的內容:
      <!ELEMENT myfile (title, author)>
      <!ELEMENT title (#PCDATA)>
      <!ELEMENT author (#PCDATA)>

      2.然后建立XML文檔myfile.xml

      以下為引用的內容:
      <?xml version="1.0" encoding="GB2312"?>
      <!DOCTYPE myfile SYSTEM "myfile.dtd">
      <myfile>
      <title>XML輕松學習手冊</title>
      <author>ajie</author>
      </myfile>

      3.建立HTML文檔myfile.html

      以下為引用的內容:
      <html>
      <head>
      <script language="JavaScript" for="window" event="onload">
      var xmlDoc = new ActiveXObject("Microsoft.XMLDOM");
      xmlDoc.async="false";
      xmlDoc.load("myfile.xml");
      nodes = xmlDoc.documentElement.childNodes;
      title.innerText = nodes.item(0).text;
      author.innerText = nodes.item(1).text;
      </script>
      <title>在HTML中調用XML數據</title>
      </head>
      <body bgcolor="#FFFFFF">
      <b>標題: </b>
      <span id="title"></span><br>
      <b>作者: </b>
      <span id="author"></span><br>
      </body>
      </html>

      4.用IE5.0以上瀏覽器打開myfile.html就可以看到效果了。

      分享:基于XML的購物車的實現
      購物車是電子商務網站中不可缺少的組成部分,但目前大多數購物車只能作為一個顧客選中商品的展示,客戶端無法將購物車里的內容提取出來滿足自己事務處理的需要,而這一點在有些電子商務活動中很

      來源:模板無憂//所屬分類:Xml教程/更新時間:2008-08-22
      相關Xml教程