解讀Asp.Net 建立的在線 RSS 新聞聚合器_.Net教程
推薦:淺談ASP.NET兩個截取字符串的實用方法技巧兩個截取字符串的實用方法(超過一定長度自動換行) 1/**//// 2 /// 截取字符串,不限制字符串長度 3 /// 4 /// 待截取的字符串 5 /// 每行的長度,多于這個長度自動換行 6 /// 7 public string CutStr(string str,int len) 8 { string s=
我們面臨的下一個任務是創建 DisplayNewsItems.aspx 頁面。這個頁面會以鏈接的形式顯示所選聚合摘要的新聞項標題,當點擊標題時,新聞的內容就會顯示在右下部分的框架中。要完成這一任務,我們會面臨以下兩個主要的挑戰:
·通過指定的 URL 訪問 RSS 聚合摘要;
·將接收到的 XML 數據轉換為相應的 HTML;
幸運的是,在.NET 框架中,要實現這兩個任務都不是很難。對于第一個任務,只需要兩行代碼,我們就可以將遠程的xml數據裝載到一個XmlDocument對象中。而第二個任務呢, 借助 ASP.NET XML Web 控件在ASP.NET 頁面中顯示XML數據也比較容易。
XML Web 控件被設計用于在 Web 頁面中顯示原始或者轉換過的 XML 數據。使用 XML Web 控件的第一步是定義XML數據源,通過 定義一系列的屬性,用許多方法都可以完成這一工作。使用 Document屬性,你可以指定一個 XmlDocument 實例作為 XML Web 控件的 XML 數據源。如果XML數據存在于 Web 服務器文件系統的一個文件中,可以用 DocumentSource 屬性,只要提供該 XML 文件的相對或者絕對路徑就可以了。最后,如果你 的 XML數據是一個字符串,那么你可以將這個字符串的內容賦給控件的 DocumentContent 屬性。這三種辦法都可以將 XML 數據與 XML 控件聯系起來。
通常,在將 XML 數據顯示到 Web 頁面之前,我們會以某種方式轉換 XML 數據。XML Web 控件允許我們指定一個 XSLT 樣式表來做這個轉換工作。與 XML 數據相似,XSLT 樣式表可以通過 兩個屬性之一,以兩種不同的方式中的一種來設置,一是 Transform 屬性可被賦值給 XslTransform 實例,二是將本地 Web 服務器上 XSLT文件的 相對或絕對路徑賦予 TransformSource 屬性。
現在我們來創建 DisplayNewsItems.aspx 頁面。在添加 XML Web 控件以及編寫后臺代碼類之前,我們需要在 HTML 部分加入一小段客戶端 JavaScript 代碼。準確地說,是在 html 部分的 <head> 標簽里面 添加如下的<script>代碼塊:
<script language="javascript">
// display a blank page in the bottom frame when the news items loads
parent.rbottom.location.href = "about:blank";
</script>
每當 DisplayNewsItems.aspx 頁面裝載的時候,這段客戶端 JavaScript 代碼會在右下角的框架中顯示一個空白頁。為了理解為什么要加入這段代碼,我們來看看省略這段代碼,我們會碰到什么情況:
·用戶在左邊的框架中點擊聚合摘要,瀏覽器會在右上部的框架中裝載摘要新聞項;
·用戶在右上部框架中點擊某個新聞項,瀏覽器會在右下部框架中裝載這個新聞項 的詳細內容;
現在用戶在左邊的框架中點擊其它的聚合摘要,瀏覽器會在右上部分的框架中裝載新的摘要新聞項;
前一個新聞項的詳細內容還顯示在右下部的框架中!通過上面的客戶端 Javascript 代碼,每次點擊左面框架的摘要便可以清除右下部框架 的內容,以消除這一瑕疵。
在我們處理了客戶端代碼的問題之后,讓我們把注意力轉到添加 XML Web 控件。一旦加入 XML Web 控件,將其 ID 屬性設置為 xsltNewsItems,TransformSourc 屬性設置為 NewsItems.xslt(我們將要創建的 XSLT 樣式表文件的名稱)。現在,在 Page_Load 事件處理函數中,我們需要 在某個 XmlDocument 實例中獲取遠程 RSS 聚合文件,然后將該 XML Web 控件的 Document 屬性賦給該 XmlDocument 實例。
在 Page_Load 事件處理函數中,與我們要實現的任務有密切關系的代碼是最后三行代碼。這三行代碼創建一個新的 XmlDocument 對象, 加載遠程 RSS 摘要內容,然后將這個 XmlDocument 對象賦給 XML Web 控件的 Document 屬性。訪問遠程 XML 數據并 將它們顯示在 ASP.NET 頁面中就是這么簡單,難道給你留下的印象不深嗎?
剩下我們要做的一件事就是創建 XSLT 樣式表,NewsItems.aspx。下面是樣式表的第一版的草稿:
<?xml version="1.0" encoding="UTF-8" ?>
<xsl:stylesheet version="1.0"
xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
<xsl:output method="html" omit-xml-declaration="yes" />
<xsl:template match="/rss/channel">
<b><xsl:value-of select="title"
disable-output-escaping="yes" /></b>
<xsl:for-each select="item">
<li>
<a>
<xsl:attribute name="href">
DisplayItem.aspx?ID=<xsl:number value="position()" />
</xsl:attribute>
<xsl:attribute name="target">rbottom</xsl:attribute>
<xsl:value-of select="title"
disable-output-escaping="yes" />
</a>
(<xsl:value-of select="pubDate" />)
</li>
</xsl:for-each>
</xsl:template>
</xsl:stylesheet>
這個XSLT樣式表只有一個模版,用于匹配“/rss/channel”XPath表達式。這個模版先是以粗體顯示<title>元素的內容。然后,循環獲取每一個<item>元素,對于每一個元素,顯示一個到 DisplayItem.aspx 頁面的超鏈接,在查詢字符串中傳遞<item>元素的位置屬性。要留意超鏈接的 target 屬性設置為 rbottom,右下部框架的名稱。最后,顯示每一個新聞項的標題和<pubDate>元素。
該 XSLT 樣式表中有兩個項目,并不是每個人都熟悉。首先是 <xsl:value-of> 元素中的 disable-output-escaping="yes" 屬性。從本質上講,這個屬性的設置通知 XSLT 引擎不要轉義那些非法的 XML 字符,比如:&, < , >, " 和 ’’。為了理解這個設置的意義,就要知道,如果不設置該屬性(也就是設置為默認值"no"),那么如果標題包含一個轉義的&字符&,那么輸出的 html 文件中也會有一個&,而不單單是一個字符&。如果你再仔細想一想,你會發現這種情況會導致很多問題。例如,假設一個聚合文件的標題是“Matt’’s Cool Blog”,如果輸出轉義沒有被禁止,那么輸出就會保留 “Matt’’s Cool Blog”,在 Web 頁面就會顯示為 "Matt’’s <i>Cool</i> Blog"。當用 disable-output-escaping="yes"設置禁止輸出轉義時,輸出就不會被轉義,上面的內容就會被當作“Matt’’s <i>Cool</i> Blog”,顯示在頁面上就是我們想要的“Matt’’s Cool Blog”。
另一個要注意的是元素<a>。這個奇怪的語法會生成下面的輸出內容:
<a href="DisplayItem.aspx?ID=position">news item title</a>
之所以要使用這種語法,是因為要給 XSLT 樣式表中某個你要創建的元素添加一個屬性,然后在該元素的標簽里使用 <xsl:attribute> 語法 。有關該語法的一些例子可在 W3Schools 網站上找到:The <xsl:attribute> Element。
最后要注意的是,超鏈接的ID查詢字符串的值是來自于 <xsl:number> 元素,從 position() 函數中返回的值。<xsl:number> 元素僅僅是輸出一個數值。position()函數是一個 XPath 函數,用來返回 XML 文檔中當前節點的順序位置。這意味著對于第一個新聞項,position() 函數返回 1,第二個 新聞項,position函數返回 2,以此類推。我們需要記錄這個值并將它通過查詢字符串傳遞出去。這樣當 DisplayItem.asp 頁面被訪問時,就可以知道顯示 RSS 聚合摘要的什么項目了。
聰明的讀者可能已經注意到,我們的 XSLT 樣式表沒有全部完成,因為 FeedID 參數沒有通過查詢字符串傳遞到 DisplayItem.aspx 頁面。要明白 這是為什么,我們回顧一下在 ID 查詢串參數中所傳遞的是用戶擬察看詳細信息的<item>元素順序號。也就是說,如果用戶點擊第四條新聞項,頁面 DisplayItem.aspx?ID=4 就會被 加載到右下部分的框架中。問題在于 DisplayItem.aspx 頁面無法確定用戶希望查看哪一個摘要。有兩個不同的方法可以解決這個問題,比如可以在右下部框架中用客戶端 Javascript 代碼讀取右上部框架的 URL,然后確定FeedID 的值。在我看來,更簡單的辦法是和 ID 參數一起將 FeedID 的值通過查詢字符串傳遞 。
這樣的話,有一個難題是 XSLT 樣式表操縱的 RSS XML 數據中并沒有 FeedID 值。但是 DisplayNewsItems.aspx 頁面知道 FeedID 值,需要一種方法讓 XSLT 樣式表也知道這個值。通過使用 XSLT參數可以 實現完成。
XSLT 參數的使用是非常簡單。在 XSLT 樣式表中,你需要在 <xsl:template> 元素中加入一個<xsl:param> 元素, 該元素提供參數的名稱。下面的代碼將這個參數命名為 FeedID:
<xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
<xsl:template match="/rss/channel">
<xsl:param name="FeedID" />
...
</xsl:template>
</xsl:stylesheet>
現在,就可以用下面的語法在<xsl:value-of>元素中使用這個參數了:
<xsl:value-of select="$parameterName" />
最后,在我們的 XSLT 樣式表中加入下面的代碼,我們就可以把 FeedID 查詢字符串參數加到超鏈接中了:
<a>
<xsl:attribute name="href">DisplayItem.aspx?ID=<xsl:number value="position()" />&FeedID=<xsl:value-of select="$FeedID"
/></xsl:attribute>
注意在ID查詢字符串參數后面我們加了一個&字符(轉義&),這樣我們就可以傳遞 FeedID 參數的值到查詢字符串的 FeedID 參數中了。 這就是我們要在 XSLT 樣式表中添加的內容。
剩下的工作是在 DisplayNewsItems.aspx 頁面的 Page_Load 事件處理函數中設置這個參數的值。通過使用 XsltArgumentList 類可以完成這一工作。這個類有一個 AddParameter() 方法。一旦我們創建了這個類的一個實例,加入了相應的參數,就可以將這個 實例賦給 XML Web 控件的 TransformArgumentList 參數了。下面的代碼顯示了更新后的 DisplayNewsItems.aspx 頁面 Page_Load 事件處理函數:
顯示特定新聞項的詳細內容
還剩下最后一件需要做的事情是顯示用戶選擇的特定新聞項的詳細內容。這些詳細內容將顯示在右下部的框架中,而且將會顯示新聞項的標題,描述和新聞項的鏈接等信息。和 DisplayNewsItem.aspx 頁面 類似,DisplayItem.aspx 頁面首先將根據傳入的 FeedID 查詢字符串參數獲取遠程的 RSS 聚合摘要,然后它會用 XML Web 控件顯示這些詳細內容。實際上,DisplayItem.aspx 頁面的 Page_Load 事件處理函數和DisplayNewsItem.aspx 頁面的 該函數幾乎一樣,只有以下兩個小小的區別:
·DisplayItem.aspx 頁面需要讀取ID查詢字符串參數的值;
·DisplayItem.aspx 頁面使用一個 XSLT 參數,但是這個參數與 DisplayNewsItem.aspx 頁面用的參數是不一樣的;
DisplayNewsItem.aspx 和 DisplayItem.aspx 頁面一樣都需要在參數中傳遞一個 XSLT 樣式表。DisplayNewsItem.aspx 頁面傳遞的是 參數 FeedID,而 DisplayItem.aspx 還需要傳入 ID 參數,它表示 XSLT 樣式表應該顯示那個新聞項。這個細小的差別在以下代碼中以粗體顯示,以下 代碼省略了與 DisplayNewsItems.aspx 頁面相同的部分:
以下是轉換 XML 數據的 XSLT 樣式表:
<?xml version="1.0" encoding="UTF-8" ?>
<xsl:stylesheet version="1.0"
xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
<xsl:output method="html" omit-xml-declaration="yes" />
<xsl:param name="ID" />
<xsl:template match="/rss/channel">
<b><xsl:value-of select="item[$ID]/title"
disable-output-escaping="yes" /></b>
<p>
<xsl:value-of select="item[$ID]/description"
disable-output-escaping="yes" />
</p>
<a>
<xsl:attribute name="href"><xsl:value-of
select="item[$ID]/link" /></xsl:attribute>
<xsl:attribute name="target">_blank</xsl:attribute>
Read More...
</a>
</xsl:template>
</xsl:stylesheet>
注意 <xsl:param> 元素被用于聲明 ID XSLT 參數。然后,在幾個不同的 <xsl:value-of> 元素中,ID 參數 被用來從 <item> 元素列表中抓取特定的 <item> 元素。在 XPath 的語法中,elementName[i]意思是根據相應元素名 存取第i個元素。例如,item[1]將只獲取第一個<item>元素,item[2]則獲取第二個元素。所以 item[$ID]是獲取由 XSLT 參數 ID 定義的 特定 <item> 元素。
最后,值得注意的還有在樣式表靠近末尾部分的超鏈接 Read More…,它的target屬性設為空,這樣的話當用戶點擊 Read More… 鏈接的時候,瀏覽器會打開一個新的窗口。
未來的擴展和當前程序的缺點
本文講述的代碼中有一個明顯的缺點就是每次用戶點擊左邊框架的某個聚合摘要或者在右上部框架點擊某個新聞項時,遠程聚合摘要都會被裝載和解析。每次用戶點擊遠程聚合 摘要時,所有的項都被加載,這樣的效率無疑是很差的。每次用戶點擊一個新聞項標題就重新裝載整個遠程聚合摘要也是很浪費資源的。這樣的方法不僅沒有效率,對提供發布服務的個人或者公司也是不禮貌的,因為這些 連續的、不沒必要的請求占用了他們的 Web 服務器的負載資源。
這個缺點在本文附帶的源代碼中已經得到解決。具體來說,.NET數據緩存可以用來存放不同摘要的 XmlDocument 對象。緩存間隔設置為數據表 Feeds 中 UpdateInterval 字段定義的值。(當然,由于某些原因,摘要的 XmlDocument 對象有可能會被提前清除出緩存)
這個系統的另外一個缺點是在右上部框架和右下部框架之間沒有狀態的保存。為了說明這樣會引起什么問題,考慮以下的動作:
·用戶點擊左邊框架的某個聚合摘要鏈接,在右上部框架中裝載這個摘要的新聞項目。假設這個摘要的UpdateInterval 的值是30,則表示這些內容在30分鐘之 后會過期;
·裝載右上部框架的新聞項的同時,這些內容被緩存起來;
·用戶離開去吃午飯;
·發布聚合內容的網站增加了一條新的新聞項;
·我們的用戶一個小時午飯后回來了,這個 摘要的 XmlDocument 的緩存已經過期;
·用戶點擊右上部框架的第一條新聞項,將會在右下部分框架中裝載 DisplayItem.aspx,傳入 ID 參數值1;
·DisplayItem.aspx 頁面在緩存中沒找到 XmlDocument 對象,只好重新獲取遠程摘要。這樣就會獲得新的數據了(別忘了,步驟 4 已經加了一個新的新聞項),然后此頁面會顯示第一條新聞項目(因為ID參數的值為1) ;
·用戶看到了新的新聞項,但是內容會令他感到有點困惑,因為已經不是他所點擊的那一條新聞了,而且右上部也沒有顯示那條新的新聞。
之所以出現這樣的問題,是因為 ID 參數沒有唯一地標識一個新聞項,它只是一個特定時間點上新聞項列表中的一個偏移量。解決這個問題的一個好的方法是不要用數據緩存來保存聚合 摘要,而是使用數據庫或者持久介質的其它方式(比如 Web 服務器本地文件系統的 XML 文件)。如果使用數據庫,每一個新聞項都可以擁有一個唯一的標識號,可以用來傳遞到右下角的框架中。這種方法可以保證解決上面提到的問題。當然也會增加系統的復雜性,比如需要決定何時從數據庫中清除掉舊的新聞項 。
本文現有的應用程序還缺少異常處理,而這肯定是應該加上的。尤其是當從遠程 RSS 聚合摘要文件獲取數據并加載到 XmlDocument 對象時,應該加上異常處理。因為遠程的文件可能不存在或者格式不正確。
還有很多增強功能可以輕松地加入到這個在線新聞聚合器。一個明顯的功能是需要一個管理頁面來允許用戶添加,刪除和編輯他們現在的聚合摘要。還有,如果能允許用戶自定義分類 ,將他們的聚合摘要按類別放在一起就更好了。另外,現在的用戶界面還是比較粗糙的,但是通過增加一些 XSLT 樣式表生成的 HTML 代碼或者在幾個框架里面增加一些樣式表就可以很容易地美化一下界面。最后,在html標簽里面加一些<meta>元素,可以讓右上部框架定時地去刷新,使得用戶不用自己手工去刷新頁面就可以看到最新的新聞項目。
注解 (2003年8月4日): 在這篇文章發布以后,一些讀者用 Email 告訴通知我在顯示特定 RSS 聚合項的 <description> 元素時,有兩個潛在的問題:
1、Disable-output-encoding 屬性,這個屬性用在 <xsl:value-of> 元素中,但是并不是所有的 XSLT解析器都實現了這個功能。.NET XSLT 解析器支持 disable-output-encoding,但是還是要 注意一下,因為讀者可能試圖將這個應用程序移植到其它平臺。
2、<description> 元素的 HTML 內容是被原封不動地輸出的。但是,這些 HTML 內容可能包含惡意代碼,比如 <script> 或者 <embed> 代碼塊。理想情況下,這些代碼應該被剔除掉。為了清除掉這些有潛在危險的代碼,可能需要用到一些擴展函數(參見 Extending XSLT with JScript, C#, and Visual Basic .NET)。想查看從 RSS 聚合 摘要剔除 HTML 內容的更多信息,可以參見’’Dive Into Mark’’ 日志.
總結
在本文中,我們不僅講到如何創建一個聚合引擎,還創建了一個在線新聞聚合器。在建立這兩個應用程序時,我們都采用了在 ASP.NET 頁面顯示 XML 數據的技術。在聚合引擎里面,我們使用了 Repeater 控件以 XML格式來顯示數據庫中的數據。而在新聞聚合器里面,我們使用了 XML Web 控件和 XSLT 樣式表。
我邀請你下載本文的在線新聞聚合器,然后根據你的需要來增強它。如果有任何關于這個應用程序或者這篇文章討論的概念方面的問題,隨時恭候你的 EMail。我的 EMail mitchell@4guysfromrolla.com.
分享:怎樣在ASP.NET項目里面正確使用Linq to Sql老久不上來寫技術類的東西了,偶爾回歸一下吧。(其實,這篇文章8個月前寫了個大半,后來一直沒有時間去完善,再后來就因為各種原因給放下來了。) Linq to Sql 用的人也應該有些吧,我在cnblogs上面看老趙寫的那幾篇文章(請看08年9月左右的文章),感覺也很有
- asp.net如何得到GRIDVIEW中某行某列值的方法
- .net SMTP發送Email實例(可帶附件)
- js實現廣告漂浮效果的小例子
- asp.net Repeater 數據綁定的具體實現
- Asp.Net 無刷新文件上傳并顯示進度條的實現方法及思路
- Asp.net獲取客戶端IP常見代碼存在的偽造IP問題探討
- VS2010 水晶報表的使用方法
- ASP.NET中操作SQL數據庫(連接字符串的配置及獲取)
- asp.net頁面傳值測試實例代碼
- DataGridView - DataGridViewCheckBoxCell的使用介紹
- asp.net中javascript的引用(直接引入和間接引入)
- 三層+存儲過程實現分頁示例代碼
- 相關鏈接:
- 教程說明:
.Net教程-解讀Asp.Net 建立的在線 RSS 新聞聚合器。