3.1-采集容易出錯的幾個地方的設(shè)置說明_風(fēng)訊Cms教程

      編輯Tag賺U幣
      教程Tag:暫無Tag,歡迎添加,賺取U幣!

      3.1的采集增加了模糊匹配查詢的功能,

      從發(fā)布以來大家使用后反映問題來看,

      我特總結(jié)幾點做非凡說明(以后發(fā)現(xiàn)更多情況再繼續(xù)補充):

      一、采集條數(shù)設(shè)置后導(dǎo)致下標越界的問題

      出現(xiàn)這個問題是因為設(shè)置的采集條數(shù)過大,已經(jīng)大于了目標頁面的實際新聞條數(shù),假如要采集的新聞是整個目標頁面的新聞,請不要填寫條數(shù),直接點擊確定就是了,默認是全部采集對象頁的全部符合條件的新聞。

      二、無法讀取新聞列表的問題

      新聞列表在3.1里面設(shè)置是非必須的,即可以不設(shè)置,默認是全頁面(在<body和</body>之間)匹配符合條件的新聞地址。但是我們建議您設(shè)置一下采集“新聞列表”,那樣可以加快采集速度,并且給你設(shè)置“列表URL”帶來方便。設(shè)置的時候請注重開始標記的唯一性,結(jié)束標記也建議設(shè)置成唯一的,假如設(shè)置中有不方便的情況,可以使用“[變量]”代替一下不確定的字符,可以設(shè)置多個“[變量]”。

      三、采集目標地址在頁面中是相對路徑的問題

      其實這個不算是個問題,因為我們系統(tǒng)會判定是相對路徑和絕對路徑的,相對路徑在采集的時候也會補充完整的!對采集沒有影響!

      四、采集分頁的問題

      采集新聞對象頁分頁這里不說了,請看教程和錄像;采集新聞內(nèi)容分頁,請設(shè)置具有“下一頁”標記的地方,取得“下一頁”指向的地址,假如只有第一頁,第二頁,第三頁等,無法確定下一頁標記的頁面,內(nèi)容分頁暫時是不能采集的,除非如當(dāng)前頁是第二頁,“第二頁”標記是沒有加超連接的,那樣可以尋找這樣沒有加超連接的下一個標記就是下一頁。總之,必須要準確取出“下一頁”的URL地址才能使用內(nèi)容分頁采集。

      五、對續(xù)采的說明

      續(xù)采新聞需要在前面采集有記錄的情況下進行,并且要和采集順序相同,假如采集是順序采集,在續(xù)采的時候改成了倒序采集,續(xù)采是進行不下去的。假如采集對象也更新很快,前一次采集比較久了,采集記錄比采集對象頁老的情況下續(xù)采將無法確定前一次采集的結(jié)束點,建議使用正常的采集。續(xù)采沒有采集條數(shù)的設(shè)置。

      六、目標頁采集回來出現(xiàn)亂碼的問題

      那是目標頁編碼方式和采集默認編碼方式不一樣導(dǎo)致的,我們默認是采集GB2312,在采集UTF-8等編碼方式會出現(xiàn)亂碼,需要修改collect/inc/function.asp里面第二個函數(shù)對編碼方式的設(shè)置,采集完成后請修改回GB2312,因為現(xiàn)在的中文網(wǎng)頁絕大部分是使用GB2312的。

      七、遠程存圖和存FLASH的問題

      假如在站點選項里面設(shè)置了保存遠程圖片,在采集時會將新聞頁面的圖片和FLASH采集到本地你設(shè)置的保存文件的目錄里面,并將頁面對應(yīng)的圖片和FLASH地址替換成你現(xiàn)有的本地路徑,假如不保存遠程圖片,也會將圖片和FLASH連接地址替換成絕對的,所以不用擔(dān)心采集回來有相對路徑的顯示問題。

      八、其他一些不能采集的情況

      請注重紅色顯示的報錯信息,比如標題失敗,內(nèi)容失敗等,請檢查相應(yīng)部分的設(shè)置,在不熟悉的情況下多修改幾次,你一定能采集成功的!

      還有一些地方需要自己體會,有問題歡迎上論壇我們大家討論!

      查看更多 風(fēng)訊cms教程  風(fēng)訊cms模板

      來源:模板無憂//所屬分類:風(fēng)訊Cms教程/更新時間:2006-06-16
      相關(guān)風(fēng)訊Cms教程