3.1-采集容易出錯的幾個地方的設(shè)置說明_風(fēng)訊Cms教程

教程Tag：暫無Tag,歡迎添加,賺取U幣!

3.1的采集增加了模糊匹配查詢的功能，

從發(fā)布以來大家使用后反映問題來看，

我特總結(jié)幾點做非凡說明（以后發(fā)現(xiàn)更多情況再繼續(xù)補充）：

一、采集條數(shù)設(shè)置后導(dǎo)致下標越界的問題

出現(xiàn)這個問題是因為設(shè)置的采集條數(shù)過大，已經(jīng)大于了目標頁面的實際新聞條數(shù)，假如要采集的新聞是整個目標頁面的新聞，請不要填寫條數(shù)，直接點擊確定就是了，默認是全部采集對象頁的全部符合條件的新聞。

二、無法讀取新聞列表的問題

新聞列表在3.1里面設(shè)置是非必須的，即可以不設(shè)置，默認是全頁面（在<body和</body>之間）匹配符合條件的新聞地址。但是我們建議您設(shè)置一下采集“新聞列表”，那樣可以加快采集速度，并且給你設(shè)置“列表URL”帶來方便。設(shè)置的時候請注重開始標記的唯一性，結(jié)束標記也建議設(shè)置成唯一的，假如設(shè)置中有不方便的情況，可以使用“[變量]”代替一下不確定的字符，可以設(shè)置多個“[變量]”。

三、采集目標地址在頁面中是相對路徑的問題

其實這個不算是個問題，因為我們系統(tǒng)會判定是相對路徑和絕對路徑的，相對路徑在采集的時候也會補充完整的！對采集沒有影響！

四、采集分頁的問題

采集新聞對象頁分頁這里不說了，請看教程和錄像；采集新聞內(nèi)容分頁，請設(shè)置具有“下一頁”標記的地方，取得“下一頁”指向的地址，假如只有第一頁，第二頁，第三頁等，無法確定下一頁標記的頁面，內(nèi)容分頁暫時是不能采集的，除非如當(dāng)前頁是第二頁，“第二頁”標記是沒有加超連接的，那樣可以尋找這樣沒有加超連接的下一個標記就是下一頁。總之，必須要準確取出“下一頁”的URL地址才能使用內(nèi)容分頁采集。

五、對續(xù)采的說明

續(xù)采新聞需要在前面采集有記錄的情況下進行，并且要和采集順序相同，假如采集是順序采集，在續(xù)采的時候改成了倒序采集，續(xù)采是進行不下去的。假如采集對象也更新很快，前一次采集比較久了，采集記錄比采集對象頁老的情況下續(xù)采將無法確定前一次采集的結(jié)束點，建議使用正常的采集。續(xù)采沒有采集條數(shù)的設(shè)置。

六、目標頁采集回來出現(xiàn)亂碼的問題

那是目標頁編碼方式和采集默認編碼方式不一樣導(dǎo)致的，我們默認是采集GB2312，在采集UTF-8等編碼方式會出現(xiàn)亂碼，需要修改collect/inc/function.asp里面第二個函數(shù)對編碼方式的設(shè)置，采集完成后請修改回GB2312,因為現(xiàn)在的中文網(wǎng)頁絕大部分是使用GB2312的。

七、遠程存圖和存FLASH的問題

假如在站點選項里面設(shè)置了保存遠程圖片，在采集時會將新聞頁面的圖片和FLASH采集到本地你設(shè)置的保存文件的目錄里面，并將頁面對應(yīng)的圖片和FLASH地址替換成你現(xiàn)有的本地路徑，假如不保存遠程圖片，也會將圖片和FLASH連接地址替換成絕對的，所以不用擔(dān)心采集回來有相對路徑的顯示問題。

八、其他一些不能采集的情況

請注重紅色顯示的報錯信息，比如標題失敗，內(nèi)容失敗等，請檢查相應(yīng)部分的設(shè)置，在不熟悉的情況下多修改幾次，你一定能采集成功的！

還有一些地方需要自己體會，有問題歡迎上論壇我們大家討論！

來源：模板無憂/所屬分類：風(fēng)訊Cms教程/更新時間：2006-06-16

3.1-采集容易出錯的幾個地方的設(shè)置說明_風(fēng)訊Cms教程

風(fēng)訊Cms教程教程Rss訂閱Cms教程搜索

風(fēng)訊Cms教程推薦

猜你也喜歡看這些