中國(guó)互聯(lián)網(wǎng)向何處去之三:中國(guó)搜索引擎的出路在哪里_建站經(jīng)驗(yàn)教程

      編輯Tag賺U幣
      教程Tag:暫無(wú)Tag,歡迎添加,賺取U幣!

      推薦:不懂網(wǎng)站的人,靠網(wǎng)站月賺20萬(wàn)
      老劉今年54歲了,我和他熟悉快一個(gè)月了,這一個(gè)月來(lái)我親眼見(jiàn)證了他通過(guò)他的破網(wǎng)站(在我看來(lái)很破)成交了7個(gè)單子,每個(gè)單子的純利潤(rùn)在2萬(wàn)左右,也就是一個(gè)月他純賺了14萬(wàn)左右。 熟悉老劉是在年前,通過(guò)一個(gè)朋友熟悉的,這個(gè)朋友比我大一歲,我叫他張哥,他在一公司做銷(xiāo)

      一、搜索引擎的歷史

      二、搜索引擎的技術(shù)現(xiàn)狀

      三、站內(nèi)搜索和公網(wǎng)搜索

      四、中文分詞和檢索

      五、搜索的未來(lái)

      今天來(lái)討論搜索引擎,很有意思的是徽劍作為技術(shù)背景的從業(yè)人士,曾經(jīng)也參與了搜索引擎的開(kāi)發(fā),開(kāi)發(fā)過(guò)一套基于互聯(lián)網(wǎng)的情報(bào)系統(tǒng),就是當(dāng)年百度李彥宏也曾經(jīng)干過(guò)的事。后來(lái)一直也在關(guān)注搜索技術(shù)。現(xiàn)在徽劍手上還有兩套搜索引擎系統(tǒng)的方案。

      需要指出的是,由于考慮到讀者群體,徽劍在這篇文章中基本上以原理為主,對(duì)于一些涉及細(xì)節(jié)的東西,除了要害的地方以外,一般都會(huì)略去不說(shuō)。希望討論搜索引擎這個(gè)話(huà)題的可以聯(lián)系徽劍,或者加入QQ群21423628 搜索技術(shù)研究與實(shí)踐,這里主要討論搜索技術(shù)、分詞、數(shù)據(jù)檢索挖掘、技術(shù)開(kāi)發(fā)等系列問(wèn)題,非凡是前沿問(wèn)題,剛建立的,人不多。不過(guò)這個(gè)群不歡迎所謂的SEO人士。在徽劍看來(lái),所謂中國(guó)的SEO基本都是糊弄人的,這個(gè)群里面發(fā)現(xiàn)一個(gè)清理一個(gè)。

      徽劍在這里推薦英文好的朋友可以去閱讀一篇文章《The Anatomy of a Large-Scale Hypertextual Web Search Engine》,是講谷歌雛形的東西.一些主要的技術(shù)都提到了。不妨可以把徽劍的本文和那篇文章對(duì)照起來(lái)閱讀,相信你對(duì)搜索引擎會(huì)有更深的熟悉。

      一、國(guó)內(nèi)搜索引擎的歷史

      首先讓我們來(lái)看看搜索引擎的歷史:

      最早的計(jì)算機(jī)是用于計(jì)算彈道軌跡的,但隨后人們就把它用于信息檢索,其實(shí)搜索引擎就是一種信息檢索。而計(jì)算機(jī)檢索系統(tǒng)也就是搜索引擎,我們可以這么說(shuō),計(jì)算機(jī)出現(xiàn)后不久,就出現(xiàn)了搜索引擎。

      照IT歷史研究人員的說(shuō)法,計(jì)算機(jī)信息檢索可以分為三個(gè)階段:

      首先是早期的脫機(jī)檢索:其特點(diǎn)是不對(duì)一個(gè)檢索提問(wèn)立即作出回答,而是集中大批提問(wèn)后進(jìn)行處理,且進(jìn)行處理的時(shí)間較長(zhǎng),人機(jī)不能對(duì)話(huà),

      1954年,美國(guó)海軍首先采用IBM-701型計(jì)算機(jī)建立了世界上第一個(gè)科技文獻(xiàn)檢索系統(tǒng),實(shí)現(xiàn)了單元詞組配檢索,檢索邏輯只采用“邏輯與”,檢索結(jié)果只是文獻(xiàn)號(hào)。

      1958年,美國(guó)通用電器公司將其加以改進(jìn),輸出結(jié)果增加了題名、作者和文獻(xiàn)摘要等項(xiàng)目。1964年,美國(guó)化學(xué)文摘服務(wù)社建立了文獻(xiàn)處理自動(dòng)化系統(tǒng),使編制文摘的大部分工作實(shí)現(xiàn)了計(jì)算機(jī)檢索。

      同年,美國(guó)國(guó)立醫(yī)學(xué)圖書(shū)館建立了計(jì)算機(jī)數(shù)據(jù)庫(kù),即醫(yī)學(xué)文獻(xiàn)分析與檢索系統(tǒng),不僅可以進(jìn)行邏輯“或”、“與”、“非”等種運(yùn)算,而且還可以從多種途徑檢索文獻(xiàn)。

      第二階段是聯(lián)機(jī)信息檢索,從60年代中期到70年代初。由于計(jì)算機(jī)分時(shí)技術(shù)的發(fā)展,通信技術(shù)的改進(jìn),以及計(jì)算機(jī)網(wǎng)絡(luò)的初步形成和檢索軟件包的建立,用戶(hù)可以通過(guò)檢索終端設(shè)備與檢索系統(tǒng)中心計(jì)算機(jī)進(jìn)行人機(jī)對(duì)話(huà),從而實(shí)現(xiàn)對(duì)遠(yuǎn)距離之外的數(shù)據(jù)庫(kù)進(jìn)行檢索的目的,即實(shí)現(xiàn)了聯(lián)機(jī)信息檢索。出現(xiàn)了美國(guó)的DIALOG系統(tǒng)、ORBIT系統(tǒng)、BRS系統(tǒng)、歐洲的ESA-IRS系統(tǒng)等。

      第三個(gè)階段是網(wǎng)絡(luò)化聯(lián)機(jī)檢索階段,此階段是從70年代初到現(xiàn)在。由于數(shù)據(jù)通信網(wǎng)都可為情報(bào)檢索傳輸數(shù)據(jù)。用戶(hù)可借助通訊網(wǎng)絡(luò)直接與檢索系統(tǒng)聯(lián)機(jī),從而實(shí)現(xiàn)不受地域限制的聯(lián)機(jī)信息檢索。像美國(guó)的DIALOG信息公司已成為全世界最為聞名的聯(lián)機(jī)檢索服務(wù)機(jī)構(gòu)。

      到了上個(gè)世紀(jì)90年代,聯(lián)機(jī)檢索正式從科研、教育等大型機(jī)構(gòu),走向了大眾的日常生活。讓我們來(lái)看看報(bào)道:

      “90年初當(dāng)時(shí)萬(wàn)維網(wǎng)還未出現(xiàn),為了查詢(xún)散布在各個(gè)分散的主機(jī)中的文件,曾有過(guò)Archie, Gopher等搜索工具。隨著互聯(lián)網(wǎng)的迅速發(fā)展,基于HTTP訪問(wèn)的web技術(shù)的迅速普及,在1994年1月,第一個(gè)既可搜索又可瀏覽的分類(lèi)目錄EINet Galaxy(Tradewave Galaxy)上線,它還支持Gopher和Telnet搜索。同年4月,Yahoo目錄誕生,隨著訪問(wèn)量和收錄鏈接數(shù)的增長(zhǎng),開(kāi)始支持簡(jiǎn)單的數(shù)據(jù)庫(kù)查詢(xún)。這就是早期的目錄導(dǎo)航系統(tǒng)。

      分享:《創(chuàng)業(yè)路上》這篇文章獻(xiàn)給準(zhǔn)備與正在創(chuàng)業(yè)中的朋友們!
      第一篇;感想有這么一種說(shuō)法,一個(gè)好的團(tuán)隊(duì)由4種動(dòng)物型人才組成,一老虎,治理型的,威嚴(yán),能很好的控制團(tuán)隊(duì)。二老鷹,市場(chǎng)戰(zhàn)略,飛的高,看的遠(yuǎn),將資訊最快的速度傳達(dá)給老虎。三是狼,市場(chǎng)銷(xiāo)售,狼的捕食能力及不屈不饒的精神能使其做的最好。四是狗,財(cái)務(wù)治理,能很

      共2頁(yè)上一頁(yè)12下一頁(yè)
      來(lái)源:模板無(wú)憂(yōu)//所屬分類(lèi):建站經(jīng)驗(yàn)教程/更新時(shí)間:2008-02-28
      相關(guān)建站經(jīng)驗(yàn)教程

      建站經(jīng)驗(yàn)教程Rss訂閱網(wǎng)站運(yùn)營(yíng)教程搜索