首頁(yè)>>搜索與營(yíng)銷

 

搜索引擎:從信息中搜尋財(cái)富

2001-11-20

文/arshioul
  
 

  搜索引擎,一個(gè)網(wǎng)絡(luò)業(yè)最老的商業(yè)模式之一,一個(gè)成百萬(wàn)網(wǎng)民每天都要使用的服務(wù),現(xiàn)在正在向全面商業(yè)化轉(zhuǎn)型。那些具有商業(yè)價(jià)值卻還未被人所知的信息有朝一日會(huì)被搜索引擎開采出來(lái),創(chuàng)造出滾滾的財(cái)富。
  
  新一代搜索引擎
  
  搜索引擎曾經(jīng)是互聯(lián)網(wǎng)盛極一時(shí)的標(biāo)志產(chǎn)物。Asking Jeeves,AltaVista,Google,雅虎等大大小小的搜索引擎曾經(jīng)給我們希望,承諾我們可以輕而易舉地找到我們想要的信息。然而每個(gè)嘗試在網(wǎng)絡(luò)上搜索過(guò)信息的網(wǎng)民都知道,搜索引擎并非想象中那么好用--要么是找不到信息,要么是泥沙俱下,給你一大堆垃圾信息。
  
  對(duì)于商業(yè)公司來(lái)說(shuō),搜索引擎也是吃力不討好的活兒。分門別類儲(chǔ)存大量現(xiàn)存信息已是不堪負(fù)擔(dān),何況網(wǎng)絡(luò)上的信息正在以光速的速度增長(zhǎng)。對(duì)IT技術(shù)和商業(yè)管理來(lái)說(shuō),搜索信息的模式實(shí)在是一大挑戰(zhàn)。
  
  IT市場(chǎng)分析公司IDC今年秋天出具的一份報(bào)告表明,前期被大肆宣傳為"使用簡(jiǎn)便易用,搜索結(jié)果豐富"的搜索引擎技術(shù)正在被信息更集中的局域網(wǎng)取代,因?yàn)橛脩糁涝诖蠖鄶?shù)搜索系統(tǒng)的表現(xiàn)與他們的期望值相差太大。
  
  一般的公共搜索引擎只能查到HTML格式,即超文本標(biāo)示格式語(yǔ)言的網(wǎng)頁(yè),主要是因?yàn)樗阉饕娴淖詣?dòng)排序軟件spiders蜘蛛程序,只能接受這種格式的網(wǎng)頁(yè)。這意味著,在企業(yè)內(nèi)部的局域網(wǎng)上,任何沒(méi)有使用HTML格式書寫的信息將無(wú)法被外部的搜索引擎查到。
  
  這些"沉沒(méi)"的信息包括Powerpoint幻燈片文件、Word文檔、PDF文件、各種各樣的電子郵件內(nèi)容,諸如CRM客戶關(guān)系管理或者ERP企業(yè)資源管理這樣的應(yīng)用軟件產(chǎn)生的數(shù)據(jù)庫(kù)也是無(wú)法查到的,多媒體內(nèi)容方面,數(shù)量正在高速發(fā)展的視頻、音頻文件通常也被排除在搜索引擎之外。
  
  好在搜索引擎技術(shù)發(fā)展迅速,未來(lái)公共搜索引擎能夠彌補(bǔ)上述的缺陷。在過(guò)去的幾個(gè)月中,搜索引擎經(jīng)過(guò)了商業(yè)化,技術(shù)上有了更新的成果。新型的搜索引擎能夠接受幾十種軟件格式,諸如智能搜索和個(gè)性化搜索的特色把它們與過(guò)去的搜索引擎區(qū)別了開來(lái)。
  
  搜索引擎挖掘信息資源的金礦
  
  在多數(shù)網(wǎng)民的印象中,門戶模式與搜索引擎是合而為一的,像雅虎,本身是搜索引擎,后來(lái)建起了新聞服務(wù)和聊天室,又如國(guó)內(nèi)有名的門戶網(wǎng)站新浪,最早是新聞比較好,后來(lái)也加強(qiáng)搜索引擎的服務(wù)。
  
  但是現(xiàn)在按照業(yè)界一些流行的觀點(diǎn),門戶模式、搜索引擎最好分開做。門戶模式管理好內(nèi)容服務(wù),搜索引擎的核心部分技術(shù)外包。事實(shí)上搜索引擎的技術(shù)外包在行業(yè)內(nèi)不是什么秘密,雅虎自己的搜索技術(shù)一般,它就采用Google的技術(shù);新浪也沒(méi)有在搜索引擎上花太大的力氣,而是把技術(shù)服務(wù)外包給了3721。
  
  搜索引擎的專業(yè)分工為這個(gè)行業(yè)分支的商業(yè)化創(chuàng)造了條件。利用有限的企業(yè)資源,搜索引擎能夠在用戶界面、應(yīng)用基礎(chǔ)、嵌入技術(shù)、集成服務(wù)等多方面與商業(yè)企業(yè)合作。搜索引擎從門戶的陣營(yíng)中分離出來(lái),獨(dú)立走出商業(yè)化的道路。
  
  AltaVista搜索軟件公司的歐洲區(qū)副總裁馬克說(shuō),商業(yè)公司內(nèi)各種格式的電子文件中,平均80%的信息未經(jīng)整理,使用起來(lái)效率很低。"這就是搜索引擎所能帶給企業(yè)的價(jià)值。利用相同的技術(shù),我們可以在零亂的信息中給公司挖掘出一座大金礦。"
  
  AltaVista針對(duì)商業(yè)客戶的搜索軟件今年6月上市,該軟件能用30種語(yǔ)言,搜索200多種文件格式。"企業(yè)擁有搜索引擎,就建立了一張信息資源的全景圖。通過(guò)一張完整的、可搜索的目錄,信息在企業(yè)系統(tǒng)中的分布一目了然。"
  
  支持多語(yǔ)言,可搜索各種格式文件是最近商用搜索引擎競(jìng)爭(zhēng)的賣點(diǎn)之一,還有其它一些搜索引擎公司專注于一兩種特定格式文件的搜索。例如,Screening Room公司允許用戶利用其技術(shù),專門搜尋視頻、音頻文件,而駐扎于劍橋大學(xué)的初創(chuàng)公司NCorp專門從事格式化數(shù)據(jù)庫(kù)的搜索服務(wù)。
  
  NCorp的創(chuàng)始人兼首席執(zhí)行官尼克說(shuō)公司的核心搜索業(yè)務(wù)僅限于IT業(yè)內(nèi),能夠使用標(biāo)準(zhǔn)查詢語(yǔ)句SQL的專業(yè)人士。"標(biāo)準(zhǔn)化數(shù)據(jù)庫(kù)數(shù)量不如非標(biāo)準(zhǔn)化數(shù)據(jù)庫(kù)那么多,但是它們有很大的發(fā)展?jié)摿Γ院罂隙ㄓ泻艽蟮乃阉餍枨蟆N覀兙涂礈?zhǔn)了這個(gè)市場(chǎng),準(zhǔn)備逐步培育它。"
  
  公司出品的搜索引擎Ijen不僅令初學(xué)者容易上手,而且能夠提供給專家比SQL語(yǔ)句更優(yōu)化的查詢結(jié)果。"SQL語(yǔ)句能夠?yàn)榫哂袦?zhǔn)確標(biāo)準(zhǔn)的查詢問(wèn)題提供答案,例如'公司本月的銷售額是多少'。但是它無(wú)法解決智能化的模糊問(wèn)題,例如'哪位員工最適合執(zhí)行該計(jì)劃'。"
  
  搜索引擎的商業(yè)應(yīng)用
  
  不少商業(yè)公司對(duì)搜索引擎的效率仍然表示懷疑,但是專家說(shuō),新一代搜索引擎的初始排序速度非常快,花費(fèi)時(shí)間很少。例如著名的財(cái)經(jīng)新聞集團(tuán)路透社,它應(yīng)用搜索引擎在36小時(shí)內(nèi)對(duì)200萬(wàn)個(gè)文件進(jìn)行了排序。"新的搜索引擎非常易用,公司可以從網(wǎng)上下載,自己就可以調(diào)試,30天后就能使用,幾乎可以不依賴外部的技術(shù)支持。"
  Verity的市場(chǎng)總監(jiān)西蒙也認(rèn)為搜索引擎根據(jù)企業(yè)要求的功能,準(zhǔn)備時(shí)間有長(zhǎng)有短,但是相比CRM或者ERP這樣的項(xiàng)目,搜索引擎只是一個(gè)小工程。"你安裝好系統(tǒng)后,就可以開始排序了。執(zhí)行程序就是了。"
  
  當(dāng)然,專業(yè)用戶對(duì)搜索引擎的信息檢索準(zhǔn)確性要求非常苛刻,所以在引擎技術(shù)、數(shù)據(jù)容量升級(jí)的同時(shí),開發(fā)廠商對(duì)信息原材料的提煉也做出了努力。他們深入到企業(yè)中,了解他們組織信息的過(guò)程和特征,并且參考前人的工作成果和資料修改了個(gè)性化的搜索方式。
  
  這種努力漸漸有了成果。有的商業(yè)搜索引擎有了分級(jí)功能,按照人們對(duì)文件關(guān)注程度的高低次序排列文件,有的則是從使用者出發(fā),按照同一級(jí)別的雇員關(guān)注程度高低排序文件,還有的搜索引擎將文件注釋與專家推薦功能結(jié)合,用戶不必打開文件就能對(duì)文件大致有個(gè)了解。
  
  "多數(shù)人最多讀30個(gè)文件,所以搜索結(jié)果不是越多越好,而是不管你用什么方法,要把最適合要求的30個(gè)文件找出來(lái),放在列表的最前面。"搜索引擎公司Convera的負(fù)責(zé)市場(chǎng)開發(fā)的副總裁柏恩·布萊默說(shuō)。該公司的母公司Excalibur技術(shù)公司最近與英特爾的互動(dòng)媒體服務(wù)分部剛剛合并,合并后公司的第一家子公司就是Convera。
  因?yàn)樗阉饕鎸I(yè)化發(fā)展而出現(xiàn)的新技術(shù)趨勢(shì)真是不勝枚舉。另一家公司Fast Search把數(shù)據(jù)即時(shí)預(yù)警功能集成到搜索功能中,其創(chuàng)意極其新穎。公司創(chuàng)始人兼CTO約翰·萊維克說(shuō),"我們能夠即時(shí)過(guò)濾任何數(shù)據(jù)流。例如股票報(bào)價(jià)或者天氣預(yù)報(bào),并且產(chǎn)生即時(shí)報(bào)警報(bào)告。"
  
  這家公司主要的目標(biāo)是金融企業(yè)的分析系統(tǒng)和內(nèi)容網(wǎng)站的即時(shí)新聞,據(jù)他們估算,這些公司的信息更新速度大約是每秒鐘更新5個(gè)文件。"我們引擎完全是即時(shí)更新的,新信息一出來(lái),就可以查到。"
  
  作為企業(yè)局域網(wǎng)的一部分,搜索引擎涉及很多企業(yè)敏感的商業(yè)信息,因此信息安全也是十分重要。搜索引擎都考慮到了這一點(diǎn),把使用權(quán)和控制權(quán),分布到分散式系統(tǒng)上,每個(gè)子系統(tǒng)都擁有自己獨(dú)立的帳號(hào)、主群和進(jìn)入許可。"搜索引擎能夠同時(shí)搜索多個(gè)文件,但是從安全考慮,每個(gè)文件都有獨(dú)一無(wú)二的安全等級(jí)。
  
  搜索引擎成熱點(diǎn)
  
  各方面性能的提高使搜索引擎即將成為企業(yè)信息系統(tǒng)的一部分。它就像一輛車的馬達(dá),放在企業(yè)信息戰(zhàn)略框架中,與IT應(yīng)用技術(shù)、知識(shí)管理體系和企業(yè)智能系統(tǒng)一起,構(gòu)成了企業(yè)內(nèi)部的信息神經(jīng)網(wǎng)絡(luò)。
  
  目前搜索引擎開發(fā)商主要是爭(zhēng)奪世界前2000強(qiáng)的公司,他們財(cái)大氣粗,出手豪闊,但是從市場(chǎng)反饋看,一些中小型的公司也對(duì)搜索引擎非常感興趣。例如Inktomi有像太陽(yáng)微系統(tǒng)公司這樣的大客戶--需排序多達(dá)7000萬(wàn)個(gè)文件,也有一些小客戶--排序文件只有3000個(gè)。
  
  隨著商業(yè)需求的不斷增大,網(wǎng)絡(luò)與商業(yè)企業(yè)趨向無(wú)縫結(jié)合,搜索引擎有了用武之地,搜索引擎企業(yè)外包,公共搜索引擎收費(fèi)擺上了議事日程。市場(chǎng)分析家預(yù)計(jì)搜索引擎市場(chǎng)將持續(xù)增長(zhǎng),在今年底市場(chǎng)價(jià)值將達(dá)到150億美元,但是這個(gè)新興的技術(shù)市場(chǎng)也面臨激烈的競(jìng)爭(zhēng)。
  
  "很多開發(fā)商意識(shí)到簡(jiǎn)單添加一個(gè)搜索功能不足以開掘互聯(lián)網(wǎng)的信息價(jià)值,達(dá)不到內(nèi)外網(wǎng)絡(luò)信息共享的目的。最好的解決方案是開發(fā)廠商將搜索技術(shù)與商業(yè)戰(zhàn)略構(gòu)架集成在一起,集成得越完美,獲得市場(chǎng)成功的可能就越大。
  
  搜索引擎的攻城略地也蔓延到了移動(dòng)商務(wù)領(lǐng)域,PDA、手持設(shè)備和手機(jī)日后都能使用搜索引擎,搜索引擎可以變得無(wú)處不在。從某種意義上說(shuō),單純"今天你有否雅虎"這種口號(hào)已經(jīng)死了,但是"今天你有否搜索"這個(gè)提法在很長(zhǎng)一段時(shí)間將代表業(yè)界的發(fā)展趨勢(shì),具有蓬勃的生命力。


搜狐IT

Copyright ©  2001-2002 SOWANG.COM All rights reserved. 
中文搜索引擎指南網(wǎng) 
版權(quán)所有