文/陸元婕
“美美,問題列出來了嗎?”
“嗯,給你看吧。大部分都不是我想要找的。搜索引擎還是不好用。”
“美美,別急,會有辦法的,我們一起來找找看。”
司坦福大學(xué)——用Google、新浪都沒找到與之相符的網(wǎng)頁
歌星王菲 精選專輯 -rm——用新浪和Google都沒找到有價值的結(jié)果
世界杯預(yù)選賽 最新新聞——用Google找的都是舊聞。用新浪倒是找到了一些,可是點擊過去一看鏈接的不對啊。
大連 天津街 地圖——用Google、新浪都查不到有用的信息。
IT 新聞——在Google中給出的都只是新聞,而沒有IT業(yè)的新聞。不過新浪倒是不錯,有相關(guān)的新聞。
看到美美的這張問題列表,小張和妮妮私下研究了一會。
“這些其實不難找。先讓小張給你介紹一些基本的搜索技巧吧。然后我們再實戰(zhàn)演練幾番。”
“好啊,真的能很快就學(xué)會搜索嗎?我會努力的。現(xiàn)在開始吧……”
一、選擇合適的搜索工具
“每種搜索引擎都有不同的特點,只有選擇合適的搜索工具才能得到最佳的結(jié)果。之前已經(jīng)介紹過了搜索工具基本上可以分為網(wǎng)頁檢索(也就是上次說的基于蜘蛛程序的機器人檢索系統(tǒng))和分類目錄(即目錄式搜索引擎)兩種(我們先不談元搜索引擎)。”
“網(wǎng)頁檢索實際上是網(wǎng)頁的完全索引。分類目錄則是由人工編輯整理的網(wǎng)站的鏈接。”
“這兩種搜索工具哪種好用呢?”
“這取決于你想查詢的問題。一般來說,如果你需要查找非常具體或者特殊的問題,用網(wǎng)頁檢索比較合適;如果你希望瀏覽某方面的信息、專題或者查找某個具體的網(wǎng)站,分類目錄會更合適。”
“要是你需要查找的是某些確定的信息,比如Mp3、地圖等,就最好使用專門的Mp3、地圖等搜索引擎。”
“有這樣的專業(yè)搜索引擎嗎?”
“當(dāng)然,實際上幾乎每一類信息都有非常專業(yè)的搜索工具,它們有個名稱叫垂直搜索引擎。比如賽迪網(wǎng)的IT羅盤就是以精選式IT垂直搜索為特征的搜索引擎。”
二、使用正確的搜索詞
“使用搜索引擎要注意不能寫錯別字,此外要盡量使用大家比較常用的詞語。”
“這是為什么呢?”
“就目前而言,多數(shù)搜索引擎不支持容錯查詢。所以,一定要注意不寫錯別字。”
“容錯查詢,就是指即使用戶輸入了錯別字,搜索引擎也能根據(jù)某種規(guī)則推斷出該詞的正確寫法,給出正確的搜索結(jié)果。”
“由于互聯(lián)網(wǎng)的信息是人來提交的,如果你使用了不常用的詞語來搜索,就不大容易找到答案了。比如,你想查有關(guān)鼠標(biāo)的信息,但輸入的是‘滑鼠’(港臺地區(qū)用語),就不容易找到資料了。”
三、正確使用布爾檢索
“正確的使用布爾檢索方式可以減少搜索結(jié)果的返回數(shù)。”
“什么是布爾檢索?我好像沒聽過”。
“布爾檢索,就是應(yīng)用布爾表達(dá)式的檢索方式,比如‘和’(And)、‘或‘(OR)、‘非’(NOT)。其實前面介紹的搜索的數(shù)學(xué)規(guī)則就是這種布爾檢索。加號就相當(dāng)于和,減號就相當(dāng)于非。而或關(guān)系沒有介紹,它并不是很常用的檢索規(guī)則。在搜索時一方面要注意不同搜索引擎工具的布爾檢索的表達(dá)方法。另一方面,也要注意自己要搜索的內(nèi)容邏輯關(guān)系是否合理。”
四、在點擊之前要思考
“成功的搜索=正確的提問+點擊有用的結(jié)果。”
“這么深奧?解釋一下吧。”
“就是說要想得到滿意的搜索結(jié)果除了要注意搜索條件之外,還取決于你最終點擊的那個搜索結(jié)果。”
“在返回的搜索結(jié)果中究竟哪個是真正滿意的?在點擊之前,你需要通過比較排序位置、網(wǎng)址鏈接、文字說明等來分析。關(guān)于這方面的知識我們在實戰(zhàn)演練時再學(xué)習(xí)。”
五、在實踐中取得搜索經(jīng)驗
“搜索技巧和其他的技術(shù)一樣是在不斷練習(xí)中總結(jié)與成熟起來的。因此你必須不斷練習(xí)、不斷總結(jié)。”
“同時,通過練習(xí)總結(jié),你可以形成自己的一套有效的搜索習(xí)慣。這將有助于更快的完成搜索。好像美美現(xiàn)在這樣,遇到一點困難就打了退堂鼓,可是不行的。”
“好了,基本的搜索技巧先講到這,關(guān)鍵還是多加練習(xí)。我們就以美美在搜索時遇到的那幾個問題試一下這些搜索技巧吧。”
“先讓我來試試。我好像已經(jīng)找到一些原因了。”
“那就說說看吧。”
“司坦福大學(xué),是錯別字。應(yīng)該是斯坦福大學(xué)。”
“歌星王菲 精選專輯 –rm,是不是搜索條件太多?試一下,輸個簡單點的‘王菲 專輯 –rm’,找到了。”
“不僅是這個原因。你要搜索的關(guān)鍵字要符合習(xí)慣。這方面,新浪的幫助信息的有介紹。”
“世界杯預(yù)選賽 最新新聞。這個問題怎么解決呢?”
“用Google找到的結(jié)果確實是比較舊,因為目前Google的搜索數(shù)據(jù)庫的更新是每月一次(平均為28天),所以顯然用它來搜索新聞是不合適的。”
“而你在新浪遇到的是死鏈問題。死鏈對于搜索引擎而言是很正常的,這不是我?guī)退阉饕骈_脫。實在是因為互聯(lián)網(wǎng)的信息更新的太快,它不容易抓取。除了死鏈問題,以后你還會遇到很多屬于搜索引擎的不足之處,比如它對于動態(tài)網(wǎng)頁處理能力不強之類的。”
“那有辦法找到這些死鏈的內(nèi)容嗎?”
“辦法有一些。比如google就采用了網(wǎng)頁快照的技術(shù)。這個我們會在實戰(zhàn)演練中詳細(xì)介紹。”
“另一個辦法是:運用一些偵察技巧,加上你的好運氣,有可能會找到。”
“什么偵察技巧?”
“由于死鏈有時是因為網(wǎng)站制作者將文件更換路徑而搜索引擎沒有及時更新造成的。”
“據(jù)此,我們可以使用一種叫做‘URL退選’的方法。也就是將地址欄的網(wǎng)址的文件名一點點刪除,在碰到第一個斜杠后停止,然后敲回車鍵。重復(fù)此動作,不斷嘗試。運氣夠好的話,就能找到了。”
“聽起來很復(fù)雜啊。”
“要是你了解一些網(wǎng)站發(fā)布的知識會比較容易懂。雖然這種辦法并不總有效,但是還是值得嘗試的。”
“大連 天津街 地圖,這個是不是該用地圖搜索引擎?”
“對。比如Go2Map,ChinaQuest之類的地圖搜索引擎就能查到。”
“IT 新聞,為什么會查不到呢?”
“這個估計是因為StopWords造成的。”
“什么是StopWords?”
“這個涉及一些搜索技術(shù)方面的知識了。就拿英文而言,有大約300個最常用單詞本身缺乏實際意義或者使用過于廣泛,一旦用來搜索的話,會返回大量的無用的搜索結(jié)果甚至導(dǎo)致搜索引擎錯誤。因此很多搜索引擎都會屏蔽這些關(guān)鍵詞。”
“那在新浪怎么就能找到呢?”
“新浪能夠給出正確結(jié)果可能與它的搜索引擎服務(wù)提供商百度的技術(shù)有關(guān)。”
“太好了,我的問題幾乎都解決了。我還想學(xué)習(xí)更多的搜索知識呢?你們繼續(xù)教我啊。”
“可以啊,下一次我們會介紹幾個比較常用的搜索引擎。”
|