按照信息搜集方法和服務提供方式的不同,搜索引擎系統可以分為三大類:
1.
目錄式搜索引擎。早期的搜索引擎是把因特網中的資源服務器的地址收集起來,由其提供的資源的類型不同而分成不同的目錄,再一層層地進行分類。人們要找自己想要的信息可按他們的分類一層層進入,就能最后到達目的地,找到自己想要的信息。信息大多面向網站,
提供目錄瀏覽服務和直接檢索服務。該類搜索引擎因為加入了人的智能,所以信息準確、導航質量高,缺點是需要人工介入、維護量大、信息量少、信息更新不及時。這類搜索引擎的代表是:YAHOO,
Open Directory,國內最具代表性的是搜狐分類目錄。
這是互聯網早期的搜索引擎形式,現在仍然占有重要地位。雅虎就是從一個單一的搜索引擎發展到現在有電子商務、新聞信息服務、個人免費電子信箱服務等多種網絡服務,
2.
機器搜索引擎。由大規模機器運運行的程序按照某種策略自動地在互聯網中搜集和發現信息,由索引器為搜集到的信息建立索引,由檢索器根據用戶的查詢輸入檢索索引庫,并將查詢結果返回給用戶。服務方式是面向網頁的全文檢索服務。該類搜索引擎的優點是信息量大、更新及時、毋需人工干預,缺點是返回信息過多,可能有很多無關信息,用戶必須從結果中進行篩選。這類搜索引擎的代表是:AltaVista,
Excite, Infoseek, Inktomi, FAST, Lycos,,AlltheWeb, Ask Jeeves,
Google;國內最具代表性的是:百度,天網,OpenFind。
目錄式搜索引擎的缺點,隨著網絡信息的增長變得日益明顯。對網上信息搜索的需求使得從事機器搜索的研究機構和提供搜索服務的公司在1995年以后變得異常繁榮。
3. 元搜索引擎.
這類搜索引擎沒有自己的數據,它將用戶的查詢請求同時向多個搜索引擎遞交,將返回的結果進行重復排除、重新排序等處理后,作為自己的結果返回給用戶。這類搜索引擎的代表是WebCrawler,在實際中應用的效果并不理想。