全文檢索搜索與分類目錄搜索的區別和對比

2016-09-08 2694 0 編輯:深色多郎 來源:分類網站設計

萬維網是一個大規模的,聯機式的信息儲藏所。那么,應當采用什么方法才能找到所需的信息呢?如果已經知道存放該信息的網點,那么只要在瀏覽器的地址(Location)框內鍵入該網點的URL和回車鍵,就可以進入該網點,但是,若不知道要找的信息在何網點,那就要使用萬維網的搜索工具。

在萬維網中用來搜索的工具叫搜索引擎(search engine)。搜索引擎的種類很多,但大體上可劃分為兩大類,即全文檢索搜索引擎和分類目錄搜索引擎。

全文搜索引擎是一種純技術型的檢索工具,它的工作原理是通過軟件(例如一種叫做“蜘蛛”或“網絡機器人”的spider程序)到因特網上的各網站收集信息,找到一個網站后可以從這個網站再鏈接到另一個網站,像蜘蛛爬行一樣。然后按照一定的規律建立一個很大的在線數據庫供用戶查詢。用戶在查詢時只要輸入關鍵詞,就從建立的索引數據庫上進行查詢(并不是實時地在因特網上檢索到的信息)。因此很可能有些查到的信息已經是過時的。建立這種索引數據庫的網站必須定期對已建立的數據庫進行更新維護。現在最出名的全文搜索引擎就是Google(谷歌)網站(www.Google.com),它收集的網頁數量超過80億個,圖片超過10億個,在整個搜索引擎市場中占有的份額超過50%。我們接著jsGoogle搜索技術的特點。在中文搜索引擎中,最出名的是百度位置(www.baidu.com)。

分類目錄搜索引擎并不采集網站的任何信息,而是利用各網站向搜索引擎提交的網站信息時填寫的關鍵詞和網站描述等信息。經過人工核實編輯后,如果認為符合網站登錄的條件,則輸入到分目錄的數據庫中,供網上用戶查詢,因此,分目錄搜索也叫做分類網站搜索。查詢時不需要使用關鍵詞,只需要按照分離(先找大分類,在找下面的小類),應而查詢的準確性比較好,但分類目錄查詢的結果并不是具體的頁面,而是被收錄網站主頁的的URL地址,因而所得到的內容就比較有限。相比之下,全文檢索可以檢索出大量的信息,(一次檢索的結果是幾百萬條,甚至是千萬條以上),但缺點是查詢結果不夠準確,往往是羅列出了海量信息(如上千萬條頁面),使用戶無法迅速找到所需的信息,在分目錄搜索引擎中最著名的就是雅虎(www.yahoo.com),國內著名的分類搜索引擎有雅虎中國(cn.yahoo.com),新浪(www.sina.com),搜狐(www.sohu.com),網易(www.163.com)等。

從用戶角度看,使用這兩種不同的搜索引擎都能夠實現自己查詢信息的目的,但用戶得到的信息的形式不一樣。全文檢索搜索引擎往往可以直接搜索到相關內容的網頁,但分類目錄搜索引擎一般只能檢索到相關信息的網址,為了用戶能夠更加方便的搜索到應用信息,目前許多網站往往同時具有全文搜索和分類目錄搜索的功能,在英特網上搜索信息需要經驗的累積,要多實踐才能掌握從英特網獲取信息的技巧。

而目前,360搜索引擎具有后起之秀之意(www.so.com)360搜索屬于元搜素引擎,這和上面的又有一些技術的不同。

值得注意的是,目前出來垂直搜索引擎(vertical seaarch engine),它針對某一特點領域,特定人群或某一特點需要提供搜索服務。垂直搜索也是提供關鍵字來搜索的,但被放到一個行業的知識的上下文中,返回的結果更傾向于信息,消息,條目等,例如,對買房子的人講,他希望查找的是房子的具體提供信息,(如面積,地點,價格等),而不是有關房子的一般性的論文或者新聞,政策等,目前熱門的垂直搜索行業有:購物,旅游,汽車,求職,房產,交友等行業,還有一些元搜索引擎(meta  search  engine),它把用戶提交的檢索請求發送到多個獨立的搜索引擎上去搜索,并把檢索結果集中統一處理,以統一的格式提供給客戶,因此是搜索引擎之上的搜索引擎,它的主要精力放在提高搜索速度,智能化處理和搜索結果,個性化搜索功能的設置和用戶檢索界面的友好性上,元搜索引擎的查全率和查準率都比較高。

本站文章均為深正網站建設摘自權威資料,書籍,或網絡原創文章,如有版權糾紛或者違規問題,請即刻聯系我們刪除,我們歡迎您分享,引用和轉載,但謝絕直接搬磚和抄襲!感謝...
關注深正互聯
我們猜你喜歡
七星彩头尾 民间马戏团杂技赚钱吗 jdb财神捕鱼网址 读书已经不赚钱了 乐动力靠什么赚钱 学生怎样利用公众号写作赚钱 做什么饮食赚钱不辛苦 怎么在北京奥运会期间赚钱 河粉购物赚钱 鲜芋仙赚钱 每天行走步数赚钱 b站上传视频能赚钱 qq空间捕鱼大富翁 捕鱼大师单机 老k网络捕鱼游戏 猎魂觉醒 料理 赚钱 流动擦皮鞋能赚钱吗