搜索引擎有哪四大系統
摘要:搜索引擎有哪四大系統,搜索引擎四大系統,搜索引擎對站長來說并不陌生,但也并不熟悉。我們知道搜索引擎可以索引網站、分析網站,給網站一個排名。合肥網站建設今天跟大家介紹的是搜索引擎的四大系統。
搜索引擎對站長來說并不陌生,但也并不是很熟悉。我們知道搜索引擎可以索引網站、分析網站,給網站一個排名。
合肥網站建設今天跟大家介紹的是
搜索引擎的四大系統。
搜索引擎分四個系統,分別是下載、分析、索引和檢索系統,這些系統都有各自的工作內容,少了其中一個,搜索引擎都不能算是完整的。下面我們就分別來看一下這四大系統。
一、下載系統
搜索引擎中的下載系統主要的工作就是下載和存儲互聯網中的所有網頁,也就是我們經常說的蜘蛛,蜘蛛是用來抓取網頁的。也就是說下載系統有下載和存儲兩個主要工作,一般抓取頁面的方式是從一個頁面抓取,收集頁面中的所有鏈接,然后再去訪問這個頁面中的所有鏈接。
二、分析系統
搜索引擎抓取頁面之后并不會收錄所有頁面,我們從服務器日志可以看出蜘蛛抓取了哪些頁面,但不一定收錄。搜索引擎分析系統的主要工作就是對網站內容進行檢查,將頁面中的標題、正文、鏈接或廣告等內容進行分析,將重復或者無效頁面分析出來,幫助搜索引擎收錄內容。
三、索引系統
通過下載、存儲和分析系統將網頁抓取之后進行過濾,會將有價值的頁面留下,接下來就會對這個頁面進行索引、分詞,分析詞語在內容中出現的位置、出現的頻率,對頁面內容中的標題和摘要進行記錄。我們常用的site指令就可以查詢到網站收錄的所有內容,收錄一篇內容就增加一條索引項,顯示的快照就是建立索引的時間,而快照更新就是蜘蛛再次訪問抓取后的頁面時對其進行重新索引,因此頁面快照就更新了。
四、檢索系統
這個系統和用戶有非常大的關系,這個系統和用戶可以建立聯系。用戶在瀏覽器中輸入搜索詞,搜索引擎就要對搜索詞進行分詞,得出索引詞,再到索引庫中進行匹配,最后就是搜索結果。根據頁面綜合權重和搜索詞吻合度進行排序,這就是我們所說的排名。