作為用戶的我們,在打開網(wǎng)站的時候,偶爾會打不開,為什么會出現(xiàn)這種狀況呢?
合肥網(wǎng)絡(luò)公司為您解答,不可不說的網(wǎng)站解析。
百度蜘蛛抓取建庫,你的網(wǎng)站錯過了什么?這些都需要站長朋友們在工作以及與百度進行相關(guān)調(diào)整的時候,進行全面的了解與改善。
1,有時候網(wǎng)站網(wǎng)頁自身不大,但為何會出現(xiàn)解析不出來的現(xiàn)象呢?
例如趕集、58這些網(wǎng)站頁面的量很大,是沒有問題的。試想一下,你每次在頁面之間follow出新的鏈接,試圖把后面的參數(shù)去掉都不會受到任何影響的,網(wǎng)站頁面正常訪問都沒有問題。如果出現(xiàn)相反的情況,就會適得其反,出現(xiàn)相關(guān)問題。
2,對于蜘蛛而言,關(guān)于URL的長度是有限制要求的,那關(guān)于目錄名的長度是否同樣有要求呢?
事實上是沒有要求的,因為在我們正常使用連接的情況是從www到結(jié)束,其中中間字節(jié)不能超過1024個。
3,在同一個網(wǎng)站范圍內(nèi),如果出現(xiàn)這種在內(nèi)容一樣,但其排版結(jié)構(gòu)是不一樣的,這是算重復(fù)嗎?
是的,重復(fù)無論是文字還是在排版方面,關(guān)鍵看文字,內(nèi)容相同,就肯定是重復(fù)。
4,如果在整版都是Flash的情況下,為了不影響美觀,我將其某些欄目或者是更新的最新內(nèi)容隱藏。但需要把它提取出來的時候,是否可以使用CSS或者是hidden屬性?
CSS是完全提取不出來的,hidden可以提出,但是對于是注釋這種形式的就不會去理會。
5,作為站長偶爾會看到關(guān)于這樣的注釋:頁面大小不超過一兆,這種情況下,是指頁面需要壓縮嗎?
此時我們需要了解的是在頁面壓縮以后的情況,最好不要超過1兆,方便傳播與存儲。
6,對于長久未更新的網(wǎng)站,網(wǎng)站信息已是很久之前的,但在搜索的時候,網(wǎng)頁返回的是200,為什么會受到懲罰呢?
互聯(lián)網(wǎng)世界是信息更新速度非常快的,如果用戶搜索的信息,導(dǎo)流到你的網(wǎng)站的時候,對用戶的作用不大,自然不會受到百度蜘蛛的青睞。
7,圖文傳播的形式,方便用戶了解,但是僅僅在頁面中放置一張圖片,以及相關(guān)的文字,對于百度而言,是否會喜歡呢?
最好是不要使用。蜘蛛一般抓取的通過文字的形式進行篩選,如果長期搜索的是圖片,那么會認(rèn)為是內(nèi)容死鏈,分析不出來的話,網(wǎng)站就會受到影響。
8,無論是糯米還是現(xiàn)在支付寶更新的團購功能,但猝不防及的時候,會瀏覽到過期團購的消息,這樣的頁面會受到懲罰嗎?
此種頁面如果用戶的點擊量特別大的情況下,就會出現(xiàn)與上面所說的內(nèi)容死鏈,如果分析不出來的話,會出現(xiàn)相關(guān)問題。
9,一般資訊頁面時,是發(fā)布時間好還是不需要出現(xiàn)時間呢?又或者在評論解答頁面的情況下,評論的時間重要嗎?
蜘蛛在抓取頁面的時候,是根據(jù)抓取時間來進行判斷的。相對于評論時間而言,百度更加注重的是主題內(nèi)容的時間。
10,靜態(tài)與動態(tài)的URL區(qū)別會很大嗎?出現(xiàn)在產(chǎn)品平臺頁面情況下,關(guān)于型號與顏色發(fā)生不一致的情況下,例如型號發(fā)生改變,但是顏色還是一樣的,這樣對于蜘蛛而言,會認(rèn)為是重復(fù)的情況嗎?
無論是靜態(tài)還是動態(tài)URL,在百度認(rèn)為都是一樣的,都可以識別出來。
關(guān)于型號與顏色之間之于百度的收錄,如果其結(jié)構(gòu)形態(tài)發(fā)生變化的話,是不會認(rèn)為是重復(fù)的現(xiàn)象。例如第三點中說到的,如果你在產(chǎn)品介紹中,內(nèi)容出現(xiàn)重復(fù)的話,會認(rèn)為是重復(fù)問題。所以細節(jié)很重要。