2013-07-26
百度lee:網頁臨時性打不開建議用503。503等同于告訴spider該頁面臨時訪問不了,過段時間再來。如果網頁已恢復,即刻正常抓??;但如果該頁面長時間返回503,該url仍會被認作失效鏈接,從索引庫中刪除。頁面永遠無法打開才建議用404,或登錄百度站長平臺提交死鏈sitemap。
404狀態碼代表‘Not Found’,spider更新時會認為該頁面已失效,此時呢將在索引庫中刪除,短期內spider再次發現該url不再會抓取。出現網頁打不開的情況有兩種:第一,網頁臨時性打不開;第二,頁面永遠無法打開。
針對第一類問題,我建議不要立刻返回404,而是使用503。503等同于告訴spider該頁面臨時訪問不了,過段時間再來光臨。關于503,spider會認為該網頁臨時無法訪問,短期內會再光臨。如果網頁已經恢復,即刻正常抓取;如果繼續返回503,短期內還會再光臨幾次,但如果該頁面長時間返回503,該url仍會被認作失效鏈接,從索引庫中刪除。針對第二類問題,永遠無法打開的頁面,404,不用考慮。各種web2類頁面刪除后同樣需要返回404告知搜索引擎該頁面已失效。
對于已經刪除內容的頁面,最恰當的處理方法是:
1、直接做死鏈處理并返回404;
2、在百度站長平臺死鏈提交工具中提交死鏈sitemap。
提醒一下各位站長朋友,當您的網站存在被發布大量垃圾信息時,請:
1、及時刪除相關垃圾頁面,并做404處理;
2、制作符合要求的死鏈sitemap;
3、登錄百度站長平臺,進入死鏈提交工具提交死鏈sitemap。