網(wǎng)站不收錄,確實讓很多站長揪心。收錄直接關系著排名,沒有收錄何來排名。但隨著百度算法的不斷更新,百度對于收錄的準則也越來越高。如何做好網(wǎng)站收錄已經(jīng)成為站長很關心的問題。今天,小編為大家談談網(wǎng)站不收錄原因及解決方法。

網(wǎng)站不收錄原因:
一、搜索引擎是否知道頁面的存在
搜索引擎要收錄該頁面,必須知道有這個頁面。如果蜘蛛都不知道頁面,談何收錄?這里主要分為兩點:搜索引擎找不到網(wǎng)頁入口和不讓搜索引擎抓取。
1、搜索引擎找不到頁面入口
很多時候不是你更新了文章搜索引擎就要來抓取收錄的,要怎么讓蜘蛛知道你的更新呢?除了有規(guī)律的更新,可以向百度站長平臺主動提交URL或者是提交站點地圖,也可以讓搜索引擎被動收集,這就是通過外鏈讓蜘蛛知道你的網(wǎng)頁,還有很多時候蜘蛛來到了你的網(wǎng)站,卻找不到你更新的鏈接,因為網(wǎng)站的鏈接結(jié)構(gòu)做得太復雜或是內(nèi)鏈結(jié)構(gòu)差,以致搜索引擎在抓取時間類不會爬到網(wǎng)站深處的頁面,這也造成蜘蛛不知道該頁面的存在。所以不管怎么樣,第一步我們要保證頁面能被蜘蛛看到,關于這一點可以通過查看網(wǎng)站日志來判斷蜘蛛是否來訪過。
2.不讓搜索引擎抓取
很多網(wǎng)站有意無意的直接在robots文件屏蔽了百度或網(wǎng)站部分頁面,卻整天在找原因為什么蜘蛛不來抓取我的頁面,這能怪百度嗎?你都不讓別人進門了,百度是怎么收錄你的網(wǎng)頁?所以有必要時常去檢查一下網(wǎng)站robots文件是否正常。
二、蜘蛛是否正常抓取
1、網(wǎng)站正常訪問
都知道,蜘蛛抓取頁面要從域名到DNS服務器再到網(wǎng)站空間,所以其中任何一個環(huán)節(jié)出現(xiàn)問題,蜘蛛都不能正常的抓取,首先域名需要備案,然后域名解析要正常,如果解析出現(xiàn)問題,域名是不能訪問網(wǎng)站ip地址的,這個時候網(wǎng)站打不開,蜘蛛抓取不了頁面。
2、服務器穩(wěn)定
如果服務器比較卡或者不穩(wěn)定,會直接影響蜘蛛抓取,蜘蛛不能很好的去抓取頁面或由于加載慢只抓取到網(wǎng)頁一半,這就很大程度上影響了網(wǎng)站的收錄。
三、蜘蛛收錄標準是否達到
1、行業(yè)不同標準也不同
這個是顯而易見的,新聞類網(wǎng)站肯定比一般企業(yè)站容易收錄,而對于醫(yī)療、博彩、成人用品等網(wǎng)站,標準肯定是更加嚴格,所以對于不同的行業(yè),百度給予的收錄標準也是不一樣的。
2、不同的網(wǎng)站標準不同
百度有一個優(yōu)先抓取的原則,對于絕大多數(shù)用戶喜歡,權(quán)重高的網(wǎng)站收錄得要快,就像新浪網(wǎng)、騰訊網(wǎng)收錄得肯定要比一般網(wǎng)站要快,為什么?因為信任,這類網(wǎng)站本身就有其嚴格的過濾系統(tǒng),在此類網(wǎng)站公布的內(nèi)容百度基本是直接抓了就收,搜索引擎是互聯(lián)網(wǎng)與用戶的橋梁,它的目的就是給用戶提供有價值的內(nèi)容,你能為它提供良好的內(nèi)容,它當然也會對你更好,這是互利的。所以搜索引擎不是做慈善,你的網(wǎng)站能給它什么?
3、內(nèi)容的質(zhì)量度
蜘蛛爬行頻繁,就不收錄,或者收錄了隔幾天查看又沒收錄。主要有兩點:一是網(wǎng)站內(nèi)容大量采集或者是提供無任何價值內(nèi)容,二是網(wǎng)站還處于新站,百度對其有個考核期,收錄較慢。
網(wǎng)站不收錄解決方法:
一、分析網(wǎng)站日志,看是否有被蜘蛛爬過
1、如果頁面未被蜘蛛爬行
頁面未被Baiduspider爬行,那么你可以適當?shù)慕o該頁面做一些外鏈來引導蜘蛛過來爬行,也可以給搜索引擎提交該頁面。那么我們就可以進行以下操作:

2、頁面爬行了未收錄
當頁面長時間都不被百度收錄的話,那么就要適當?shù)慕o該頁面增加一些附加價值或者對該頁面進行重新的進行修改。你可以對文本新增一些圖片,視頻或者內(nèi)容,也可以對標題進行再次編輯??傊?,要讓Baiduspider再次過來爬行的時候,返回的狀態(tài)碼不是一個無變化的狀態(tài)嗎,這樣你的頁面被收錄的幾率就大大的提升了。
二、檢查robots設置,看是否主動屏蔽蜘蛛
Robots的設置也是非常重要的,這個很多人可能對這些還不了解。大家可看這篇文章《》,這里面有詳細的教程說明,我就不再啰嗦了。若是自己robots設置的問題,那么自己進行糾正后,再在百度站長工具后臺里面進行更新robots這樣的話好讓百度蜘蛛重新更改狀態(tài)。
三、頁面是否存在敏感詞匯
如今,很多詞對搜索引擎來說都有一定的敏感,敏感詞很有可能造成你的頁面不被收錄,有時候也會造成網(wǎng)站被將去或被k。所以站長們再建設內(nèi)容的時候一定要注意不要在文中出現(xiàn)敏感詞。
四、頁面內(nèi)容是否存在采集及無價值內(nèi)容
百度在算法中明確表明,過多的采集會被百度認為是垃圾站。建議,提交些有價值、以用戶需求為目的的內(nèi)容。

![]()
本單位代理的域名注冊服務機構(gòu)名稱:商中在線科技股份有限公司、北京新網(wǎng)數(shù)碼信息技術(shù)有限公司
?2002-2019 Oriental Century All Rights Reserved. 版權(quán)所有:成都世紀東方網(wǎng)絡通信有限公司
《中華人民共和國增值電信業(yè)務經(jīng)營許可證》ISP證編號:B1-20181050 蜀ICP備07500933號 營業(yè)執(zhí)照 公安備案:51019001000101