網(wǎng)站文章不收錄的原因分析和解決方式介紹
來源:wzbailong.cn | 更新時間:2018/10/31 17:31:18
網(wǎng)站文章的收錄情況是我們日常判斷網(wǎng)站的質量好壞的重要因素之一,許多SEOer會比較關注這一塊,有時候出現(xiàn)網(wǎng)站文章不收錄的時候,就會比較著急,那么是哪些因素導致網(wǎng)站文章不收錄呢?下面就一起來找找原因,同時分析分析一些實用性強的解決方式法。
一、網(wǎng)站是一個全新的站
一個全新的網(wǎng)站對于搜索引擎來說信任度還很低,文章收錄率比較低這是正?,F(xiàn)象,原因是網(wǎng)站并沒有在搜索引擎獲得足夠的綜合頁面評分數(shù),所以大部分新站只是收錄了首頁,或一兩個內頁鏈接。一般搜索引擎在新站停留時間不會很久的。
建議解決方法
1、建議把網(wǎng)站首頁和內頁進行發(fā)布一下外鏈,吸引蜘蛛來抓取,以此來增加百度蜘蛛在網(wǎng)站的停留時間的目的
2、到百度站長平臺提交鏈接,為百度蜘蛛提供爬取通道入口
二、網(wǎng)站的文章基本上是采集復制過來的
網(wǎng)站的文章大部分是采集復制過來的,導致網(wǎng)站文章不收錄或者收錄率極低,該怎么增加網(wǎng)站的收錄呢?這種情況目前在互聯(lián)網(wǎng)上情況最多的,情況基本出于你網(wǎng)站沒有得到搜索引擎的信任,沒有新鮮內容的支撐。反之,有些網(wǎng)站即使偽原創(chuàng)也可以達到秒收,那也是該網(wǎng)站已經(jīng)得到搜索引擎很高的信任度了。面對大部分網(wǎng)站是采集或者偽原創(chuàng),而相對都比較渴望得到解決方法,而往往都沒有真正的被解決!下面這幾種方法會為你解決這個問題
建議解決方法
1、通過百度站點工具主動推送和外鏈發(fā)布吸引百度蜘蛛來網(wǎng)站抓取文章,如果過了一兩天都還沒收錄,可以通過網(wǎng)站日記查看百度蜘蛛是否有在抓取這條連接,如果有在抓取連接,但是就是不收錄,那么就要進行下一步計劃了。
2、修改標題以及內容正文的開頭部分,沒錯,進行修改一下這篇文章的標題以及內容,baiduspider有在抓取這條頁面連接但是就是不收錄,說明這篇文章重復率相似度很高,搜索引擎索引庫已經(jīng)存有大量同樣/相似的文章,沒有必要再去收錄了。通過修改文章標題以及內容這是很有效的辦法,如果還不收錄再繼續(xù)修改一下正文的內容,這樣收錄將有很大的提升。
3、在各種不同的平臺,多發(fā)布幾次外鏈,并在底部填寫該頁面的鏈接,對該頁面也有一定增加收錄的。
4、重新更新制作一個sitemap文件,把網(wǎng)站的鏈接全部提交百度站長平臺的鏈接提交選項進行提交。
三、網(wǎng)站更新文章的基本上都是過時過期的文章,老生常談之內容。
有些網(wǎng)站更新的文章都是一些過期過時的、老生常談的內容,搜索引擎都不知道過濾N遍了,居然在你網(wǎng)站又出來,然后結果肯定是悄悄地來,輕輕地走。所以即使采集也要采集一些新鮮內容,這樣收錄率才會有所提升。到了這里,可能有些SEOER會問我,SEO文章不就是那幾篇文章寫來寫去嗎?那你告訴我什么是新鮮內容。我只想說,你不去創(chuàng)新,永遠都是采集來的文章,那為什么別人又可以創(chuàng)作新鮮的內容呢?
建議解決方法
1、多去一些問答平臺,交流論壇去走動,看看他們交流的一些核心問題還有什么是沒有解決的?然后你通過各種資源、人脈、網(wǎng)絡整理出一個新穎的文章。
2、給網(wǎng)站寫一些獨特軟文、故事式軟文,增加網(wǎng)站的新鮮血液,提升網(wǎng)站的原創(chuàng)性對網(wǎng)站的收錄率有很大的提升。
四、文章內容出現(xiàn)敏感詞,百度蜘蛛排斥
寫文章盡量使用一些規(guī)范的語句來描述,不要弄一些用戶無法看懂,百度蜘蛛無法識別繁字體,特別是一些百度和論壇都屏蔽的語句,也許是文章內容存有敏感詞而導致文章不收錄索引呢!雖然這種情況存在幾率較小,但是還是有一定的幾率存在的。
建議解決方法
1、在不收錄的頁面自行檢查是否存在敏感詞,也可以在百度搜索敏感詞在線檢測工具進行檢測,把一些存有敏感詞的語句去掉。
五、網(wǎng)站文章更新的是原創(chuàng)文章,但還是不收錄或者收錄較慢
如果出現(xiàn)這種情況,是因為網(wǎng)站在搜索引擎的索引庫頁面綜合評分不是高,搜索引擎對網(wǎng)站的青睞度是很低的。
建議解決方法
1、更新一些新鮮內容,不要更新的一些文章是二次制作,過時過期、老生常談的文章內容。
2、為網(wǎng)站多制作一些鏈接爬取通道,比如多交換幾條友鏈,各平臺外鏈的發(fā)布,誘引蜘蛛來網(wǎng)站抓取鏈接。
3、對網(wǎng)站進行整站優(yōu)化,提升網(wǎng)站的綜合評分,百度蜘蛛不來收錄,有很大的因素是因為網(wǎng)站的綜合評分不高,這時候要把網(wǎng)站綜合評分提高,比如把一些不參與排名的頁面鏈接用nofollow(不跟隨)標簽掉,并更新一些高質量的文章,吸引更多用戶來網(wǎng)站瀏覽,把控好頁面的跳出率,盡量原創(chuàng)最好。但是低質量的原創(chuàng)文章還是不要更新,什么是低質量的文章?寫的文章網(wǎng)絡觀點千篇一律,只是稍微換種說法,二次創(chuàng)作罷了,百度搜索切詞技術還是挺強大,還是能夠檢測出來的。
六、頻繁修改標題和網(wǎng)站結構以及網(wǎng)站標簽也會影響收錄
網(wǎng)站頻繁改動標題對于網(wǎng)站優(yōu)化來說是大忌,網(wǎng)站如果經(jīng)常修改標題和網(wǎng)站結構及標簽,會被搜索引擎重新拉入觀察室,重新對網(wǎng)站進行考察以及排名排序,不僅降低搜索引擎對網(wǎng)站信任度,甚至還有可能引發(fā)降權的跡象,而且對網(wǎng)站的收錄也有一定阻礙,百度快照日期也不會更新。
建議解決方法
1、到百度服務中心/快照更新投訴到百度中心審核,進行百度快照申訴更新,可以加快快照的更新速度。
2、多更新幾篇高質量原創(chuàng)內容進行恢復排名,百度快照和排名會有所恢復。
可能導致百度搜索引擎不收錄文章的其他因素
七、robots文件禁止搜索引擎抓取
是否在最近有動過robots文件設置,不小心把文章html的鏈接都禁止爬取了,到百度站長平臺進行檢查一番,如果存在有異常,直接到后臺修改回來即可!
八、網(wǎng)站存在大量404、503沒有進行處理,影響頁面索引
如果網(wǎng)站存有大量404、503錯誤頁面,會導致搜索引擎很難抓取頁面的,對于搜索引擎來說,你網(wǎng)站的內容價值和鏈接數(shù)量決定搜索引擎在你網(wǎng)站的停留時長,而且存于大量死鏈對網(wǎng)站的綜合評分也會有所降低的,所以一定要及時地去處理好死鏈。
建議解決方法
可以利用一些死鏈檢測工具來為網(wǎng)站檢測,比如:xenu、愛站工具等去檢測死鏈,然而把死鏈連接放在txt格式文件,上傳到網(wǎng)站根目錄,最后到百度站長平臺死鏈提交選項,把死鏈文件提交上去等待就可以了。
九、網(wǎng)站優(yōu)化過度,網(wǎng)站降權引起的百度不收錄
網(wǎng)站無論優(yōu)化過度還是出現(xiàn)降權了,都是導致百度蜘蛛不收錄頁面的,這時候需要自己分析最近幾天對網(wǎng)站做了什么,是否不小心導致優(yōu)化過度了,或者做了一些令搜索引擎排斥的事情,思考分析一下,找出原因并修改回來就可以了。
十、頻繁在主動推送提交未收錄頁面
文章編輯發(fā)布后,一般人都會去百度站長平臺提交鏈接或者主動推送鏈接,這本來是好事,但是你看著文章提交鏈接好幾天了還不收錄,于是你每天都去提交一篇這條鏈接,甚至有些還是提交幾次來著,咬著牙說,看你還不收錄。但是往往你越是這樣,網(wǎng)站對收索引擎信任度越低。我們知道網(wǎng)站內容頁收錄,涉及到搜索引擎最基本的原理,那就是爬行,抓取,建立索引,收錄等過程,這原本是搜索引擎來網(wǎng)站抓取主動行為啊,你要明白,百度提供提交鏈接入口,主要原因是維護原創(chuàng)的利益,讓SEO優(yōu)化的人員編輯文章發(fā)布后,第一時間提交鏈接為搜索引擎提供爬取入口來網(wǎng)站抓取,防止被其他人抄襲。但是站長們完全搞混了當初百度建立主動推送的真正意義。
建議解決方法
原創(chuàng)文章編輯發(fā)布后,使用主動推送入口最后,更快能讓搜索引擎來抓取網(wǎng)站文章鏈接,但是你提交鏈接后就不要再提交了,可以通過日記分析搜索引擎有沒有來網(wǎng)站抓取該鏈接,如果抓取了,但還是沒有收錄,這時候你不要再去推送鏈接,可以適當?shù)厝バ薷囊幌挛恼碌臉祟}及內容,也有可能是你文章標題在互聯(lián)網(wǎng)上已經(jīng)存在一模一樣的,或者文章已經(jīng)存在千篇一律,適當?shù)厝バ薷哪軌蚴顾阉饕娓玫氖珍洝?/span>
十一、服務器問題
若是服務器響應速度慢,經(jīng)常會出現(xiàn)打不開,那么百度蜘蛛來網(wǎng)站抓取頁面就會收到阻礙。從所周知,搜索引擎來網(wǎng)站抓取頁面的時間是有限制的,當然網(wǎng)站權重越高,抓取頁面時間越長。如果導致大量服務器訪問速度穩(wěn)慢的因素存在,或者主機空間是國外或者是香港主機,那么就會導致搜索引擎來網(wǎng)站抓取頁面的速度沒有達到最佳效果,也許沒有抓取幾個頁面,搜索引擎就離開了網(wǎng)站了。
建議解決方法
1、建議購買國內備案主機服務器,一個網(wǎng)站想要長期發(fā)展,好的服務器是必須具備的,無論是對用戶訪問還是對搜索引擎抓取頁面好處還是很顯然的。
2、利用好robots文件,也能讓搜索引擎很好的抓取頁面,把一些不參與排名和無需抓取的頁面Disallow掉,讓搜索引擎不必在不重要的頁面徘徊抓取,讓搜索引擎放在重要的頁面抓取,省掉不必要的抓取時間。
3、減少HTTP請求提高網(wǎng)站的訪問速度,盡可能的減少頁面中非必要的元素,一般由圖片、form、flash等等元素都會發(fā)出HTTP請求,合并腳本和CSS文件可以使網(wǎng)站減少HTTP請求。
4、網(wǎng)站避免出現(xiàn)過量的死鏈,也會使搜索引擎重復抓取死鏈浪費抓取配額時間,從而影響網(wǎng)站收錄,而且大量出現(xiàn)死鏈會降低網(wǎng)站的綜合評分,所以及時的發(fā)現(xiàn)死鏈并處理掉就變得尤其重要。
網(wǎng)站文章不收錄不要慌,按照以上的步驟檢查和優(yōu)化好相應的設置和內容,網(wǎng)站文章的收錄量一定不會差,
SEO優(yōu)化推廣需要時間和耐心來堅持最終才會有好的效果,任何不按照正規(guī)的操作方式來實現(xiàn)的排名效果
最終都會前功盡棄,富海360標準的SEO網(wǎng)站系統(tǒng)6年多時間以來一直堅持以正規(guī)的操作方式來實現(xiàn)搜索引擎
的排名效果,所以效果一直很穩(wěn)定,找專業(yè)靠譜的項目產(chǎn)品就找富海360