一般百度K站的主要導火線之一就是網站內容重復,也有很多人的并不了解網站內容重復的判斷依據,而且也不清楚如何解決網站內容重復的問題,其實網站內容重復包括很多的方面,今天企億推小編針對幾種常見的情況進行一一介紹,希望可以幫到大家。
一、網站內容重復的情況
1、同樣一篇文章出現多個URL,即使這篇文章屬于原創,也會被百度給予懲罰。
2、網站內容多為采集,這種網站內容重復會被當做采集站直接被百度處理掉,百度新的綠蘿算法就是專門打擊采集站點的。
3、網站的固定版塊出現次數太多,很多網站的右側總是固定放一些版塊或欄目,這些欄目的內容從來不進行更新,或者各個頁面的右側都是前篇一律的內容,就會造成頁面重復度高。
4、未設置404錯誤頁面,當我們刪除某一個頁面的時候,一定要用404狀態碼給予用戶和蜘蛛一定的提示,如果代碼設置錯誤,那么刪除的頁面在蜘蛛那里是假想存在的,由此一來就會多次收錄。
5、動態頁面和靜態并存,百度爬去目錄時收錄了大量動態頁面
6、網站內容以圖片為主,文字很少,很多圖片都是共用一個URL地址,這樣一來蜘蛛在索引的時候很難保證不被重復收錄。
重復內容是指不同的URL鏈接內容卻是相同的,同時收錄多個重復頁面,設置多個頁面進行介紹,但是網頁的大體內容是相同的,這樣處理的方法是錯誤的。
二、重復內容的檢測方法
1、對于檢測一篇文章是否重復內容,title:+文章標題可找出相同的文章。
2、從文中摘取一段話,在百度搜一下,出現大量紅字,表明這篇文章的重復度高
3、站內搜索,可以找到出現多次的內容。
4、利用一些頁面相似度檢查工具,判斷一些相鄰頁面的相似度,80%以上相似度就需要對一些固定欄目進行處理。
三、如何消除重復內容
原創內容的增加
對于網站內容多為采集或簡單偽原創的網站,企贏001建議增加原創文章的內容,寧可百度收錄少一些,也不要讓百度把之前收錄的文章吐出來。
網站固定欄目內容隨機展示
可以根據正文的關鍵詞,隨機調用右側欄目的文章內容,讓每一個頁面都有不一樣的內容,避免大量頁面相似度高的情況出現。
設置404頁面
告知用戶和搜索引擎某些頁面不存在了,防止搜索引擎收錄大量死鏈。
頁面設置獨立的Meta標簽
關鍵詞、標簽、描述,每一個頁面都需要不同,可以采用手動修改,或者根據一定的規則設置。
當你的網站內容重復率并不高的時候,百度是不會惡意對網站進行懲罰,除非競爭對手對網站惡意破壞,為了避免網站被K站的坑,我們需要先檢測網站的重復問題,以免給網站后期的維護帶來不必要的麻煩。