關(guān)鍵詞是網(wǎng)站優(yōu)化的核心概念之一。在網(wǎng)站優(yōu)化實踐中,圍繞關(guān)鍵詞進(jìn)行了大量的工作。本文試圖從搜索技術(shù)原理與網(wǎng)站優(yōu)化實踐相結(jié)合的角度,總結(jié)SEO內(nèi)容頁關(guān)鍵詞布局的具體登陸方法
1.網(wǎng)站優(yōu)化內(nèi)容頁的關(guān)鍵詞應(yīng)該如何布局。介紹搜索引擎的技術(shù)原理
搜索引擎的核心底層技術(shù)是將用戶的查詢詞切割成自然語言中有意義的短語,然后從索引數(shù)據(jù)庫中找到包含全部或部分短語的內(nèi)容并返回結(jié)果
正常的搜索思維是提取關(guān)鍵字并找出內(nèi)容是否包含關(guān)鍵字。假設(shè)您要從序列號為1-10的10個頁面中搜索包含“關(guān)鍵字布局”的頁面。在10頁全文中搜索“關(guān)鍵字布局”一詞,并返回包含該詞的頁面序列號。但是,如果你必須搜索數(shù)百萬頁,速度會非常慢,所以我們發(fā)明了反向索引的想法。(下圖中的數(shù)據(jù)不是實際數(shù)據(jù),僅供說明)
僅此一點不足以對搜索結(jié)果進(jìn)行排序。不,關(guān)鍵字出現(xiàn)在網(wǎng)頁上的次數(shù)越多,它就越能代表網(wǎng)頁的特征。前提是過濾掉停止詞(停止詞幾乎是每個網(wǎng)頁上的詞,但不能表達(dá)任何特定的含義,如“de”、“yes”、“Le”等)。如果我們可以將網(wǎng)頁中出現(xiàn)的關(guān)鍵字的頻率信息添加到反向索引表(縮寫:wordfrequencytf),我們就可以對網(wǎng)頁進(jìn)行排序。如下圖所示:當(dāng)我們的查詢詞分為“關(guān)鍵字1”和“關(guān)鍵字2”時,相關(guān)頁面可以按照(3,5,1,2)進(jìn)行排序;假設(shè)我有兩個頁面1和2。倒排指標(biāo)信息如下:
我們搜索“如何布局關(guān)鍵字”,搜索關(guān)鍵字為“關(guān)鍵字”、“如何”和“布局”。其中,“關(guān)鍵字”、“方式”和“布局”出現(xiàn)兩次,分別在頁面上出現(xiàn)兩次和兩次,共6次;在第二頁上,“如何”和“布局”出現(xiàn)了七次。根據(jù)上述邏輯,搜索結(jié)果的最終排名為(2,1),這顯然不是一個理想的排名結(jié)果。第2頁的主題顯然是關(guān)于“如何布局”。此時,有必要引入反向文檔頻率索引(IDF)來解決這個問題
關(guān)鍵字位置信息也是一個關(guān)鍵點。一般認(rèn)為,標(biāo)題中的關(guān)鍵詞比文本中的相同關(guān)鍵詞更能反映網(wǎng)頁的主題特征。這就是為什么H標(biāo)簽如此重要。搜索引擎還可以根據(jù)代碼布局和噪聲比(如停止詞的頻率)確定導(dǎo)航、文本、側(cè)欄等的位置。將位置信息標(biāo)記在倒排索引列表中,參與排序決策
此外,還有其他常用的技術(shù)方法,如:兩詞索引/短語索引,“如何布局關(guān)鍵詞”不需要分為三個短詞,但也可以分為“關(guān)鍵詞布局”、“如何布局”、“如何布局”等;結(jié)合查找相關(guān)單詞,如“關(guān)鍵字”的“關(guān)鍵字”和“如何”以及“關(guān)鍵字”的“如何”;當(dāng)然,在實踐中,大型現(xiàn)代搜索引擎的反向索引模型要復(fù)雜得多,還有許多其他因素(關(guān)鍵因素之一是超鏈接分析)涉及排序算法。這些算法在空間和作者級別受到限制,因此無法縮放
如何放置關(guān)鍵字
標(biāo)題中必須有關(guān)鍵字,但不可能有完整的問題
由于搜索引擎會將查詢詞分為n個以上的單詞、雙單詞和短語,并添加相關(guān)單詞將查詢合并到查詢中,標(biāo)題中的關(guān)鍵字不一定是完整的問題,通常是“哪個公司更適合做XXX”。標(biāo)題不一定需要完整的單詞。即使標(biāo)題包含完整的句子,也與任何其他完整的句子不匹配。一個高質(zhì)量的網(wǎng)頁通常可以匹配數(shù)百個長尾關(guān)鍵字。顯然,標(biāo)題不能包含所有這些內(nèi)容。標(biāo)題的另一個重要作用是吸引點擊率,這也是排名的一個因素。但核心詞“XXX”、“good”和“company”必須出現(xiàn)。