網站seo內容頁關鍵詞布局是SEO的核心概念之一,SEO實踐中很多工作都圍繞關鍵詞開展。本文嘗試從搜索技術原理和網站優化實踐結合,總結內容頁關鍵詞布局在SEO中的具體落地方法。
搜索引擎最核心的底層技術基礎是將用戶查詢詞切分成自然語言中有意義的詞組,然后從索引庫找到包含這些詞組中全部或部分關鍵詞的內容,返回結果。
正常人的搜索思路是帶著關鍵詞,去查找內容中是否包含該關鍵詞。假設要從序號1-10的10個網頁查找包含“關鍵詞布局”的網頁,分別去這10個網頁中全文搜索是否包含“關鍵詞布局”這個詞,然后返回包含該詞的網頁的序號。但如果是從百萬、千萬個網頁中查找呢,速度就很慢了,于是就發明了倒排索引的概念。(以下圖中數據皆非實際數據,僅作示意)
如上圖示,為一個最簡單的倒排索引模型(DocID是搜索引擎為所抓取網頁分配的較早編號)。搜索引擎爬蟲每次抓取一個網頁的時候,就把網頁切分成若干個詞組,將這些詞一一與倒排索引表比對:如果倒排索引表的“關鍵詞”一列有這個詞,就在其對應的倒排列表中增加當前網頁的編號DocID;如果沒有,就增加一行(涉及到新詞識別,此處不展開),給這個關鍵詞分配一個ID,再寫入當前網頁的編號。這樣,當我們查詢“關鍵詞1”的時候,很快就能知道相關的網頁有(1,2,3,5)。復雜一些的查詢詞假設被切分成“關鍵詞1”、“關鍵詞3”、“關鍵詞6”這3個詞,也能快速查詢到相關網頁有(1,2,3,5,6,7,9)。
僅僅這樣,還不足以對搜索結果進行排序。非作弊的情況下,一個網頁出現某關鍵詞次數越多,該關鍵詞越能代表此網頁的特征,前提是要過濾停用詞(停用詞就是幾乎每個網頁中都有很多,但不能表達任何具體意義的詞,比如:“的”、“是”、“了”等等)。如果我們能在倒排索引表里面加入關鍵詞在網頁中出現的頻率信息(簡稱:詞頻--TF),就能對網頁進行排序了。如下圖所示:當我們的查詢詞被分詞為“關鍵詞1”、“關鍵詞2”時,就能將相關網頁排序為(3,5,1,2)。
假設現在有兩個網頁1、網頁2,在倒排索引中的信息如下圖:
我們搜索“關鍵詞怎么布局”,搜索詞被分詞為“關鍵詞”、“怎么”、“布局”,其中網頁1中“關鍵詞”、“怎么”、“布局”分別出現2、2、2次,共6次;網頁2中“怎么”、“布局”共出現7次,按照前面的邏輯,最終的搜索結果排序為(2,1),這顯然不是理想的排序結果,網頁2的主題明顯是講“圍棋怎么布局”的。此時需要引入IDF(逆文檔頻率指數)來解決這個問題。
如果一個網頁集合中包含某個關鍵詞的網頁越少,則該關鍵詞具有越好的網頁區分能力,故IDF越大,即具有更高的權重。假設上圖中的“關鍵詞”、“怎么”、“布局”、“圍棋”的IDF分別為2.5、0.3、0.8、3,每個詞的TF乘以IDF后求和,得到網頁1、2的相關性分別為:7.2、4.6,所以搜索“關鍵詞怎么布局”的排序結果為(1,2),就比較符合實際了。
關鍵詞的位置信息也是一個重點,一般認為標題中出現關鍵詞比正文部分出現相同的關鍵詞,更能體現一個網頁的主題特征,H標簽的重要性即在于此。搜索引擎還能夠根據代碼布局和噪音比例(如停用詞出現頻率)來判斷哪里是導航、哪里是正文、哪里是側邊欄等等。在倒排索引列表中會把這些位置信息都標注進去,參與排序決策。
除此之外,還有一些其他的常用技術方法,如:雙詞索引/短語索引,“關鍵詞怎么布局”不一定就是切分為三個短詞,還可能切分成“關鍵詞布局”、“詞怎么”、“怎么布局”等等;關聯詞合并搜索,“關鍵詞”的關聯詞“關鍵字”,“怎么”的關聯詞“如何”等。
當然,實際中現代大型搜索引擎的倒排索引模型會復雜很多,再融入其他諸多因素(一個重點是超鏈分析)參與排序算法,限于篇幅和作者水平有限,不繼續展開了。
1、標題中一定要有關鍵詞,但不一定要完整的疑問句
鑒于搜索引擎會把查詢詞切分為N多的單詞、雙詞、短語,并在查詢時加入關聯詞合并查詢,所以標題中的關鍵詞不一定是完完整整的一個疑問句,一個典型是“做XXXX哪家公司好”。標題中不一定需要這個完整的詞,即使標題中包含了這個完整的短句,也不能匹配其他完整短句,一個優質的網頁往往能匹配成百上千的長尾關鍵詞,顯然一個標題不可能全部包含。標題的另一大作用是吸引點擊,點擊率也是影響排名的一個因素,但其中的“XXXX”、“好”、“公司”這些核心詞一定要出現。
2、正文自然、均勻的分布一些核心詞和切分詞
搜索引擎發展初期,很多技術人員利用TF*IDF算法權重較高的漏洞,大量堆砌關鍵詞,從而快速獲得較好的搜索排名。后來搜素引擎從算法層面修復漏洞打擊作弊,就出現了網絡上流行的“理想關鍵詞密度3%~8%”的觀點。首先,這個密度不是計算完整查詢詞的,而是切分后的詞全部計算,并且實踐中,你會發現有關鍵詞密度稍微低于3%的,也有關鍵詞密度高出8%很多的網頁能夠獲得不錯的排名。
如果你是搜索引擎的工程師,會怎么做?我想我會結合全網的歷史訪問數據(如百度統計、手機百度等都能獲取較全面的訪問數據)和關鍵詞密度信息劃定一個合理范圍和警戒范圍,超出警戒范圍的給予沉默處理,在警戒范圍區間的結合該站點歷史數據和靠前階段的小流量排名的訪問數據反饋,決定是打壓還是維持或給予更高的排名。
相比于關鍵詞密度,我們更應該注重的是語言的通順流暢(一味地強插關鍵詞顯得啰嗦和別扭)和內容的質量深度。畢竟,搜索引擎的排序因素多達成百上千個,也不能顧此失彼。
3、正文下方相關內容和側邊欄推薦適當布局關鍵詞
雖說搜索引擎能夠通過代碼和噪音比例判斷這些不是正文部分,從而降低一些此處關鍵詞的權重,但從百度快照緩存來看,還是有一點作用的。
正文下方和側邊欄的相關內容和推薦內容多是從橫向和縱向兩個角度選取內容。比如本文,主題是關于“關鍵詞布局”,那橫向推送一些“網站結構布局”、“關鍵詞挖掘技巧”等站內優化方面的內容,大概率是有很多訪客感興趣的;縱向推送一些“教你怎么建設高質量的外鏈”、“如何提高著落頁的轉化率”等內容,也是訪客可能暫時抑制的隱性需求。增加了關鍵詞布局的同時,還能提高PV,降低跳出,提升用戶體驗,何樂而不為。
本文由 貴州做網站公司 整理發布,部分圖文來源于互聯網,如有侵權,請聯系我們刪除,謝謝!
這是陽光明媚的一天,互聯網里風平浪靜,一切都是欣欣向榮。我就是在這樣一個平凡的日子里誕生了。我給自己起了個名字叫超,不過我的師哥師姐們都喜歡叫我小超。從出生的那...
網上關于SEO優化的知識很多也很雜,很多新手都不知道如何選擇。本來耗子網站里每篇文章都有的詳細步驟的,考慮到很雜,于是耗子對各種SEO優化基礎知識進行了整理,但...
今天,我給大家講講如何利用電影貼吧引流輕松變現。這個很適合新手。廢話不多說,直接上干貨。每上映一個新片子,只要這個片子有一定的熱度,馬上該片子的貼吧就會出現各種...
近年來,隨著移動設備和互聯網技術的飛速發展,短視頻應用在全球范圍內得到了廣泛的普及和應用。其中,以中國短視頻領域的代表品牌——抖音為例,其所創造的奇跡更是引人注目。那么,抖音是什么時候上線的呢?它是如何從零到一、由小到大、由本土走向全球的呢?下面我們就一起來看看抖音的歷史發展過程。一、2003年:第一款手機視頻應用問世2003年,第一款手機視頻應用“3GPP”問世,開啟了手機視頻時代的序幕。但當時...
隨著互聯網技術的不斷發展,搜索引擎已經成為人們獲取信息、商品和服務的主要渠道。搜索引擎優化(SEO)越來越重要。但是,許多企業在進行SEO優化時,經常遭到PR劫持的攻擊。PR劫持指的是黑客通過篡改網站頁面的PR(PageRank)值,以達到提高其SEO排名的目的。本文將介紹PR劫持的影響以及如何應對這種情況。一、PR劫持對網站排名的影響PR劫持對網站的影響是非常嚴重的。黑客可以通過篡改網站的PR值...
SEO關鍵詞優化是通過優化網站內容,使其能夠更好地被搜索引擎收錄并排名靠前的一種技術。在進行SEO關鍵詞優化時,需要根據網站內容和用戶需求,選取合適的關鍵詞,將其合理地融入到網站中,從而提高網站的曝光率和流量。百度優化關鍵詞的6個技巧:1.選取合適的關鍵詞。關鍵詞需要與網站內容相關且具有搜索量。2.合理分布關鍵詞。將關鍵詞分布在標題、正文、圖片、描述等位置,但不要過度堆砌。3.內容質量要高。網站內...