1.索引處理抓取網頁后,由分析索引系統程序對收集回來的網頁進行分析,提取相關信息(包括網頁所在URL、編碼類型、頁面內容包含的所有關鍵詞、關鍵詞的位置、生成時間、大小、與其他網頁的鏈接關系等),根據一定的相關度算法進行大量復雜的計算,得到每一個網頁針對頁面文字及超鏈中每一個關鍵詞的相關度(或重要性),然后用這些信息建立網頁索引數據庫。任何搜索引擎在進行內容索引的時候都是以文字為基礎的。搜索引擎在抓取頁面的時候,并非只訪問用戶能看到的文字信息,還包含大量的HTML代碼、CSS代碼、JavaScript代碼等對排名沒有作用的內容。抓取頁面之后,搜索引擎就要處理這些信息,從HTML代碼中分離出標簽、代碼,提取有利于
網站排名處理的頁面文字內容。
2.爬行抓取爬行抓取是搜索引擎工作的靠前步,主要完成數據收集工。搜索引擎蜘蛛程序通過網頁的鏈接地址來尋找網頁,從網站的某一個頁面(通常是首頁)開始,讀取網頁的內容,找到網頁中的其他鏈接地址,然后通過這些鏈接地址尋找下一個網頁,一直這樣循環下去,直到把這個網站的所有網頁都抓取為止。如果網站的內容質量不高或者有大量重復信息,蜘蛛程序就沒有“耐心”抓取網站里的所有信息了。如果把整個互聯網當成一個網站,那么蜘蛛程序就可以用這個原理把互聯網上所有的網頁都抓取下來。但是,在實際的工作中,搜索引擎蜘蛛程序是不能抓取所有的互聯網信息的,畢竟蜘蛛程序的帶寬資源、時間都不是無限的,它不可能“爬”到所有的頁面。受到這些因素的制約,搜索引擎只能爬行和收錄互聯網信息的一小部分。
3.排名建立網頁索引數據庫后,當用戶輸入關鍵詞并進行搜索時,搜索系統程序會從網頁索引數據庫中找到符合該關鍵詞的所有相關網頁。因為所有相關網頁針對該關鍵詞的相關度早已算好,所以只需按照相關度數值排序,相關度越高,排名越靠前。
一:優化過度 首先要檢查網站是否會有任何的關鍵詞堆積?是否為了加內部鏈接而導致描文字鏈接過度集中?是否頁腳出現對用戶毫無意義,只為增加搜索引擎友好度而準備的鏈接和文字?是否為
seo工作而短時間內突增或突減外鏈?過度的優化往往是關鍵詞全面下降的罪魁禍首,搜索引擎一直以來都比較注重“自然”而成,在優化工作的過程中,我們一定要掌握好這個“度”。凡事都有一個過程,所謂:欲速則不達。
二:搜索引擎算法的改變 如果沒有對網站進行修改,并且一直以來都是正常的進行優化工作,但卻遇到網站排名的下降,我們也沒必要直接去懷疑自己工作的努力與付出。先觀察一段時間再說,因為排名的下降不一定就是網站自身的問題,搜索引擎不斷改變算法,有時推出新算法,過了幾天又改回去了。一遇到排名的波動網站就進行修改,反倒會引起搜索引擎特點注意,這是一個刻意優化的網站。
三:服務器的不穩定 服務器的不穩定也是致使網站受罰的重要因素之一。搜索引擎爬蟲每天都會不定時的到訪網站抓取頁面信息,如果服務器的不穩定,搜索引擎的到訪無法打開網站,經常性都是這樣,那么必然會降低搜索引擎對網站的友好度,從而降低網站權重,網站也會因此而受到搜索引擎的懲罰。所以在選擇購買服務器的時候,不要以價格去衡量,盡可能選擇信譽好的供應商。
四:檢查可疑鏈接 網站受到懲罰有時候會因為一些垃圾外鏈而牽連,所以在網站受到懲罰時,要盡可能的找出可疑鏈接進行刪除,通常包括:
1:大量的友情鏈接交換;
2:指向一些垃圾網站的鏈接;
3:頁腳上出現的只為搜索引擎準備的內部鏈接;
4:自己網站的大量交叉鏈接;
5:與網站主題內容無關的導出鏈接等。 這些看似不算嚴重作弊,但卻與其他有作弊嫌疑的手法加起來,就可能使網站作弊分值達到被懲罰門檻。
五:檢查是否存在太多重復內容 網站的內容不可以過多的轉載或抄襲,網站內容是否具有原創性與可讀性,直接影響著讀者對網站的評價,以及搜索引擎對網站排名的根據。如果網站從一開始就是以轉載、抄襲為主,那么被懲罰也是在所難免的。加強原創內容是一個網站剛開始時必不可少的過程。 網站受搜索引擎懲罰的因素很多,以上只是比較常見的幾種。SEO工作者常弄不清網站為什么被懲罰了,哪怕就算是知道什么原因被懲罰了,處理了所有的作弊行為,也未必就能夠恢復原來的排名。:優化過度 首先要檢查網站是否會有任何的關鍵詞堆積?是否為了加內部鏈接而導致描文字鏈接過度集中?是否頁腳出現對用戶毫無意義,只為增加搜索引擎友好度而準備的鏈接和文字?是否為SEO工作而短時間內突增或突減外鏈?過度的優化往往是關鍵詞全面下降的罪魁禍首,搜索引擎一直以來都比較注重“自然”而成,在優化工作的過程中,我們一定要掌握好這個“度”。凡事都有一個過程,所謂:欲速則不達。二:搜索引擎算法的改變 如果沒有對網站進行修改,并且一直以來都是正常的進行優化工作,但卻遇到網站排名的下降,我們也沒必要直接去懷疑自己工作的努力與付出。先觀察一段時間再說,因為排名的下降不一定就是網站自身的問題,搜索引擎不斷改變算法,有時推出新算法,過了幾天又改回去了。一遇到排名的波動網站就進行修改,反倒會引起搜索引擎特點注意,這是一個刻意優化的網站。三:服務器的不穩定 服務器的不穩定也是致使網站受罰的重要因素之一。搜索引擎爬蟲每天都會不定時的到訪網站抓取頁面信息,如果服務器的不穩定,搜索引擎的到訪無法打開網站,經常性都是這樣,那么必然會降低搜索引擎對網站的友好度,從而降低網站權重,網站也會因此而受到搜索引擎的懲罰。所以在選擇購買服務器的時候,不要以價格去衡量,盡可能選擇信譽好的供應商。