1. <nobr id="easjo"><address id="easjo"></address></nobr>

      <track id="easjo"><source id="easjo"></source></track>
      1. 
        

      2. <bdo id="easjo"><optgroup id="easjo"></optgroup></bdo>
      3. <track id="easjo"><source id="easjo"><em id="easjo"></em></source></track><option id="easjo"><span id="easjo"><em id="easjo"></em></span></option>
          貴州做網站公司
          貴州做網站公司~專業!靠譜!
          10年網站模板開發經驗,熟悉國內外開源網站程序,包括DEDECMS,WordPress,ZBlog,Discuz! 等網站程序,可為您提供網站建設,網站克隆,仿站,網頁設計,網站制作,網站推廣優化等服務。我們專注高端營銷型網站,企業官網,集團官網,自適應網站,手機網站,網絡營銷,網站優化,網站服務器環境搭建以及托管運維等。為客戶提供一站式網站解決方案?。?!

          什么是搜索引擎蜘蛛抓取份額?

          來源:互聯網轉載 時間:2024-10-12 14:59:25

          顧名思義,抓取份額是搜索引擎蜘蛛花在一個網站上的抓取頁面的總的時間上限。對于特定網站,搜索引擎蜘蛛花在這個網站上的總時間是相對固定的,不會無限制地抓取網站所有頁面。抓取份額的英文Google用的是crawl budget,直譯是爬行預算,我覺得不太能說明是什么意思,所以用抓取份額表達這個概念。抓取份額是由什么決定的呢?這牽扯到抓取需求和抓取速度限制。

          一、抓取需求

          抓取需求,crawl demand,指的是搜索引擎“想”抓取特定網站多少頁面。

          決定抓取需求的主要有兩個因素。一是頁面權重,網站上有多少頁面達到了基本頁面權重,搜索引擎就想抓取多少頁面。二是索引庫里頁面是否太久沒更新了。說到底還是頁面權重,權重高的頁面就不會太久不更新。頁面權重和網站權重又是息息相關的,提高網站權重,就能使搜索引擎愿意多抓取頁面。

          二、抓取速度限制

          搜索引擎蜘蛛不會為了抓取更多頁面,把人家網站服務器拖垮,所以對某個網站都會設定一個抓取速度的上限,crawl rate limit,也就是服務器能承受的上限,在這個速度限制內,蜘蛛抓取不會拖慢服務器、影響用戶訪問。

          服務器反應速度夠快,這個速度限制就上調一點,抓取加快,服務器反應速度下降,速度限制跟著下降,抓取減慢,甚至停止抓取。所以,抓取速度限制是搜索引擎“能”抓取的頁面數。

          四、抓取份額是由什么決定的?

          抓取份額是考慮抓取需求和抓取速度限制兩者之后的結果,也就是搜索引擎“想”抓,同時又“能”抓的頁面數。網站權重高,頁面內容質量高,頁面夠多,服務器速度夠快,抓取份額就大。

          五、小網站沒必要擔心抓取份額

          小網站頁面數少,即使網站權重再低,服務器再慢,每天搜索引擎蜘蛛抓取的再少,通常至少也能抓個幾百頁,十幾天怎么也全站抓取一遍了,所以幾千個頁面的網站根本不用擔心抓取份額的事。數萬個頁面的網站一般也不是什么大事,如果每天幾百個訪問要是能拖慢服務器,seo就不是主要需要考慮的事了,而是怎么優化你的網站,提升服務器配置了。

          六、大中型網站經常需要考慮抓取份額

          幾十萬頁以上的大中型網站,可能要考慮抓取份額夠不夠的問題。抓取份額不夠,比如網站有1千萬頁面,搜索引擎每天只能抓幾萬個頁面,那么把網站抓一遍可能需要幾個月,甚至一年,也可能意味著一些重要頁面沒辦法被抓取,所以也就沒排名,或者重要頁面不能及時被更新。

          要想網站頁面被及時、充分抓取,首先要保證服務器夠快,頁面夠小。如果網站有海量高質量數據,抓取份額將受限于抓取速度,提高頁面速度直接提高抓取速度限制,因而提高抓取份額。

          如下圖某網站百度抓取頻次:

          頁面抓取頻次和抓取時間(取決于服務器速度和頁面大小)沒有什么大關系,說明沒有用完抓取份額,不用擔心。大型網站另一個經常需要考慮抓取份額的原因是,不要把有限的抓取份額浪費在無意義的頁面抓取上,導致應該被抓取的重要頁面卻沒有機會被抓取。

          浪費抓取份額的典型頁面有:

          1. 站內復制內容

          2. 低質、垃圾內容

          3. 日歷之類的無限個頁面

          4. 上面這些頁面被大量抓取,可能用完抓取份額,該抓的頁面卻沒抓。

          怎樣節省抓取份額?

          當然首先是降低頁面文件大小,提高服務器速度,優化數據庫,降低抓取時間。然后,盡量避免上面列出的浪費抓取份額的東西。有的是內容質量問題,有的是網站結構問題,如果是結構問題,最簡單的辦法是robots文件禁止抓取,但多少會浪費些頁面權重,因為權重只進不出。

          某些情況下使用鏈接nofollow屬性可以節省抓取份額。小網站,由于抓取份額用不完,加nofollow是沒有意義的。大網站,nofollow是可以在一定程度上控制權重流動和分配的,精心設計的nofollow會使無意義頁面權重降低,提升重要頁面權重。搜索引擎抓取時會使用一個URL抓取列表,里面待抓URL是按頁面權重排序的,重要頁面權重提升,會先被抓取,無意義頁面權重可能低到搜索引擎不想抓取。

          最后幾個說明:

          鏈接加nofollow不會浪費抓取份額。但在Google是會浪費權重的。

          noindex標簽不能節省抓取份額。搜索引擎要知道頁面上有noindex標簽,就得先抓取這個頁面,所以并不節省抓取份額。

          canonical標簽有時候能節省一點抓取份額。和noindex標簽一樣,搜索引擎要知道頁面上有canonical標簽,就得先抓取這個頁面,所以并不直接節省抓取份額。但有canonical標簽的頁面被抓取頻率經常會降低,所以會節省一點抓取份額。

          抓取速度和抓取份額不是排名因素。但沒被抓取的頁面也談不上排名。

          這是陽光明媚的一天,互聯網里風平浪靜,一切都是欣欣向榮。我就是在這樣一個平凡的日子里誕生了。我給自己起了個名字叫超,不過我的師哥師姐們都喜歡叫我小超。從出生的那...

          網上關于SEO優化的知識很多也很雜,很多新手都不知道如何選擇。本來耗子網站里每篇文章都有的詳細步驟的,考慮到很雜,于是耗子對各種SEO優化基礎知識進行了整理,但...

          今天,我給大家講講如何利用電影貼吧引流輕松變現。這個很適合新手。廢話不多說,直接上干貨。每上映一個新片子,只要這個片子有一定的熱度,馬上該片子的貼吧就會出現各種...

          隨著互聯網的迅速發展,搜索引擎優化已經成為很多網站必不可少的一部分。而在眾多搜索引擎中,百度是中國最大的搜索引擎之一,而百度綠蘿算法則是其主要的搜索算法之一。本文將深入探討百度綠蘿算法對于網站的優化問題,旨在幫助網站管理者更好地了解百度綠蘿算法的適應性和關注點。一:什么是百度綠蘿算法?1.1 百度綠蘿算法是什么?1.2 綠蘿算法和百度的關系是什么?二:百度綠蘿算法的適應性2.1 綠蘿算法與搜索引擎...

          基本上接觸過網絡相關知識的人應該多少都會聽過 DNS 這個名詞。因為 DNS 它非常重要,在我們上網的過程中扮演著重要的角色——“將網址/域名解析成 IP 地址”。如果配置了不合理的 DNS 服務器,可能會導致網速緩慢、打不開網站;一些惡意的 DNS 還會讓你電腦出現彈窗廣告、網站被劫持修改 (中間人攻擊)、監聽等等一系列的安全問題。因此為了高速穩定上網,小編搜集了目前全球范圍內可靠的免費公共 D...

          堪稱“史上最難”的618已告一段落,頭部主播消失在直播間,也沒有各大電商平臺顯赫的戰報,今年的618看似平靜了許多。但視頻號的首次參與,讓這平靜的湖面蕩起了些許漣漪。經過多次演唱會直播的刷屏,視頻號今年也正式參與618大促的活動,從5月31日20點至6月18日24點,開啟了為期19天的“6·18視頻號直播好物節”。與其他平臺面向C端的“滿300-50購物津貼”相比,視頻號的618更多是面向B端的品...

          TOP
          国产初高中生视频在线观看|亚洲一区中文|久久亚洲欧美国产精品|黄色网站入口免费进人
          1. <nobr id="easjo"><address id="easjo"></address></nobr>

              <track id="easjo"><source id="easjo"></source></track>
              1. 
                

              2. <bdo id="easjo"><optgroup id="easjo"></optgroup></bdo>
              3. <track id="easjo"><source id="easjo"><em id="easjo"></em></source></track><option id="easjo"><span id="easjo"><em id="easjo"></em></span></option>