神馬Spider是神馬訪問互聯網,自動化抓取網頁的程序。Spider抓取下網頁,建立索引,使用戶可通過搜索引擎搜索到互聯網上的資源。
user-agent,是http協議中的一個屬性,代表了終端的身份。神馬Spider的user-agent為:Yisouspider,因為歷史原因此user-agent名稱將會繼續使用。
神馬Spider的ip地址是一組ip池,會動態變,因此不在此列舉。
神馬會根據網站的規模、服務能力、頁面質量、更新速度等因素來決定對網站的訪問頻率。通常質量高、網頁更新快的網站神馬spider訪問的頻率相對會高,以保證高質、時效的能夠展現給用戶。
神馬spider發現新網頁的方式有多種,最典型的是在已發現的網頁中分析超鏈關系,選取url并抓取,如此不斷拓展,盡可能多的抓取到有價值的網頁。另外,神馬會從dns服務商處獲取新網站域名,能夠及時抓取到新建網站。
robots.txt是搜索引擎訪問網站是要訪問的靠前個文件,以確定哪些網頁是允許或禁止抓取的。神馬搜索遵守互聯網robots協議,如您希望完全禁止神馬訪問或對部分目錄禁止訪問,您可以通過robots.txt文件來設置內容,限定神馬Spider的訪問權限。
robots.txt必須放在網站根目錄下,且文件名要小寫。
具體的寫法:
1) 完全禁止神馬Spider抓?。?/p>
User-agent:Yisouspider
Disallow:/
2) 禁止神馬spider抓取指定目錄
User-agent: Yisouspider
Disallow: /update
Disallow: /history
禁止抓?。酰穑洌幔簦?、history目錄下網頁
神馬Spider有規范的抓取流程,同時也會考慮網站的忙閑時段來抓取,因此不會給網站造成帶寬負擔。如您發現名為Yisouspider的user-agent抓取嚴重影響到了網站的正常訪問,您可將該時段的訪問日志信息反饋至zhanzhangpingtai@service.alibaba.com,神馬同學會將分析結論發送給您。
本文由 貴州做網站公司 整理發布,部分圖文來源于互聯網,如有侵權,請聯系我們刪除,謝謝!
這是陽光明媚的一天,互聯網里風平浪靜,一切都是欣欣向榮。我就是在這樣一個平凡的日子里誕生了。我給自己起了個名字叫超,不過我的師哥師姐們都喜歡叫我小超。從出生的那...
網上關于SEO優化的知識很多也很雜,很多新手都不知道如何選擇。本來耗子網站里每篇文章都有的詳細步驟的,考慮到很雜,于是耗子對各種SEO優化基礎知識進行了整理,但...
今天,我給大家講講如何利用電影貼吧引流輕松變現。這個很適合新手。廢話不多說,直接上干貨。每上映一個新片子,只要這個片子有一定的熱度,馬上該片子的貼吧就會出現各種...
在當前互聯網時代,網站SEO排名對于一個企業的營銷推廣至關重要。然而,如何有效地提高網站排名成為了許多網站管理員所面臨的難題。這時,SEO數據監控工具就應運而生,它能夠幫助網站管理員更好地了解自己網站的優化情況,及時發現問題并進行優化,從而提高網站排名。本文將深入介紹SEO數據監控工具及其優勢,以期幫助讀者更好地了解如何利用這一工具提升網站SEO排名。一:什么是SEO解析工具SEO解析工具是一種用...
在當今網絡時代,擁有一個優秀的網站是非常重要的。而擁有高排名的網站則更加有利于吸引用戶和提升品牌價值。但如何快速提升網站排名,是每個網站所有者必須面對的問題。本文將為您介紹10種提升網站排名的技巧,幫助您迅速提高網站的搜索引擎排名。優化網站結構通過優化網站結構,將重要的關鍵詞放在頁面標題、頁面描述以及H1標簽中,優化頁面結構,提高網站的可讀性。同時,減少頁面加載時間和增加內部鏈接也能夠有效地提高網...
如今,隨著互聯網的發展,越來越多的企業都開始注重SEO網站優化,以提高網站的排名,吸引更多的訪問量和流量。那么,如何進行有效的SEO優化呢?本文將為您介紹全方位的SEO優化攻略,幫助您的網站火起來!一、關鍵詞分析在進行SEO優化之前,首先要做的就是對網站的關鍵詞進行分析。通過分析網站所屬行業和目標用戶的搜索習慣,確定合適的關鍵詞,并進行排名分析,為后續SEO優化打下基礎。二、網站內容優化網站內容優...