1. <nobr id="easjo"><address id="easjo"></address></nobr>

      <track id="easjo"><source id="easjo"></source></track>
      1. 
        

      2. <bdo id="easjo"><optgroup id="easjo"></optgroup></bdo>
      3. <track id="easjo"><source id="easjo"><em id="easjo"></em></source></track><option id="easjo"><span id="easjo"><em id="easjo"></em></span></option>
          貴州做網站公司
          貴州做網站公司~專業!靠譜!
          10年網站模板開發經驗,熟悉國內外開源網站程序,包括DEDECMS,WordPress,ZBlog,Discuz! 等網站程序,可為您提供網站建設,網站克隆,仿站,網頁設計,網站制作,網站推廣優化等服務。我們專注高端營銷型網站,企業官網,集團官網,自適應網站,手機網站,網絡營銷,網站優化,網站服務器環境搭建以及托管運維等。為客戶提供一站式網站解決方案?。?!

          youproxy(如何用Python爬蟲代理增加網站流量)

          來源:互聯網轉載 時間:2024-05-06 04:26:01

          獲得了免費的代理列表,那么就有很多事情可以干,比如 , 爬取某個網站并且沒有被封IP的風險, 比如, 增加某網站的流量。

          完整代碼:

          #coding:utf-8importurllib2importurllibimportcookielibimporthashlibimportreimporttimeimportjsonimportunittestfromseleniumimportwebdriverfrombs4importBeautifulSoupfrompip._vendor.distlib._backport.tarfileimportTUREADfromtimeimportsleepfromseleniumimportwebdriverfromselenium.webdriver.common.keysimportKeysfromselenium.webdriver.common.desired_capabilitiesimportDesiredCapabilitiesimportrandomclassSpide:def__init__(self,proxy_ip,proxy_type,proxy_port,use_proxy=False):print'usingtheproxyinfo:',proxy_ipself.proxy_ip=proxy_ipself.proxy_type=proxy_typeself.proxy_port=proxy_portself.proxy=urllib2.ProxyHandler({proxy_type:proxy_ip+":"+proxy_port})self.usercode=""self.userid=""self.cj=cookielib.LWPCookieJar();self.opener=urllib2.build_opener(urllib2.HTTPCookieProcessor(self.cj));ifuse_proxy:self.opener=urllib2.build_opener(self.proxy)urllib2.install_opener(self.opener);defadd_view(self):print'--->startaddingview'print'--->proxyinfo',self.proxy_ipservice_args=['--proxy='+self.proxy_ip+':'+self.proxy_port,'--proxy-type='+self.proxy_type,]dcap=dict(DesiredCapabilities.PHANTOMJS)dcap["phantomjs.page.settings.userAgent"]=("Mozilla/5.0(X11;Linuxx86_64)AppleWebKit/53""(KHTML,likeGecko)Chrome/15.0.87")driver=webdriver.PhantomJS(executable_path='/home/bin/phantomjs',service_args=service_args,desired_capabilities=dcap)driver.set_page_load_timeout(90)driver.get("http://www.503error.com/")soup=BeautifulSoup(driver.page_source,'xml')titles=soup.find_all('h2',{'class':'entry-title'})ranCount=random.randint(0,len(titles))print'randomfindalinkofthewebsitetoaccess,randomis:',ranCountrandomlink=titles[ranCount].a.attrs['href']driver.get(randomlink)driver.close()print'finishonce'defget_proxy(self):proxy_info_json=""#firstgettheproxyinfofromprint'-->usingtheip'+self.proxy_ip+'togettheproxyinfo'try:reqRequest_proxy=urllib2.Request('url2');reqRequest_proxy.add_header('Accept','*/*');reqRequest_proxy.add_header('Accept-Language','zh-CN,zh;q=0.8');reqRequest_proxy.add_header('User-Agent','Mozilla/5.0(WindowsNT6.1;WOW64)AppleWebKit/537.36(KHTML,likeGecko)Chrome/28.0.1500.72Safari/537.36');reqRequest_proxy.add_header('Content-Type','application/x-www-form-urlencoded');proxy_info=urllib2.urlopen(reqRequest_proxy).read();printproxy_infoproxy_info_json=json.loads(proxy_info)return_str=proxy_info_json['protocol']+":"+proxy_info_json['ip']+proxy_info_json['port']exceptException,e:print'proxyhaveproblem'#printproxy_info_json['protocol']#printproxy_info_json['ip']#printproxy_info_json['port']returnproxy_info_json#printproxy_infodefget_proxys100(self):proxy_info_json=""#firstgettheproxyinfofromprint'-->usingtheip'+self.proxy_ip+'togettheproxyinfo100'try:reqRequest_proxy=urllib2.Request('url1');reqRequest_proxy.add_header('Accept','*/*');reqRequest_proxy.add_header('Accept-Language','zh-CN,zh;q=0.8');reqRequest_proxy.add_header('User-Agent','Mozilla/5.0(WindowsNT6.1;WOW64)AppleWebKit/537.36(KHTML,likeGecko)Chrome/28.0.1500.72Safari/537.36');reqRequest_proxy.add_header('Content-Type','application/x-www-form-urlencoded');proxy_info=urllib2.urlopen(reqRequest_proxy).read();#printproxy_infoproxy_info_json=json.loads(proxy_info)#forporxy_iinproxy_info_json:#printporxy_i#return_str=proxy_info_json['protocol']+":"+proxy_info_json['ip']+proxy_info_json['port']returnproxy_info_jsonexceptException,e:print'proxyhaveproblem'if__name__=="__main__":#firstimegettheproxyprint'STARTADDINGVIEW:'print'GetingthenewproxyinfoFirsttime'print'---------------------------------------------------------------------------------------------------------'forcountinrange(1):test=Spide(proxy_ip='youproxyip',proxy_type='http',proxy_port='3128',use_proxy=False)proxy_list=test.get_proxy()print'->thisisthe:',countprint'->Getingthenewproxyinfo:'print'->usingtheproxytogetproxylistincaseforbiden'print'->proxyinfo',proxy_listproxy100=test.get_proxys100()forproxy1inproxy100:try:print'proxy1:',proxy1Spide1=Spide(proxy_ip=proxy1['ip'],proxy_type=proxy1['type'],proxy_port=proxy1['port'],use_proxy=True)print'beforeaddview'Spide1.add_view()print'->sleep15s'time.sleep(15)#sleeprandomtimetoranTime=random.randint(10,50)print'->sleeprandomtime:',ranTimetime.sleep(ranTime)print'->gettingnewproxy'#proxy_list=Spide1.get_proxy()exceptException,e:print'->somethingwrong,hahah,next'

          一點小的注釋:

          整個流程為: 1 獲取代理 ->2 訪問首頁 —>3 獲取首頁博客列表,隨機訪問->4隨機等待N秒 ->返回第1步

          1:你需要更改youproxyip為你一個你已經擁有的代理ip,或者,不用填寫,因為后邊的use_proxy=False, 這個時候你確保你能夠不適用代理訪問到代碼中的兩個自動抓取代理ip地址的網站

          2:/home/bin/phantomjs 這個路徑是你安裝的phantomjs路徑

          3:代碼中有兩個獲取代理的方法,例子中選擇了一個(不要噴我下邊的循環為什么是一次還要循環,因為這個版本是原來是有外層循環的)

          4: 獲取免費代理地址就不寫了,url1 ,url2 為隱藏的獲取免費代理的網站

          標簽:youproxy-

          c語言中正確的字符常量是用一對單引號將一個字符括起表示合法的字符常量。例如‘a’。數值包括整型、浮點型。整型可用十進制,八進制,十六進制。八進制前面要加0,后面...

          2022年天津專場考試原定于3月19日舉行,受疫情影響確定延期,但目前延期后的考試時間推遲。 符合報名條件的考生,須在規定時間登錄招考資訊網(www.zha...

          :喜歡聽,樂意看。指很受歡迎?!巴卣官Y料”喜聞樂見:[ xǐ wén lè jiàn ]詳細解釋1. 【解釋】:喜歡聽,樂意看。指很受歡迎。2. 【示例】:這是...

          中國銀行的分期手續費是根據分期時間和利率計算的,以下是中行分期手續費率:1、如果分3期,費率為1.95%。2、如果分6期,費率為3.60%。3、如果分9期,費率為5.40%。4、如果分12期,費率為7.20%。5、如果分18期,費率為11.70%。6、如果分24期,費率為費率為15%。中國銀行(BANK OF CHINA)是中央管理的大型國有銀行,國家副部級單位,中國香港、中國澳門的發鈔行,于19...

          文 | 洞見文本|洞察力來源:洞察(ID: DJ 00123987)“不懂是運氣,懂是命?!边@個世界上,有一首歌叫《張開嘴哭》。但是能讓人一開口就哭的歌手不多。如果有的話,他的名字一定是李宗盛。小時候只覺得老李的歌朗朗上口,不好聽。突然有一天,我發現每一句歌詞都鉆進了我的耳朵,我能聽到心碎的聲音。直到這個時候,我才深深體會到那句話:最怕某個年紀突然懂了一首歌;最怕某個年紀突然看一個人?!睹裰{》你我...

          (資料圖片)提起戰狼2票房達到了多少億大家在熟悉不過了,被越來越多的人所熟知,那你知道戰狼2票房達到了多少億嗎?快和小編一起去了解一下吧!戰狼2票房達到了56.8億,4小時破億,單日票房4.26億創華語電影新紀錄。累計1.59億的觀影人次,讓《戰狼2》成為了全球影史單一市場觀影人次的冠軍。最終票房56.8億人民幣,不僅位列國內票房榜第一位,還收獲了“連續21天票房日冠軍”、“連續7天上座率日冠軍”...

          TOP
          国产初高中生视频在线观看|亚洲一区中文|久久亚洲欧美国产精品|黄色网站入口免费进人
          1. <nobr id="easjo"><address id="easjo"></address></nobr>

              <track id="easjo"><source id="easjo"></source></track>
              1. 
                

              2. <bdo id="easjo"><optgroup id="easjo"></optgroup></bdo>
              3. <track id="easjo"><source id="easjo"><em id="easjo"></em></source></track><option id="easjo"><span id="easjo"><em id="easjo"></em></span></option>