1. <nobr id="easjo"><address id="easjo"></address></nobr>

      <track id="easjo"><source id="easjo"></source></track>
      1. 
        

      2. <bdo id="easjo"><optgroup id="easjo"></optgroup></bdo>
      3. <track id="easjo"><source id="easjo"><em id="easjo"></em></source></track><option id="easjo"><span id="easjo"><em id="easjo"></em></span></option>
          貴州做網站公司
          貴州做網站公司~專業!靠譜!
          10年網站模板開發經驗,熟悉國內外開源網站程序,包括DEDECMS,WordPress,ZBlog,Discuz! 等網站程序,可為您提供網站建設,網站克隆,仿站,網頁設計,網站制作,網站推廣優化等服務。我們專注高端營銷型網站,企業官網,集團官網,自適應網站,手機網站,網絡營銷,網站優化,網站服務器環境搭建以及托管運維等。為客戶提供一站式網站解決方案?。?!

          seo.chinaz.com(Python中如何使用Request爬取seo.chinaz.com百度權重網站的查詢結果)

          來源:互聯網轉載 時間:2024-05-01 09:15:00

          一:腳本需求

          利用Python3查詢網站權重并自動存儲在本地數據庫(MySQL數據庫)中,同時導出一份網站權重查詢結果的EXCEL表格

          數據庫類型:MySql

          數據庫表單名稱:website_weight

          表單內容及表頭設置:表頭包含有id、main_url(即要查詢的網站)、website_weight(網站權重)

          要查詢的網站:EXCEL表格

          二:需求實現

          一:利用openpyxl模塊解析excel文件,將查詢的網站讀取到一個列表中保存

          #解析excel文件,取出所有的urldefget_urls(file_path):wb=load_workbook(file_path)sheet=wb.activeurls=[]forcellinlist(sheet.columns)[1]:ifcell!=sheet['B1']:urls.append(cell.value)returnwb,urls

          二:分析請求發送,偽造請求,取得HTML頁面

          #偽造請求,取得html頁面defget_html(url):#定義http的請求Headerheaders={}#random.randint(1,99)為了生成1到99之間的隨機數,讓UserAgent變的不同。headers['User-Agent']="Mozilla/5.0(WindowsNT6.1;WOW64)AppleWebKit/537.36(KHTML,likeGecko)Chrome/63.0.3239.132Safari/537."+str(random.randint(1,99))#Referer地址使用待查詢的網址headers['Referer']="http://seo.chinaz.com/"+url+"/"html=''try:html=requests.get("http://seo.chinaz.com/"+url+"/",headers=headers,timeout=5).textexceptException:passreturnhtml

          三:分析HTML頁面,利用BeautifulSoup模塊提取數據

          #利用BeautifulSoup模塊從html頁面中提取數據defget_data(html,url):ifnothtml:returnurl,0soup=bs(html,"lxml")p_tag=soup.select("p.ReLImgCenter")[0]src=p_tag.img.attrs["src"]regexp=re.compile(r'^http:.*?(\d).gif')br=regexp.findall(src)[0]returnurl,br

          四:數據庫連接配置,并獲取游標

          #連接數據庫defget_connect():conn=pymysql.connect(host='127.0.0.1',port=3306,user='root',passwd='root',db='seotest',charset="utf8")#獲取游標對象cursor=conn.cursor()returnconn,cursor

          五:主程序邏輯編寫

          if__name__=="__main__":#命令行執行腳本文件,獲取excel文件路徑file_path=sys.argv[1]#獲取URL列表和excle工作簿wb,urls=get_urls(file_path)#獲取數據庫連接和游標conn,cursor=get_connect()#獲取工作簿當前工作sheetsheet=wb.active#數據庫插入語句sql_insert='''insertintowebsite_weight(main_url,website_weight)values(%s,%s)'''forrow,urlinenumerate(urls):ifnoturl:continuehtml=get_html(url)data=get_data(html,url)#插入數據到數據庫cursor.execute(sql_insert,data)#插入數據到Excel表中cell=sheet.cell(row=row+2,column=3)cell.value=data[1]#終端打印插入的數據print(data)conn.commit()conn.close()wb.save(file_path)wb.close()#cmd命令:python3F:\算法與結構\網站權重.pyF:\website.xlsx

          三:腳本運行及其實現結果

          CMD執行

          數據庫:

          excel文件寫入:

          標簽:seo.chinaz.com-

          c語言中正確的字符常量是用一對單引號將一個字符括起表示合法的字符常量。例如‘a’。數值包括整型、浮點型。整型可用十進制,八進制,十六進制。八進制前面要加0,后面...

          2022年天津專場考試原定于3月19日舉行,受疫情影響確定延期,但目前延期后的考試時間推遲。 符合報名條件的考生,須在規定時間登錄招考資訊網(www.zha...

          :喜歡聽,樂意看。指很受歡迎?!巴卣官Y料”喜聞樂見:[ xǐ wén lè jiàn ]詳細解釋1. 【解釋】:喜歡聽,樂意看。指很受歡迎。2. 【示例】:這是...

          獎金單獨計稅還是并入綜合所得?哪一種計稅方式劃算?分情況而定。一起簡單了解下吧。原規定2022年1月1日起年終獎不能再單獨計稅,后來在12月29日,國務院常務會議決定延續實施部分個人所得稅優惠政策,其中就說到“將全年一次性獎金不并入當月工資薪金所得、實施按月單獨計稅的政策延至2023年年底”。也就是說我們在2022年發放2021年的年終獎計稅方式可以并入當年綜合所得計稅,也...

          【資料圖】1.咽【yān】組詞:喉嚨、咽頭、咽峽炎、咽泣等。2.咽【yàn】組詞:細嚼慢咽、咽唾沫、囫圇吞棗、吞咽、斷氣等。3.咽【yè】組詞:哽咽、嗚咽、悲咽、梗咽等。4.咽是多音字,拼音分別是yān,yàn和yè....

          漲停板打開是洗盤還是出貨?個股漲停板打開可能是出貨,也可能是洗盤,需要結合實際情況來考慮。1、從成交量上看如果在漲停板打開時,其成交量出現較大的放量情況,則可能是主力出貨;如果在漲停板打開時,其成交量出現縮量的情況,則可能是主力洗盤。2、從籌碼分布圖上看如果在漲停板打開時,莊家底部的籌碼基本不動,而散戶底部的獲利籌碼在不斷的賣出,則可能是洗盤;如果在漲停板打開時,莊家出底部的籌碼上移,賣給在高位接...

          TOP
          国产初高中生视频在线观看|亚洲一区中文|久久亚洲欧美国产精品|黄色网站入口免费进人
          1. <nobr id="easjo"><address id="easjo"></address></nobr>

              <track id="easjo"><source id="easjo"></source></track>
              1. 
                

              2. <bdo id="easjo"><optgroup id="easjo"></optgroup></bdo>
              3. <track id="easjo"><source id="easjo"><em id="easjo"></em></source></track><option id="easjo"><span id="easjo"><em id="easjo"></em></span></option>