1. <nobr id="easjo"><address id="easjo"></address></nobr>

      <track id="easjo"><source id="easjo"></source></track>
      1. 
        

      2. <bdo id="easjo"><optgroup id="easjo"></optgroup></bdo>
      3. <track id="easjo"><source id="easjo"><em id="easjo"></em></source></track><option id="easjo"><span id="easjo"><em id="easjo"></em></span></option>
          貴州做網站公司
          貴州做網站公司~專業!靠譜!
          10年網站模板開發經驗,熟悉國內外開源網站程序,包括DEDECMS,WordPress,ZBlog,Discuz! 等網站程序,可為您提供網站建設,網站克隆,仿站,網頁設計,網站制作,網站推廣優化等服務。我們專注高端營銷型網站,企業官網,集團官網,自適應網站,手機網站,網絡營銷,網站優化,網站服務器環境搭建以及托管運維等。為客戶提供一站式網站解決方案?。?!

          關于2000W數據

          來源:互聯網轉載 時間:2023-08-09 12:55:56

          前幾天在博客園首頁看到這個2000W數據的消息,剛好這個學期正在SQL入門,加上好奇心的驅使,把這個下載下來。

          一個是600多M的CSV文件,還有一個是1.7G的SQL Server的備份文件,解壓后都接近8G了,試著在sql server2000上導入一下,貌似直接就說太多了……汗

          所以,只好先看看這個CSV文件了,這個解壓后也接近2G了,一般的文本編輯器似乎都沒轍了,excel之類的東西更是別指望了,好吧,我先承認我的電腦很差,80G的硬盤,并口,ATA/133……呃

          我用HEX編輯軟件查看了一下,居然是UTF8的編碼,那就先用Python簡單寫段查詢,看看有沒有村里人中槍吧,哈哈

          # -*- coding: utf-8 -*- def cn(s):return s.decode("utf8").encode("gbk")try:fp=file("2000w.csv","r")while 1:fp.seek(0)word=raw_input(cn("查詢關鍵詞:"))fout=file(word+".txt","w")#sline=int(raw_input(cn("起始行:")))if word=='exit':breakword=word.decode("gbk").encode("utf8")i=0print "start..."while 1:i=i+1datl=fp.readline()if datl=="":breakif i%10000==0:print i#if i<sline:continueif datl.find(word)>0:tstr=cn("【Line:%d】%s"%(i,datl))print tstr,print>>fout,tstr,#pmt=raw_input(cn("是否繼續(y/n):"))#if pmt=='n':breakprint "end"fout.close() finally:fp.close()fout.close()

          順便把查詢記錄也保存為一個文件,結果……似乎沒發現認識的人,看來他們的保密措施做的不錯,哈哈。

          終歸還是為了練習SQL的,所以還是要將數據導入到sql server先。

          在此吐槽一下微軟的東西,安裝包越做越大,裝個軟件好幾個小時,記得去年裝個VS2012Express居然花了整整一上午!!!

          所以,對于我這種偏執狂以及標準窮屌絲來說,VC用6.0,sql server用2000的,還是云端版,才幾十M,入門學習足夠了,哈哈。

          回正題,我試著將CSV文件導入到SQL Server里去,發現編碼方式只能選擇ANSI或者Unicode之類的,選Unicode后英文字符都不正確了,ANSI的話中文肯定亂碼,所以還是用Python將編碼轉成UTF8,插了下資料,UTF8的文本文件有個3字節的文件頭,EFBBBF,我直接把它忽略了,哈哈

          #MAXLIST=1000frp=file("2000w_utf8.csv","r") fwp=file("2000w_ansi.csv","w") i=1 dat=frp.readline() fwp.write(dat[3:]) try:while 1:i=i+1if i%10000==0:print idat=frp.readline()if dat=="":break#if i>MAXLIST:breakelse:try:dat_w=dat.decode("utf8").encode("gbk")except UnicodeEncodeError:print "gbk encode error"fwp.write(dat)fwp.write(dat_w) except Exception,e:print e finally:frp.close()fwp.close() print "ok"

          這樣,導入SQLServer就正確了。

          PS:我的數據似乎只有1200多萬,沒有2000W啊,不知是不是沒有下載到完整版,嘿嘿

          轉載于:https://www.cnblogs.com/fwindpeak/p/3392955.html

          網絡推廣與網站優化公司(網絡優化與推廣專家)作為數字營銷領域的核心服務提供方,其價值在于通過技術手段與策略規劃幫助企業提升線上曝光度、用戶轉化率及品牌影響力。這...

          在當今數字化時代,公司網站已成為企業展示形象、傳遞信息和開展業務的重要平臺。然而,對于許多公司來說,網站建設的價格是一個關鍵考量因素。本文將圍繞“公司網站建設價...

          在當今的數字化時代,企業網站已成為企業展示形象、吸引客戶和開展業務的重要平臺。然而,對于許多中小企業來說,高昂的網站建設費用可能會成為其發展的瓶頸。幸運的是,隨...

          3d建模要用什么顯卡?3D建模用的是專業顯卡,不是普通的消費級顯卡。普通小規模建模用AMDFir3d建模要用什么顯卡?1,AMD系列AMD s顯卡更適合3d建模,因為A卡在圖形設計和3D渲染上的表現更好,在圖形色彩表現上的效果更好。Nvidia在游戲優化和加速方面更好,但在顯卡方面不如A卡。三維模型一般涉及復雜的圖形操作,最好使用高端顯卡,如R9 280、R9 290、HD 6990或HD 79...

          百事樂手機值得購買嗎?值得購買。百事手機不錯。是一款雙攝手機,背面配備了200萬1300萬像素雙攝像頭,可以拍出虛化效果更好的照片,前置800萬像素副攝像頭支持美顏拍攝。此外,這款手機不僅有3G和32G的標準版,還有6G 128G的驚艷版,大容量內存,如此大的面積在同品牌中并不多見。百事樂手機值得購買嗎?不值得。百事手機應該是名牌手機,功能不如華為手機。國產的華為手機無論是性能還是像素都很優秀。手...

          MacBook版word怎么簡轉繁?把不需要轉換的文字左鍵單擊,接著在word的“審閱”——“中文簡繁互換”里面點擊“繁轉簡”或“簡轉繁”即可繁體字怎么轉換簡體字?把文字圖片文件夾到Word文檔內,在快鍵工具里選擇簡繁轉化按鈕就可以不轉換的了word沒有審閱怎么繁轉簡?word沒有審閱繁轉簡方法:1、然后點擊【工具】菜單-【自定義】。2、在【自定義】對話框【命令】標簽頁下,先在左邊找不到并然后點擊...

          TOP
          国产初高中生视频在线观看|亚洲一区中文|久久亚洲欧美国产精品|黄色网站入口免费进人
          1. <nobr id="easjo"><address id="easjo"></address></nobr>

              <track id="easjo"><source id="easjo"></source></track>
              1. 
                

              2. <bdo id="easjo"><optgroup id="easjo"></optgroup></bdo>
              3. <track id="easjo"><source id="easjo"><em id="easjo"></em></source></track><option id="easjo"><span id="easjo"><em id="easjo"></em></span></option>