pandas 的安裝
pandas
在python上的安裝同樣的使用pip
進行:
pipinstallpandas
pandas 創建對象
pandas
有兩種數據結構:Series
和 DataFrame
。
Series
Series
像python中的數據list
一樣,每個數據都有自己的索引。從list
創建 Series
。
>>>importpandasaspd>>>s1=pd.Series([100,23,'bugingcode'])>>>s101001232bugingcodedtype:object>>>
在Series
中添加相應的索引:
>>>importnumpyasnp>>>ts=pd.Series(np.random.randn(365),index=np.arange(1,366))>>>ts
在index中設置索引值是一個從1到366的值。
Series
的數據結構最像的是python中的字典,從字典中創建Series
:
sd={'xiaoming':14,'tom':15,'john':13}s4=pd.Series(sd)
這時候可以看到Series
已經是自帶索引index。
pandas
本身跟 python的另外一個第三方庫Matplotlib
有很多的連接,Matplotlib
一個最經常用到的是用來展示數據的,如果還對Matplotlib
不了解的話,后面的章節會進行介紹,現在先拿過來直接用下,如果還沒有安裝的話,一樣的用pip
命令安裝 pip install Matplotlib
, 展示如下數據:
importpandasaspdimportnumpyasnpimportmatplotlib.pyplotaspltts=pd.Series(np.random.randn(365),index=np.arange(1,366))ts.plot()plt.show()
一個不規則的圖形,在數據分析中,時間是一個重要的特性,因為很多數據都是跟時間是有關系的,銷售額跟時間有關系,天氣跟時間有關系。。。,在pandas
中也提供了關于時間的一些函數,使用date_range
生成一系列時間。
>>>pd.date_range('01/01/2017',periods=365)DatetimeIndex(['2017-01-01','2017-01-02','2017-01-03','2017-01-04','2017-01-05','2017-01-06','2017-01-07','2017-01-08','2017-01-09','2017-01-10',...'2017-12-22','2017-12-23','2017-12-24','2017-12-25','2017-12-26','2017-12-27','2017-12-28','2017-12-29','2017-12-30','2017-12-31'],dtype='datetime64[ns]',length=365,freq='D')>>>
之前我們的圖形不規則,有一個原因是數據不是連續的,使用cumsum
讓數據連續:
如下:
importpandasaspdimportnumpyasnpimportmatplotlib.pyplotaspltts=pd.Series(np.random.randn(365),index=pd.date_range('01/01/2017',periods=365))ts=ts.cumsum()ts.plot()plt.show()
DataFrame
DataFrame
相當于Series
一維的一個擴展,是一種二維的數據模型,相當于EXcel表格中的數據,有橫豎兩種坐標,橫軸很Series
一樣使用index,豎軸用columns 來確定,在建立DataFrame
對象的時候,需要確定三個元素:數據,橫軸,豎軸。
df=pd.DataFrame(np.random.randn(8,6),index=pd.date_range('01/01/2018',periods=8),columns=list('ABCDEF'))printdf
數據如下:
ABCDEF2018-01-010.7126360.546680-0.847866-0.6290052.1526860.5639072018-01-02-1.2927991.1220980.7432930.6564120.9897382.4682002018-01-031.7628940.783614-0.3014680.289608-0.7808440.8730742018-01-04-0.8180661.629542-0.5954510.9101410.1609800.3066602018-01-052.0086580.456592-0.8395971.6150130.718422-0.5645842018-01-060.4808930.724015-1.076434-0.2537310.337147-0.0282122018-01-07-0.6725010.739550-1.3160941.118234-1.456680-0.6018902018-01-08-1.028436-1.036542-0.4590441.321962-0.198338-1.034822
在數據分析的過程中,很常見的一種情況是數據直接從excel
或者cvs
過來,可以excel
中讀取數據到DataFrame
,數據在 DataFrame
中進行處理:
df=pd.read_excel('data.xlsx',sheet_name='Sheet1')printdf
同樣的有保存數據到excel
中 to_excel
。
處理cvs數據的函數是:read_cvs
和 to_cvs
,處理HDF5的函數為 read_hdf
和 to_hdf
。
訪問DataFrame
可以跟二位數組一樣的訪問方式:
printdf['A']
帶出橫軸標簽:
2018-01-010.7126362018-01-02-1.2927992018-01-031.7628942018-01-04-0.8180662018-01-052.0086582018-01-060.4808932018-01-07-0.6725012018-01-08-1.028436
同樣的可以指定某一個元素:
printdf['A']['2018-01-01']
對數組進行切片出來,認清橫軸和縱軸:
>>>importpandasaspd>>>df=pd.read_excel('data.xlsx',sheet_name='Sheet1')>>>df[:][0:3]ABCDEF2018-01-010.7126360.546680-0.847866-0.6290052.1526860.5639072018-01-02-1.2927991.1220980.7432930.6564120.9897382.4682002018-01-031.7628940.783614-0.3014680.289608-0.7808440.873074>>>
看完上述內容,你們掌握pandas庫怎么在python中進行安裝的方法了嗎?如果還想學到更多技能或想了解更多相關內容,歡迎關注本站行業資訊頻道,感謝各位的閱讀!
本文由 貴州做網站公司 整理發布,部分圖文來源于互聯網,如有侵權,請聯系我們刪除,謝謝!
c語言中正確的字符常量是用一對單引號將一個字符括起表示合法的字符常量。例如‘a’。數值包括整型、浮點型。整型可用十進制,八進制,十六進制。八進制前面要加0,后面...
2022年天津專場考試原定于3月19日舉行,受疫情影響確定延期,但目前延期后的考試時間推遲。 符合報名條件的考生,須在規定時間登錄招考資訊網(www.zha...
:喜歡聽,樂意看。指很受歡迎?!巴卣官Y料”喜聞樂見:[ xǐ wén lè jiàn ]詳細解釋1. 【解釋】:喜歡聽,樂意看。指很受歡迎。2. 【示例】:這是...
銀行電子賬戶是什么?銀行電子賬戶是銀行賬戶的一種,包括有銀行、信用卡等電子賬戶管理以及網上操作的金融服務。電子賬戶的作用還是比較豐富的,能夠實現多賬戶管理,并且享受投資、理財、融資、網上支付、公共事業費繳納等全方位個人金融服務。開通電子賬戶有什么用?開通電子賬戶作用:1、電子賬戶具備借記卡的大部分功能,能實現多賬戶管理,并享受投資、理財、融資、網上支付、公共事業費繳納等全方位個人金融服務;2、賬戶...
都知道如今我國的房價可謂是越來越高的,尤其是對于有些一線城市而言,房子的價格甚至高達上萬元。很多人都希望房價可以下跌,但是網友們知道房價下跌銀行危險嗎?據悉,當房產價值發生減少,比如房屋倒塌,房價下跌等情況,你按揭的這套房產自身價值已不夠償還銀行的欠款,此時,銀行有權利要求購房者提供新的抵押物或者彌補銀行的損失。所以說,房價下跌一般不會影響銀行的利益。房價下跌的危害:房價下跌的城市紛紛上演房鬧戲碼...
怎樣申購新股,新股申購的方式有以下兩種方式:1.線上申購:投資者在可以購買股票的相關網站或者是股票APP中直接選擇新上市的股票進行申購。2.在線下辦理:投資者也可攜帶個人身份證件到證券公司營業網點請工作人員辦理。以上是新股申購的方式。一般來說新股申購也叫打新股,是指投資者利用資金申請購買即將上市的新股。如果他們中簽就說明認購就成功了。需要注意的是申購新股需要注意以下幾種條件:1投資者申購新股時申購...