data={'state':[1,1,2,2,1,2,2,2],'pop':['a','b','c','d','b','c','d','d']}frame=pd.DataFrame(data)frame
frame.shape$(8,2)
#說明duplicated()是對整行進行查重,return重復了的數據,且只現實n-1條重復的數據(n是重復的次數)frame[frame.duplicated()==True]
一開始還很疑惑,明明(1,b)只出現了1次,哪里duplicate了。其實,人家return的結果是去掉已經出現過一次的行數據了。所以看起來有點confuse,感覺(1,b)并沒有重復,但其實人家的函數很簡潔呢,返回了重復值而且不冗余。
#說明drop_duplicates()函數是將所有重復的數據都去掉了,且默認保留重復數據的第一條。#比如(2,d)出現了3次,在duplicated()中顯示了2次,在drop_dupicates()后保留了一個frame.drop_duplicates().shape$(4,2)
#留下了完全唯一的數據行frame.drop_duplicates()
補充:python的pandas重復值處理(duplicated()和drop_duplicates())
importnumpyasnpimportpandasaspd#生成重復數據df=pd.DataFrame(np.ones([5,2]),columns=['col1','col2'])df['col3']=['a','b','a','c','d']df['col4']=[3,2,3,2,2]df=df.reindex(columns=['col3','col4','col1','col2'])#將新增的一列排在第一列df
輸出:
#判斷重復數據isDplicated=df.duplicated()#判斷重復數據記錄isDplicated
輸出:
#刪除重復值new_df1=df.drop_duplicates()#刪除數據記錄中所有列值相同的記錄new_df2=df.drop_duplicates(['col3'])#刪除數據記錄中col3列值相同的記錄new_df3=df.drop_duplicates(['col4'])#刪除數據記錄中col4列值相同的記錄new_df4=df.drop_duplicates(['col3','col4'])#刪除數據記錄中(col3和col4)列值相同的記錄new_df1new_df2new_df3new_df4
輸出:
1、云計算,典型應用OpenStack。2、WEB前端開發,眾多大型網站均為Python開發。3.人工智能應用,基于大數據分析和深度學習而發展出來的人工智能本質上已經無法離開python。4、系統運維工程項目,自動化運維的標配就是python+Django/flask。5、金融理財分析,量化交易,金融分析。6、大數據分析。
關于如何在python中使用duplicated和drop_duplicates()就分享到這里了,希望以上內容可以對大家有一定的幫助,可以學到更多知識。如果覺得文章不錯,可以把它分享出去讓更多的人看到。
本文由 貴州做網站公司 整理發布,部分圖文來源于互聯網,如有侵權,請聯系我們刪除,謝謝!
c語言中正確的字符常量是用一對單引號將一個字符括起表示合法的字符常量。例如‘a’。數值包括整型、浮點型。整型可用十進制,八進制,十六進制。八進制前面要加0,后面...
2022年天津專場考試原定于3月19日舉行,受疫情影響確定延期,但目前延期后的考試時間推遲。 符合報名條件的考生,須在規定時間登錄招考資訊網(www.zha...
:喜歡聽,樂意看。指很受歡迎?!巴卣官Y料”喜聞樂見:[ xǐ wén lè jiàn ]詳細解釋1. 【解釋】:喜歡聽,樂意看。指很受歡迎。2. 【示例】:這是...
(資料圖)隨著社會越來越發達,大家都選擇在網絡上汲取相關知識內容,比如怎么查電信寬帶到期時間,為了更好的解答大家的問題,小編也是翻閱整理了相應內容,下面就一起來看一下吧!電信寬帶到期時間查詢方法:1、首先撥打電信客服10000;2、然后根據語音提示選擇“人工服務”;3、向電信客服提供用戶所要查詢的寬帶賬號,有時候可能會讓用戶提供有效證件信息或需要用戶使用綁定寬帶的電話撥打10000;4、登陸電信官...
(資料圖片)關于ATIHD4500是什么顯卡的知識大家了解嗎?以下就是小編整理的關于ATIHD4500是什么顯卡的介紹,希望可以給到大家一些參考,一起來了解下吧!是筆記本的獨立顯卡。ATI HD4500參數如下:1、核心頻率800MHz。2、擁有120個流處理器。3、支持DX10、1、SM4、1、PowerPlay 2、0、游戲物理加速、動態幾何加速、24X CFAA反鋸齒等技術。4、使用了新版視...
什么是新股發行制度?新股發行制度即IPO,又稱首次公開發行股票,是指股份有限公司或有限責任公司首次向社會公開發行股票的方式,有限公司IPO后會變成股份公司。2009年IPO重啟后,共有239只新股發行,其中次新股和兩市有51只新股破發。這種現象始于上世紀90年代末的美國,當時的美國股市面臨比較大的困難,就是正經歷泡沫。他希望在牛市期間通過籌集資金的首次公開募股(IPO),并將成立一家擁有獨立資本的...