大數據脫敏,又稱數據漂白、數據去隱私化或數據變形,是指對某些敏感信息通過脫敏規則進行數據的變形,實現敏感隱私數據的可靠保護,從而在開發、測試和其它非生產環境以及外包環境中安全地使用脫敏后的真實數據集。
隱私數據脫敏技術
通常在大數據平臺中,數據以結構化的格式存儲,每個表有諸多行組成,每行數據有諸多列組成。根據列的數據屬性,數據列通??梢苑譃橐韵聨追N類型:
可確切定位某個人的列,稱為可識別列,如身份證號,地址以及姓名等。
單列并不能定位個人,但是多列信息可用來潛在的識別某個人,這些列被稱為半識別列,如郵編號,生日及性別等。美國的一份研究論文稱,僅使用郵編號,生日和性別信息即可識別87%的美國人。
包含用戶敏感信息的列,如交易數額,疾病以及收入等。
其他不包含用戶敏感信息的列。
隱私數據泄露類型
隱私數據泄露可以分為多種類型,根據不同的類型,通??梢圆捎貌煌碾[私數據泄露風險模型來衡量防止隱私數據泄露的風險,以及對應不同的數據脫敏算法對數據進行脫敏。一般來說,隱私數據泄露類型包括:
個人標識泄露。當數據使用人員通過任何方式確認數據表中某條數據屬于某個人時,稱為個人標識泄露。個人標識泄露最為嚴重,因為一旦發生個人標識泄露,數據使用人員就可以得到具體個人的敏感信息。
屬性泄露,當數據使用人員根據其訪問的數據表了解到某個人新的屬性信息時,稱為屬性泄露。個人標識泄露肯定會導致屬性泄露,但屬性泄露也有可能單獨發生。
成員關系泄露。當數據使用人員可以確認某個人的數據存在于數據表中時,稱為成員關系泄露。成員關系泄露相對風險較小,個人標識泄露與屬性泄露肯定意味著成員關系泄露,但成員關系泄露也有可能單獨發生。
以上就是大數據脫敏是什么,小編相信有部分知識點可能是我們日常工作會見到或用到的。希望你能通過這篇文章學到更多知識。更多詳情敬請關注本站行業資訊頻道。
本文由 貴州做網站公司 整理發布,部分圖文來源于互聯網,如有侵權,請聯系我們刪除,謝謝!
c語言中正確的字符常量是用一對單引號將一個字符括起表示合法的字符常量。例如‘a’。數值包括整型、浮點型。整型可用十進制,八進制,十六進制。八進制前面要加0,后面...
2022年天津專場考試原定于3月19日舉行,受疫情影響確定延期,但目前延期后的考試時間推遲。 符合報名條件的考生,須在規定時間登錄招考資訊網(www.zha...
:喜歡聽,樂意看。指很受歡迎?!巴卣官Y料”喜聞樂見:[ xǐ wén lè jiàn ]詳細解釋1. 【解釋】:喜歡聽,樂意看。指很受歡迎。2. 【示例】:這是...
奧運會對中國的影響有哪些?一、2008年奧運會對中國經濟的影響1.為經濟發展提供穩定的社會環境2.這有利于進一步擴大開放,使中國經濟更好地適應經濟全球化的進程3.有利于在國際上打造“中國品牌”,更能帶動國內企業從產品管理向品牌管理的轉型二、2008年奧運會對首都經濟的影響1.舉辦奧運會將為新世紀初首都經濟的快速增長提供“核動力”2.舉辦奧運會將帶動首...
(資料圖片僅供參考)據了解,“開放麒麟”是中國首個桌面操作系統開發者平臺,將打造具有自主創新技術的開源桌面操作系統。2022年6月,“開放麒麟”正式推出。操作系統被稱做是計算機的靈魂,但我國的國產操作系統研發起步較晚,在一些核心技術上尚待突破,“ 開放麒麟 ” 開發者平臺將通過開放操作系統源代碼的方式,讓更多的開發者共同參與國...
散戶線和主力線指標哪里看?散戶線和主力線指標在股票軟件上看,用戶輸入個人信息登錄之后進行查看即可。只要是進入股票市場的用戶都是可以查詢到自己投資的股票變化的。散戶線指標是指根據市場交易的數據,統計、判斷得出大約的散戶持股數,這指標可以用于反映某一家股票集中或分散的趨勢。主力進出指標的綠線向上突破黃線、白線且三線向上發散,表示主力有效控盤,可逢底介入,持股待漲。需要注意的是,散戶線上升,說明籌碼較為...