2020年7月和10月,我國陸續發布兩部重磅級的法規草案——《數據安全法(草案)》和《個人信息保護法(草案)》。歐盟于 2018 年實施《通用數據保護條例》(GDPR),美國于 2020 年實施《加州消費者隱私法案》(CCPA),日本于2020年6月通過修訂版《個人信息保護法》。隨著全球數據安全法規監管的不斷強化,合規性問題不得不納入企業數據安全建設考慮范圍。然而,法規對企業的更高的安全要求,給傳統的數據安全防護技術與措施帶來了前所未有的挑戰。
在此背景下,綠盟科技近日發布《擁抱合規、超越合規:數據安全前沿技術研究報告》。在報告中,選取業界最為前沿與創新的十種數據安全技術,對其技術原理與應用進行全面的梳理與分析,包括處于學術前沿的差分隱私、同態加密、數據匿名;行業內炙手可熱的安全多方計算、聯邦學習等。這些新興技術,為企業的數據安全建設帶來新的思路與方案——助力其在滿足業務需求的同時解決合規的痛點與難點。
1 簡介
數據安全建設離不開具體的業務場景,數據安全技術需要從應用場景出發。根據企業的業務系統與應用、以及數據分布范圍的不同,我們將數據安全建設分為三類場景:
1) 用戶隱私數據安全合規;
2) 企業內部數據安全治理;
3) 企業間數據共享與計算。
如圖1所示,上述三大類場景根據具體業務與功能的不同,可進一步細分一些子場景。各個子場景不僅有自身內部安全需求,也有相應的合規性要求,具體可對應到歐盟GDPR條款,以及我國已實施的《網絡安全法》的數據安全相關條款。后續三個章節將從三類場景以及子場景的應用需求與合規挑戰出發,研究與分析如何基于前沿技術,實現超越合規,解決安全痛點。
圖1 超越合規:數據安全場景-前沿技術圖譜
2 前沿技術+用戶隱私數據安全合規
在該類場景中,企業需解決用戶隱私數據的采集、以及數據權利請求響應的合規性問題,可引入下述創新技術:
1) 差分隱私
技術原理:差分隱私是一種基于噪聲機制的隱私保護技術。在本地差分隱私模式下,每一個用戶終端都會運行一個差分隱私算法,每一個終端采集的數據都會加入噪聲,然后將其上傳給服務器;服務器雖然無法獲得某一個用戶的精確數據,但通過聚合與轉換可以挖掘出用戶群體的行為趨勢。
合規遵循:GDPR的 32條和《網絡安全法》的42條。
行業應用(代表公司):Google、Apple,其中Apple通過差分隱私可挖掘到iPhone用戶使用表情的頻率分布,但無法獲得具體某一個用戶的確切隱私。
圖2 iPhone差分隱私技術應用[1]
2) 知識圖譜
技術原理:知識圖譜最早用于搜索引擎和社交網絡,它簡單可以看成是一種基于圖的數據結構,由節點和邊組成,每個節點是一個實體,每條邊是兩條實體之間的關系。由于個人數據治理關鍵是個人數據實體識別,以及相關屬性與處理流程的關聯,引入知識圖譜技術成為必然。通過知識圖譜技術,可幫助企業了解所在敏感數據的位置,是如何被使用的,以及它的合同、法律和監管義務,達到個人信息治理與可視化作用。
合規遵循:可滿足GDPR的12-22條和《網絡安全法》的43條。
行業應用(代表公司):RSA 2020創新沙盒冠軍Securit.ai公司,基于知識圖譜技術實現了個人數據圖譜應用。
圖3 Securiti.ai的個人數據圖譜應用[2]
3) 流程自動化
技術原理:用戶數據權利請求響應是歐美等國外企業重要的隱私合規檢查項。流程自動化技術可幫助企業的數據安全運營團隊從繁瑣重復的手工處理“請求-響應”轉為自動化處理,一方面可降低人工的運營成本,另一方面可減少由于響應時間延誤(GDPR規定一般為一個月)帶來的違規風險。
合規遵循:GDPR的12-22條和《網絡安全法》的43條。
行業應用(代表公司):Securit.ai、BigID和OneTrust等。
3 前沿技術+企業內部數據安全治理
在該類場景中,企業需解決內部敏感數據治理的安全與合規問題,可引入下述技術解決安全與合規問題:
1) 智能敏感數據識別
技術原理:傳統基于關鍵詞、正則匹配的敏感數據識別方法不夠智能,易出現漏檢(尤其是在文檔等數據)。引入相似度計算、聚類、監督學習等智能方法,提升識別能力與檢測效果。
合規遵循:GDPR的30條和《網絡安全法》的21條。
行業應用(代表公司):Securit.ai、BigID等。
2) 數據脫敏風險評估
技術原理:數據脫敏在企業進行廣泛應用,然而不同脫敏方法的安全效果不同。通過對脫敏數據集的身份標識度和隱私泄露風險進行定量地評估與刻畫,實現風險管理和控制。
合規遵循:GDPR的32條和《網絡安全法》的42條。
行業應用(代表公司):Privacy Analytics、綠盟科技等。
圖4 綠盟科技的數據脫敏風險評估應用
4) 用戶實體行為分析
技術原理:通過對用戶實體持續的畫像與建模,并建立正常用戶行為基線,從海量收集的安全數據中發現數據泄露等異常行為。
合規遵循:GDPR的32條和《網絡安全法》的42條。
行業應用(代表公司):Splunk、綠盟科技等。
圖5 綠盟科技的UEBA數據安全防護方案
4 前沿技術+企業間數據共享與計算
在該類場景中,企業需解決企業之間的數據安全共享與計算的安全與合規問題,可引入下述創新技術:
1) 數據匿名
技術原理:對個人信息進行泛化和屏蔽等處理,使得對應的個人信息主體無法被識別,以達到“匿名”的效果,包括K-匿名、L-多樣性和T-近似性等技術。
合規遵循:GDPR的前言26段和19條,以及《網絡安全法》的42條。
行業應用(代表公司):Immuta、Privitar、 Anonos、綠盟科技等。
圖6 綠盟科技的自適應匿名化算法應用
2) 同態加密
技術原理:明文數據經過同態加密后得到的密文數據,在不解密情況下仍然可執行密文數據的處理與操作。敏感數據在同態加密與計算環節處于加密狀態,實現了數據的計算,同時保障了安全性。
合規遵循:GDPR的前言5條和32條,以及《網絡安全法》的42條。
行業應用(代表公司):Duality 等。
圖7 Duality的同態加密平臺在金融數據共享應用(圖引自[3])
3) 安全多方計算
技術原理:在參與方互不信任的情況下進行協同計算,在保證計算結果正確性同時不泄露任何一方輸入的原始數據和狀態數據。
合規遵循:GDPR的前言5條和32條,以及《網絡安全法》的42條。
行業應用(代表公司):Google、螞蟻金服等。
4) 聯邦學習
技術原理:多個參與方(如企業、用戶移動設備)在不交換原始數據情況下,即在隱私保護前提下,實現聯合機器學習的建模、訓練和模型部署。
合規遵循:GDPR的前言5條和32條,以及《網絡安全法》的42條。
行業應用(代表公司):Google、Apple和微眾銀行等。
5 小結
隨著全球數據隱私法規的密集發布,包括歐盟GDPR,美國CCPA,國內的《網絡安全法》,以及今年發布的《數據安全法(草案)》、《個人信息保護法(草案)》,合規性成為了企業數據安全建設與治理的重要驅動力。在合規視角下,數據安全的內涵在合規與業務安全雙重需求驅動下不斷外延和擴展,數據安全的覆蓋的應用場景將變得更加多樣化,給傳統的數據安全技術與方案帶來了巨大的挑戰。如何實現破局?本文簡要介紹的十種新興的數據安全技術,可為破局新場景新挑戰帶來一些思路與啟發——助力企業在滿足安全合規同時創造更大的數據價值。