摘 要
個人信息數據作為大數據應用場景的重要組成部分,在個人信息處理和應用過程中面臨極大的數據安全風險。如何在個人信息利用與安全保護之間達到平衡,充分挖掘個人信息作為重要生產要素的價值,成為當下個人信息保護的難點。通過對個人信息的微數據進行分類分級,并根據分類分級結果在應用場景中采取不同的安全保護措施(如授權、脫敏、加密等),實現對個人信息的精細化管理和保護,對推動個人信息數據價值化發展意義重大。
隨著數字治理、數字經濟、數據社會等數字化產業的不斷發展,個人信息的收集和利用變得越來越普遍。同時,個人敏感信息泄露、濫用等事件頻發,對數字化發展產生極大的負面影響。在數字化時代下,個人信息保護正遭受前所未有的新挑戰,具體體現在以下幾個方面:
(1)應用廣,暴露面大:個人信息在大數據時代應用越來越廣泛,包括疫情防控、個人廣告推廣、便民服務、信用評級等,使得個人隱私信息暴露風險大大增加 。
(2)流程長,接觸者多:個人信息從采集、匯聚、治理、分析、共享、應用直至銷毀等過程, 涉及的每一個業務流程,都需要對相應人員開放必要數據權限,以滿足基本的數據處理需求, 任何一個接觸數據的人員都有可能成為數據泄露源。
(3)價值高,威脅更大:個人信息已經成為各行各業的戰略資源和隱形資產,數據量越大則價值越高,是不法分子竊取和勒索的重要對象。
(4)強保護,價值難體現:個人信息數據價值高,但過度保護將不利于數據價值的體現。因此,在數據作為新的生產要素的數字化時代中,仍采用傳統方式對所有數據采取一致的安全防護措施已無法滿足新的安全需求, 基于分類分級的安全防護成為解決數據安全精細化管理的有效途徑。個人信息作為數據的重要組成部分,尤其在面向個人的大數據應用場景下,如何有效利用個人信息作為新的生產要素發揮價值,同時又避免個人隱私數據的泄露成為當下亟待解決的問題。
01
分類分級安全保護現狀
國家“ 十三五” 規劃明確指出, 加強數據資源安全保護,建立大數據安全管理制度, 實行數據資源分類分級管理, 保障安全高效可信應用。《中華人民共和國網絡安全法》第二十一條明確指出,采取數據分類、重要數據備份和加密等措施,保障網絡免受干擾、破壞或者未經授權的訪問,防止網絡數據泄露或者被竊取、篡改。《中華人民共和國數據安全法》第二十一條明確指出,國家建立數據分類分級保護制度, 根據數據在經濟社會發展中的重要程度,以及一旦遭到篡改、破壞、泄露或者非法獲取、非法利用,對國家安全、公共利益或者個人、組織合法權益造成的危害程度,對數據實行分類分級保護。《中華人民共和國個人信息保護法》第五章個人信息處理者的義務明確指出,對個人信息實行分類管理,采取相應的加密、去標識化等安全技術措施。
以上是與數據分類分級相關的法規和政策要求,缺乏具體操作層面的指導,對此也出臺了一些與數據分類分級相關的地方性或行業規范指南,對數據分類分級有一定的借鑒作用, 但總體來說仍存在一些不足:
(1)缺乏針對性標準和規范指導:分類分級往往只把個人數據歸為一類進行統一保護, 在實際應用場景中,無法再進行細化管理;《中華人民共和國個人信息保護法》、GB/T 35273— 2020《信息安全技術 個人信息安全規范》、GB/T 37964—2019《信息安全技術 個人信息去標識化指南》等法規及相關安全要求和指導,但在實際落地過程中還存在較大的差異,缺乏針對性的指導。
(2)分類分級與安全保護區分考慮,達不到真正效果:分類分級的目的是更好地實現數據保護,而現今可參考的標準和規范往往將分類分級與安全保護區分開考慮,在大數據應用場景下, 無法實現個人信息作為新的生產要素發揮價值的同時又滿足個人信息保護的閉環管理。
(3)缺乏有效的工具支撐:分類分級安全保護在技術實現方面需要考慮眾多因素。如需要支持不同的數據源、海量數據、頻繁更新數據、數據加工流轉等場景,在數字化時代,這些場景非常普遍,然而目前市面上很少有能滿足這些復雜應用場景的分類分級保護工具。
在個人信息廣泛應用于數字化業務發展的今天,迫切需要有關基于分類分級的個人信息安全保護方法,在確保充分發揮個人信息數據價值的同時,有效避免或降低個人信息數據面臨泄露、濫用等安全風險。
02
分類分級安全保護目標
個人信息分類分級是通過對個人信息微數據①進行分類分級和打標,基于個人信息在不同應用場景的需求,對分類分級的數據采取不同的安全保護措施(如授權、脫敏、加密等), 以實現對個人信息微數據的精細化管理和保護, 確保個人信息在數據治理、數據開發、數據共享等應用場景中的數據使用和數據保護之間的平衡,防止個人信息數據的泄露、濫用等數據安全風險的出現。
03
個人信息分類分級方法
個人信息的分類分級包括分類和分級兩個層面,分類是指對個人信息的微數據基于不同屬性或特征,按照一定的原則和方法進行區分和歸類,以便更好地實現數據的分級;分級是指在分類的基礎上,對個人信息微數據的敏感程度以及遭受泄露、濫用等可能對國家、社會及個人等造成的影響進行分級。因此,需要進一步明確個人信息分類分級的原則和方法。
個人信息分類分級的對象是指個人信息的微數據,具體包括微數據的每條(行)記錄、微數據記錄中的每個字段(列)以及由微數據組合成的數據表。
3.1 分類原則和方法
3.1.1 分類原則
個人信息數據分類可遵循以下原則:
(1)易管理:數據分類的主要目的是便于管理,提高管理效率;
(2)抓重點:重點對個人標識信息進行歸類,對個人信息中的通用屬性可合并歸類;
(3)防交叉:在數據分類時應防止出現分類重復或交叉的情況;
(4)可擴展:對個人數據分類應盡可能滿足多種場景的應用需求,如數據治理、數據開發、數據共享、數據開放等。
3.1.2 分類方法
個人信息分類主要從微數據的兩個維度進行分類:一是按照微數據是否屬于標識信息進行分類,主要包括直接標識符和準標識符;二是微數據是否屬于個人敏感信息;其他的微數據可歸為通用信息。這幾類數據分別舉例說明如下。
(1)直接標識符:微數據中的屬性,在特定環境下可以單獨識別個人信息主體。例如:姓名、地址、電子郵件地址、電話號碼、傳真號碼、信用卡號碼、車牌號碼、車輛識別號碼、社會保險號碼、健康卡號碼、病歷號碼、設備標識符、生物識別碼、互聯網協議地址號和網絡通用資源定位符等。
(2)準標識符:微數據中的屬性,結合其他屬性可唯一識別個人信息主體。比如:性別、出生日期或年齡、事件日期(例如入院、手術、出院、訪問)、地點(例如郵政編碼、建筑名稱、地區)、族裔血統、出生國、語言、原住民身份、可見的少數民族地位、職業、婚姻狀況、受教育水平、上學年限、犯罪歷史、總收入和宗教信仰等。
(3)個人敏感信息:是指一旦泄露、非法提供或濫用可能危害人身和財產安全,極易導致個人名譽、身心健康受到損害或歧視性待遇等的個人信息。個人敏感信息包括身份證件號碼、個人生物識別信息、銀行賬號、通信記錄和內容、財產信息、征信信息、選中軌跡、住宿信息、健康生理記錄、交易信息、14 歲以下(含) 兒童個人信息 等。
(4)通用信息:是指有一定通用性的個人微數據信息,如民族、國籍、政治面貌、證件類型、證件名稱等。
3.2 分級原則和方法
3.2.1 分級原則
個人信息數據分級可遵循以下原則:
(1)可執行性 :保證數據分級使用和執行的可行性。
(2)合理性 :數據級別具有合理性,不能將所有數據集中劃分在一兩個等級中,而另外一些等級沒有數據。級別劃定過低可能導致數據不能得到有效保護;級別劃定過高可能導致不必要的業務開支。
3.2.2 分級方法
分級方法主要從分級要素和分級定義兩個方面進行說明。
(1)分級兩要素:識別個人信息主體的難易程度;數據受到泄露或篡改后對個人信息主體造成影響程度 。
(2)分級定義說明:根據可識別個人信息主體難易程度和數據敏感程度,將個人信息數據由低到高劃分為 S1 ~ S5 級,個人信息的分級方法如表 1 所示。
3.3 特殊說明
除以上基于字段分級外,還有一些特殊場景的分級需求,這里簡單描述,本文不再展開說明。
(1)行分級:滿足特殊行信息數據的重點保護要求,如特殊崗位人員信息、14 歲以下(含) 兒童個人信息,可根據提供的特定人員安全要求情況進行分級,一般不低于 S4 級。
(2)表分級:針對一個完整隱私事件的記錄,在獨立字段沒有意義的情況下,適合用整張表定級,如酒店住宿信息中包括入住日期、離店日期、酒店名稱、入住房間號等。
3.4 分類分級示例
基于某項目個人信息匯集情況,按照個人信息數據分類分級方法,給出了分類目錄和分級目錄如表 2、表 3 所示,供其他企業在個人信息保護方面提供參考。
04
分類分級安全保護技術實現
分類分級是為了更好地實現對個人信息微數據的精細化管理和保護,確保個人信息在數據治理、開發、共享等應用場景中的數據使用和數據保護之間的平衡,因此,個人信息保護的核心是實現基于分類分級的數據安全管控,分類分級與安全保護兩者之間不是各自孤立存在,而是緊密結合、相互依存的。
4.1 技術架構
從分類分級工具的技術架構設計來看,應至少包括數據接入、分類分級服務、數據安全控制、標準應用程序接口等功能,以支持數據治理、數據共享、數據開放等不同應用場景中對數據安全保護的要求,分類分級工具技術架構參考如圖 1 所示。
圖 1 分類分級工具技術架構
如圖 1 所示,分類分級工具技術架構包含數據層、控制層、服務層、接口層和中臺層。數據層是指分類分級的數據源,包含傳統數據庫和各類大數據平臺;控制層是指授權、脫敏、加密、審計等各類安全控制措施;服務層主要實現對數據層數據的分類服務和分級服務;接口層是指將服務層和控制層的能力通過接口方式對外提供服務;中臺層是指數據歸集、治理、共享、開放等各類與數據相關的業務,在業務實現過程通過接口調用底層數據分類分級和相關控制措施實現數據利用與安全保護之間的平衡。
4.2 關鍵技術實現方法
分類分級技術工具的實現需要綜合考慮多方面的因素,才能較好地適應各應用中復雜場景的需求,除滿足基本分類分級功能外,還需要重點考慮以下關鍵技術實現。
(1)數據源自動發現:自動發現未知數據源資產,實現數據源資產持續管理。如支持掃描網段信息、自定義掃描端口等;能自動發現常見的數據庫和數據倉庫的類型;支持定期掃描,以反映不同數據庫服務上線的變化。
(2)高識別率:應支持正則表達式、機器學習、智能推薦等多種模式,提高數據自動識別的準確率,降低人工干預成本。
(3)多源數據接入:支持大數據平臺、傳統數據庫、分布式數據庫等數據接入及元數據采集。
(4)支持多種掃描方式:支持元數據的全量掃描、增量掃描的方式進行自動化分類分級打標;支持實時掃描新增數據和加工后新生成數據的分類分級打標,避免因此產生的防護真空。
(5)支持多種分級模式:支持列分級、行分級、表分級以滿足不同業務需求。列分級即字段分級,是數據分類分級的最小單元,是分類分級的基本功能;行分級主要是滿足特殊行信息數據的重點保護要求,如特殊崗位人員信息;表分級是指針對一個完整隱私事件的記錄表,獨立字段都沒有意義的情況下,適合用整張表定級,如酒店住宿表。
(6)多場景支持:滿足數據加工、數據共享、數據開放等不同場景中數據分類分級需求。
(7)權限聯動:基于分類分級聯動,實現權限的自動分配。
4.3 分類分級安全保護示例
數據安全防護措施主要包括數據授權、數據脫敏、數據加密、數據水印、安全審計等 ,為便于更好地理解分類分級與安全保護之間的關聯關系,下面通過數據授權、數據脫敏兩個方面介紹如何將數據分類分級與數據防護措施相結合, 如表 4 所示,以有效實現數據安全閉環的效果。
表 4 分類分級與安全措施對應
數據授權是指針對可以接觸個人信息數據的不同人員,如數據安全管理員、內部數據管理員等,根據業務需求設置不同的訪問權限,訪問權限應與數據分級進行關聯,確保數據授權滿足最小服務的授權原則。
數據脫敏的核心是實現數據可用性和安全性之間的平衡,既要滿足業務系統的需求,又要兼顧最小可用原則,最大限度地保護敏感信息。因此,在實施過程中,應該圍繞可用性和安全性兩方面進行規范。例如當敏感數據用于開發測試場景中,可采用如數據擾亂等保留數據屬性特征的脫敏方式;如果將敏感數據用于大屏公開展示情況,則可以選擇掩碼方式隱藏部分敏感內容。企業應結合自身業務開展的情況,分類分析數據需要脫敏的場景,規范每種場景下數據脫敏的規則和流程。
05
結 語
本文闡述了個人信息保護面臨的新挑戰及防護現狀,提出通過對個人信息的微數據進行分類分級,并根據分類分級結果與數據安全保護措施相結合的方法,實現對個人信息的精細化管理和保護,給出了個人信息分類分級方法建議以及分類分級工具技術實現需要重點考慮的因素,為其他企業在個人信息保護方面的研究及實踐提供參考。