當前,資料流通不暢已成為制約我國大資料產業發展的重要問題。資料擁有者出於資料安全保密的顧慮而不願共享資料,使得不同企業、不同機構間難以利用對方的資料進行聯合分析或建模。為解決這一問題,大資料從業者們從多種角度進行了諸多探索。從目前發展現狀和趨勢看,隱私計算技術最有可能成為實現這一突破的關鍵。
一、隱私計算概述及應用價值
隱私計算(Privacy Computing)
是指在保護資料本身不對外洩露的前提下實現資料分析計算的一類資訊科技,主要分為密碼學和可信硬體兩大領域。
密碼學的技術目前以多方安全計算(MPC)為代表。多方安全計算技術核心思想是設計特殊的加密演算法和協議,從而支援在加密資料之上直接進行計算。目前MPC透過秘密分割、不經意傳輸、混淆電路或同態加密等專門技術實現,通用性相對較低、效能處於中等水平,但近年來效能提升迅速、應用價值極高。
可信硬體技術目前主要指可信執行環境(TEE),其核心思想是構建一個硬體安全區域,資料僅在該安全區域內進行計算。TEE將信任機制交給硬體方(Intel的SGX、ARM的TrustZone、AMD的SEV等產品),嚴格來講並不屬於“資料可用不可見”,但其通用性高、開發難度低,使得在資料保護要求不是特別嚴苛的場景下存在價值發揮的可能。
此外,國內外還衍生出了聯邦學習、共享學習、知識聯邦、聯邦智慧等一系列“聯邦學習類”技術。這類技術以實現機器學習、資料建模、資料預測分析等具體場景為目標,透過對上述技術加以改進融合,並在演算法層面進行調整最佳化而實現。相關技術的主要對比如下表所示。
隱私計算不洩露原始資料,可以在保護資料安全的前提下實現資料多元跨域融合,有助於破解資料保護與利用之間的矛盾。權威機構Gartner在2019年技術成熟度曲線報告中首次將隱私計算(其稱為機密計算)列為處於啟動期的關鍵技術。世界經濟論壇2019年9月釋出的白皮書認為,隱私計算技術將成為釋放金融服務行業新價值的關鍵技術。
二、隱私計算產業發展環境
近兩年來,伴隨著技術的不斷成熟,國內外隱私計算產業化應用的步伐明顯加快。未來幾年將會是隱私計算產業化快速發展的關鍵階段。
1. 國外隱私計算技術產品創新活躍,但仍處於發展初期
2019年以來,國外科技巨頭快速佈局隱私計算產業。2019年4月微軟新發布的兩項專利申請表明,其正考慮在擬推出的區塊鏈產品中使用TEE。2019年8月,谷歌釋出訊息稱,將推出新型MPC開源庫,以隱私安全的方式進行資料協作。麻省理工學院背景的初創公司 Enigma也推出了基於MPC的新加密系統。但從整體發展情況來看,國外的隱私計算產品形態仍處於較為初步的階段,未形成產業生態圈,也尚未形成壟斷格局。
2. 國內隱私計算技術產品蓬勃發展,形成一定優勢
我國的隱私計算技術產業化也在近年來快速啟動。螞蟻金服、騰訊雲、百度在2019年紛紛推出了各自的MPC產品。阿里巴巴、微眾銀行、京東等企業也在各自的技術領域形成一定優勢。目前,各網際網路巨頭企業均在隱私計算領域加快佈局,形成跨業務、多團隊、強支撐的發展態勢。此外,華控清交、富數科技、數牘科技、鍩崴科技、光之樹科技、零知識科技等一批專注於隱私計算產品化的初創企業也不斷湧現。諸多區塊鏈企業、資料安全企業、金融風控企業、電信企業等也紛紛擁抱隱私計算技術。在大資料產業快速發展的牽引下,我國隱私計算技術產品正在逐步成熟、應用場景快速擴充,已經形成了一定的競爭優勢,並有望在國際競爭中佔據有利地位。
3. 產業政策正在助推隱私計算技術和應用發展
工業和資訊化部早在2016年年底釋出的《大資料產業發展規劃(2016-2020年)》中就已經提出支援企業加強多方安全計算等資料流通關鍵技術攻關和測試驗證。中國人民銀行2019年9月頒佈的《金融科技(FinTech)發展規劃(2019-2021年)》也提出,要利用包括MPC在內的技術提升金融服務安全性。工信部《工業大資料發展指導意見(徵求意見稿)》也提出在工業領域積極推廣MPC技術,促進工業資料安全流通。政策的提前佈局對於我國搶佔隱私計算技術和應用關鍵領域奠定了良好基礎。
三、隱私計算應用發展現狀
1. 近年來隱私計算技術和應用快速成熟
以MPC為例,自20世紀80年代姚期智等人提出以來,這項技術更多停留在學術研究層面,實用價值不高。近年來,隨著演算法協議的最佳化和硬體計算能力的增強,MPC計算耗時已經從數十萬倍下降至100倍以內,其可用性大大增強。同時,隨著其它配套安全技術的逐漸成熟,隱私計算的技術和產品成熟度在近兩年迅速提升。
2. 隱私計算應用場景不斷擴充套件
伴隨著我國大資料產業的持續發展和資料安全共享的需求快速迸發,隱私計算技術的應用場景越來越多。金融行業已經開啟隱私計算應用。目前國內隱私計算產品主要應用於金融行業的風控和獲客,即多家金融相關機構在不洩露客戶個人資訊的前提下對客戶進行聯合畫像和產品推薦,在多頭借貸等場景下能有效降低違約風險。醫療行業正在成為隱私計算關注重點。透過隱私計算技術,醫療機構與保險公司之間可以在不共享原始資料的情況下分析投保者的健康資訊。政務行業有望成為隱私計算下一個應用重點。隱私計算提供了政府資料與電信企業、網際網路企業等社會資料融合的解決方案。在部分地方政府的相關規劃裡,已經有所涉及。
3. 信任機制是隱私計算廣泛應用的關鍵
隱私計算技術自誕生以來重要使命便是保證隱私資料在利用過程中不被洩露。作為一項新技術,如何能自證安全、持續強化安全、建立市場信任是其被廣泛應用的關鍵。“自證安全”是隱私計算應用的起點,當前隱私計算應用主要透過深入介紹產品保密演算法機制、簽訂嚴格保密協議和引入第三方評測機構評測產品來實現。持續強化安全是隱私計算應用的長效保障,目前主要透過不斷最佳化演算法來防範惡意攻擊,更加嚴格控制計算流程來封堵漏洞等方式實現。建立市場信任是隱私計算產品應用的關鍵問題。在隱私計算過程中,透過嚴格的資料授權、身份驗證、狀態監控預警等方式讓資料提供方始終清楚己方資料的用量、用法、用途均不超出事先約定,可以充分建立使用者信任乃至市場信任,但當前的應用在這一部分工作仍需加強。
四、隱私計算髮展面臨的問題
我國隱私計算髮展具備一定優勢、存在廣闊應用空間,但由於技術發展仍不完善,因此也面臨著一些問題。
1. 隱私計算技術效能還難以滿足大規模商用要求
雖然目前隱私計算的效能已經大大提升,但由於其加密機理複雜、互動次數多,當流通的資料量較大或結構較為複雜時,計算效率問題仍然未能解決。特別是對於複雜演算法的聯合建模效率仍然難以令人滿意。
2. 隱私計算技術市場難以迅速培育
相對於其巨大的市場前景,目前隱私計算技術的市場還遠未成熟,而市場環境的培育也呈現出較大的難度。一方面,由於隱私計算技術複雜且常常呈現“黑盒化”現象,大部分使用者對隱私技術難以理解和信任。另一方面,隱私計算處理的物件往往是敏感的資料資產,試錯成本大,從而更加增加了使用者的接受成本。
4. 目前大部分企業的資料規範性和資料質量難以支撐隱私計算技術
由於隱私計算演算法敏感度較高,因此對參與方的資料規範性和資料質量要求也較高。此外,隱私計算多用於跨企業甚至跨行業的資料流通,對參與方的資料一致性也提出了較高要求。
5. 現有法律法規未對隱私計算地位進行明確定位
例如,《中華人民共和國網路安全法》中規定“未經被收集者同意,網路運營者不得向他人提供個人資訊”,同時設定了“經過處理無法識別特定個人且不能復原”的例外條款。將個人資訊用於隱私計算是否屬於這一例外條款,法律法規及相關標準等並無明確界定。然而,由於隱私計算僅僅避免了原始資料轉移的過程,但仍然完成了基於多方資料的計算,使得其在某種程度上依然破壞了消費者的隱私。這正在成為制約隱私計算髮展的無法迴避的問題。
五、隱私計算髮展趨勢
從技術角度看,隱私計算正呈現出如下趨勢。
1. 與區塊鏈結合構建完整解決方案
區塊鏈的公開透明和全節點驗證,資料將流經區塊鏈上的每個節點,使其無法很好地處理隱私資料。將隱私計算應用於區塊鏈上,既一定程度上增加了隱私計算結果的不可篡改性和可驗證性,也增加了區塊鏈上資料的保密能力,目前成為諸多廠商的技術融合方向。
2. 軟硬體協同提升隱私計算效能
硬體加速在隱私計算效能提升方面正在發揮越來越關鍵的作用,特別是一些專用晶片和控制元件的使用,明顯提升了隱私計算的效能。
3. 向大規模分散式計算邁進
2020年以來隱私計算逐漸成熟的一個表現就是分散式隱私計算的逐漸應用,為解決隱私計算在計算量方面的瓶頸提供了優秀實踐。
4. 與平臺設施的進一步整合
越來越多的隱私計算企業將其產品與大資料平臺設施進行整合,從而提供從儲存計算到建模挖掘的全方位能力,大大提升產品的便利性。
5. 隱私計算的實現方式更加多樣化
對於短週期專案,透過低程式碼甚至零程式碼開發,透過圖形化拉拖拽的方式替代編碼可以大大節省開發效率,降低隱私計算產品開發門檻。
作為解決資料流通、實現資料價值的關鍵突破口,隱私計算技術未來的發展前景非常美好。如何進一步地推動隱私計算技術和產業發展,也是相關從業者的關注熱點。中國信通院從2017年起持續深入研究隱私計算技術,推出了《資料流通關鍵技術書白皮書》《多方安全計算技術與應用研究報告》等成果,2019年釋出《基於多方安全計算的資料流通工具 技術要求與測試方法》標準,並進行了兩輪共計15個產品的評測,成為業界具有很高影響力的權威評測。2020年7月,與近20家業內企業共同編寫的《基於可信執行環境的資料計算平臺 技術要求與測試方法》《基於聯邦學習的資料流通工具 技術要求與測試方法》兩項標準同時釋出,標準符合性評測即將開展。相關效能測試工具正在研發中。歡迎相關企業參與,共同豐富隱私計算產業應用、推動大資料產業發展。
作者簡介
閆 樹,中國資訊通訊研究院雲端計算與大資料研究所大資料與區塊鏈部副主任,高階工程師。主要從事大資料、資料流通等方面的研究工作。
袁 博,中國資訊通訊研究院雲端計算與大資料研究所工程師。主要從事大資料、資料流通等方面的研究工作。
文章內容摘自中國信通院,如有侵權聯絡刪除