時間進入千禧年,網際網路泡沫在科技投資熱潮時應聲而破,隨之而來的是科技公司的大更迭。進入移動網際網路時代之後,隨著網際網路和移動智慧硬體如野火般蔓延式的普及,資料呈現“指數級”增長。根據IDC資料預測,全球資料總量增長維持在 50%以上,至 2020 年全球資料總規模達 40ZB。大資料市場也已經突破千億規模,並持續保持高增長態勢。
在我們的日常生活中,大資料已經無處不在,包括社交、購物、活動出行、餐飲的地理位置等資訊。有效利用這些資料可以實現精準挖掘使用者需求,提高企業經營效率和業績,尤其針對於社交、金融、醫療、廣告、電商等垂直領域效果尤為顯著。我國網際網路巨頭企業基本都集中在這幾個行業之內,大資料的運用對它們的商業模式至關重要。
而大資料的運用則離不開資料智慧。資料智慧是基於大資料引擎,透過大規模機器學習和深度學習等技術,對海量資料進行處理、分析和挖掘,提取資料中所包含的資訊和知識,使資料智慧化,並透過建立模型尋求解決方案以及實現預測。資料智慧行業基本可以劃分為資料獲取、資料探勘、資料應用三個領域。資料獲取方式與維度有著諸多不同,面向不同的行業也存在差異。SDK就是資料獲取的常見方式。
SDK是廣泛應用於 APP 中的開發工具集合,透過專業化分工達到縮短開發週期、節省資源的效果,其中又分為基礎與專業兩個型別。基礎型是指通用程度比較強的平臺性質的 SDK ,如 Java SDK、安卓 SDK 等;專業型則根據功能的不同可以分為推送、通訊、儲存、安全、地圖及位置服務、統計及增長、社交、廣告、語音識別、影象識別等。
SDK的運用使大資料獲取方式更加便捷,但隨之而來的資料隱私問題也逐漸顯露。手機APP提供的《隱私保護政策》並不能良好地保護使用者隱私,反而成為在法庭上用來開脫的工具。在手機隱私洩露日趨嚴重的今天,我們應該如何應對在數字世界“裸奔”?
資料的達摩克里斯之劍
創新工場董事長李開復曾在公開場合表達了對網際網路公司拿走個人資料的看法,他表示網際網路巨頭拿走個人資料賺錢,獲得授權和分成給個人仍是理想主義,“現在把資料還給你,它沒辦法做好AI了,會使你更不便,應該是誰用資料做了壞事就去懲罰它,而不是把資料全部收回來還給個人。”
誠然目前網際網路公司提供的服務都是建立在經過大資料的分析與運用之上,海量的使用者移動裝置資料構建了資料智慧行業的商業基石。但“精準推薦,為您服務”卻不應是對使用者隱私資料肆意獲取、加工、獲利的藉口。
目前,資料市場面臨的兩個核心問題:
· 從法律層面,對個人隱私資料的使用沒有嚴密的法律保護制度。
· 從技術層面,如何保護隱私資料,且可商用,依舊是時下最需要解決的難題。
隱私計算是指在資料或計算方法保持“加密”狀態,不洩露給其他合作方的前提下,進行計算合作的技術,它為我們提供了資料在隱私保護的前提下得以合規使用的技術解決方案。隱私計算的概念最早是在2016年提出的,主要包含密碼學、可信執行環境(TEE)、聯邦學習等方向。而密碼學則包含全同態加密、安全多方計算、零知識證明等主要技術。目前,隱私計算在金融、醫療等行業已經得到了採用,PlatON透過對密碼學長時間的投入研究與技術研發,構建隱私計算網路與金融基礎設施,在工程化程度和商業應用方面走在了世界前列。
我們也很欣喜地看到國內法律層面對個人隱私保護越來越重視。近期深圳市釋出《深圳經濟特區資料條例》(徵求意見稿),其中對資料有著創新性定義,資料是關於客體(如事實、事件、事物、過程或思想)的描述和歸納,是可以透過自動化等手段處理或再解釋的素材。這個定義突破了以往我們拘泥於資料是個人資訊數字化的定義,將資料的範圍進一步擴大。同時,自然人、法人和非法人組織依據法律、法規和本條例的規定享有資料權,任何組織或者個人不得侵犯。資料權是權利人依法對特定資料的自主決定、控制、處理、收益、利益損害受償的權利。資料隱私保護方面相關法律法規的陸續出臺,使得個人資料隱私保護初見曙光。
透過隱私計算技術與法律法規的不斷完善的雙保險,懸在資料市場頭上的達摩克里斯之劍有望真正“鋒入劍鞘”。