1.引言
相比於區塊鏈技術與2019年才上升為國家戰略,大資料技術成為國家戰略早了四年,發展更為成熟,產業規模更大,對於國民經濟和社會生活的影響也更為深入。不過,大資料產業在發展的過程中,也遇到了諸多的瓶頸和問題,阻礙了自身的進一步發展。
同為新興技術,區塊鏈技術與大資料技術有著諸多的結合點。前者能夠幫助後者克服現有的困難與不足,並且全面驅動後者再上一個新的臺階。
2.大資料發展現狀
“大資料”這個概念由《自然》雜誌在2008年提出,但其發展時間還要更早。而在2006年之後,大資料技術在以谷歌為首的科技巨頭的推動下快速發展;從2009年開始,大資料基本技術成熟,學術界和企業界開始進行大資料技術的應用研究。2013年被稱為大資料元年,從此大資料技術開始向商業、科技、醫療、政府、教育、經濟、交通、物流及社會的各個領域滲透,直到今天。
2.1 產業規模大,發展速度快
隨著全球網際網路的進一步成熟與數字化程序的不斷加快,全球資料產量高速增長。在剛剛過去的2019年,全球資料量可達41ZB(1ZB=2的70次方KB),這個數字相當於全世界所有人的腦細胞數量總和,可以說,資料已經填滿了我們每個人的大腦。
(圖片來源:中國信通院)
在資料量激增的背景下,大資料行業也展現了一個非常高的增速。從2016年到2021年(資料含預測),我國大資料產業規模將從約2800億元突破8000億元,每年的增速雖然有所放緩,但仍保持20%以上的年增速,規模擴張仍可謂迅速。
(圖片來源:大資料產業聯盟)
新一代資訊科技快速發展,數字中國和新型智慧城市等建設專案加速推進,以及經濟社會的轉型發展和動能轉換,這些因素都在持續推動我國大資料產業的發展,加速技術革新和應用拓展。
2.2 政策佈局覆蓋完善
近年來,中央政府和各級地方政府頻繁出臺與大資料有關的政策,已經形成多層次協同推進的大資料發展政策環境。僅2015年~2018年,中央政府、省級政府及市區級政府出臺的大資料相關政策就達到340個。其中影響力最大的主要包括:
2014年大資料被寫入政府工作報告;
2015年國務院正式印發了《促進大資料發展行動綱要》,成為我國發展大資料的首部戰略性指導檔案;
2016年《十三五規劃綱要》的公佈標誌著國家大資料戰略的正式提出,彰顯了中央對於大資料戰略的重視;
2016年12月,工信部發布《大資料產業發展規劃(2016-2020 年)》,為大資料產業發展奠定了重要的基礎;
2017年10月,黨的十九大報告中提出推動大資料與實體經濟深度融合,為大資料產業的未來發展指明方向;
2019 年 3 月,政府工作報告第六次提到“大資料”,並且有多項任務與大資料密切相關。
截止目前,全國除港澳臺外的全部31個省級行政區都出臺了關於大資料的產業政策,合計347條;16個省級行政區和79個市級行政區成立了大資料管理機構;據不完全統計,18個省級行政區共成立了46個大資料產業園區;國內大資料政策環境已經相當完善。
2.3 資料合規要求愈發嚴格
近兩年來,各國在資料合規性方面的重視程度越來越高,但資料合規的程序仍任重道遠。2018年5月,旨在保護歐盟公民的個人資料、對企業的資料處理提出了嚴格要求的《通用資料保護條例》(GDPR)開始實施,並帶來了全球隱私保護立法的熱潮,成功提升了社會各領域對於資料保護的重視。例如,2020 年1月起, 美國加州的消費者隱私法案(CCPA)也將正式生效,對所有和美國加州居民有業務的資料商業行為進行監管。除加州CCPA外,更多的法案正在美國紐約州等多個州陸續生效。
與全球不斷收緊的資料合規政策相類似,我國在資料法律監管方面也日趨嚴格規範。 當前我國大資料方面的立法呈現出以個人資訊保護為核心,包含基本法律、司法解釋、部門規章、行政法規等綜合框架。一些綜合性法律中也涉及了個人資訊保護條款。相關法律主要包括五類:
基本法律:
《中華人民共和國網路安全法》和《全國人民代表大會常務委員會關於加強網路資訊保護的決定》等;
司法解釋:
主要包括《關於辦理侵犯公民個人資訊刑事案件適用法律若干問題的解釋》、《最高人民法院關於審理利用資訊網路侵害人身權益民事糾紛案件適用法律若干問題的規定》等;
部門規章:
主要包括《電信和網際網路使用者個人資訊保護規定》、《中國人民銀行關於銀行業金融機構做好個人金融資訊保護工作的通知》等;
行政法規:
主要包括《徵信業管理條例》等;
綜合性法律:
在《民法總則》、《刑法修正案(九)》、《侵權責任法》、《消費者權益保護法》、《反恐怖主義法》等綜合性法律中,也有涉及個人資訊保護的相關條款。
2019 年以來,資料安全方面的立法程序明顯加快。中央網信辦針對四項關於資料安全的管理辦法相繼釋出徵求意見稿,包括《網路安全審查辦法(徵求意見稿)》《資料安全管理辦法(徵求意見稿)》《兒童個人資訊網路保護規定(徵求意見稿)》和《個人資訊出境安全評估辦法(徵求意見稿)》。其中,《兒童個人資訊網路保護規定》已正式公佈,並於10月1日開始施行。
但不可否認的是,從法律法規體系方面來看,我國的資料安全法律法規仍不夠完善,呈現出缺乏綜合性統一法律、缺乏法律細節解釋、保護與發展協調不夠等問題。2018 年,十三屆全國人大常委會立法規劃中的“條件比較成熟、任期內擬提請審議的法律草案”包括了《個人資訊保護法》《資料安全法》兩部。個人資訊和資料保護的綜合立法時代即將來臨。
3.大資料發展痛點
但是,在大資料行業發展至今,技術的負面作用也逐漸顯現。數字社會的未來願景越巨集大,大資料的作用越關鍵,這些負面作用也就越危險,愈發亟待解決。這些隱患和痛點主要分為四個部分,而在這四個部分中,也存在著清楚的邏輯關聯。接下來我們首先簡述這四個部分,再闡述其中的邏輯關係。
3.1 資料洩露
由於平臺掌握了大量使用者資料,從而因為主觀和客觀的原因,例如灰產交易、撞庫攻擊、內部人員洩露等,均可能造成資料洩露。近年來,資料洩露頻發,影響力較大的有Facebook的多次隱私洩露事件,最近的一次就在幾天前,每次涉及的全球使用者都有數億之多;而在18年底,喜達屋酒店的使用者資訊洩露,涉及使用者也達到5億。資料洩露的後果並不侷限於侵犯使用者的隱私權,更可能造成電信詐騙、系統遭受攻擊等更加嚴重的後果。而我們可以想象,被揭露的隱私洩露事件只是冰山一角。根據波耐蒙研究所釋出的《2019年資料洩露成本研究報告:全球分析》所示,目前單次資料洩露事件的平均損失為392萬美元,客戶信任度的喪失、對企業形象的負面影響等無形資產的損失更是數額巨大、難以估量。
3.2 資料濫用
即使資料沒有被洩露或者買賣,平臺對於資料的使用也存在諸多問題。例如,平臺透過大資料分析使用者的特徵,然後進行不合理的價格歧視,也就是我們常說的“大資料殺熟”;另外,平臺還透過大資料分析使用者喜好,過度傳播強娛樂化的,較為低俗的資訊。應該說,平臺合理使用大資料對使用者進行使用者畫像,提供使用者喜歡的內容,都是正常的商業行為;但過度濫用資料,損害使用者的正常權益,或是隻顧流量,不顧社會公序良俗和自身社會責任感,都是資料濫用的負面行為。
3.3 資料確權
在大資料行業中,資料量的規模是非常重要的。一般來說,資料規模越大,越有分析價值。然而,資料的產生者是廣大的使用者,資料所產生的價值卻是由平臺享受。這是因為,資料雖然由使用者的行為產生,但是由於技術原因,資料的掌控權卻在平臺手上。另一方面,使用者自己的資料單獨來看並不能產生價值,而只有將大量使用者的資料聚合才能產生價值。從這個角度上來看,使用者作為資料的生產者,平臺作為資料的聚合者,都理應分享資料的價值,但目前資料卻無法確權,資料的生產者和資料的價值無法進行繫結。
3.4 資料共享
由於資料巨大的商業價值,在同一行業的不同競爭對手中,為了防止商業秘密的洩露和商業價值的損害,很難進行資料共享,從而形成了大量資料孤島。然而,合作在很多場景下是非常必要的,資料的無法共享對行業中的不同角色來說,都會對自身的發展產生阻礙。這也大大增加了平臺透過正常途徑獲取資料的可能性。
四大隱患之間的邏輯關係如下:
(1)資料確權問題是所有問題的起源
無論是隱私洩露、濫用,還是資料共享的困難,其根本原因還是資料確權的問題。由於資料的產生者使用者無法對自己的資料進行確權,才使得平臺可以洩露、濫用使用者的資料;也同樣是因為資料的擁有者無法保障自身對於資料的控制,才使得不同平臺之間無法達成資料的共享。
(2)部分場景下,資料洩露是無法進行資料共享的替代手段
由於資料共享無法進行,導致部分平臺無法透過合理途徑獲取使用者資料,從而試圖透過非法手段獲取資料,這就給了資料洩露生存的土壤。如果能夠促進資料共享,資料洩露情況也會隨之減少。
可見,四大隱患之間是相互聯絡的,而問題的關鍵癥結是資料確權。由此,資料確權問題也是大資料產業所需要解決的核心問題。然而,由於資料確權不同於傳統物權,目前法律專家們傾向於將資料的權屬分開,即不探討整體資料權,而是從管理權、使用權、所有權等維度進行探討。但總的來說,相關研究、法律都尚未形成足夠的支撐。