姚前:區塊鏈高質量發展與資料治理 | 網際網路金融
By 區塊鏈資訊·
怎麼發展好區塊鏈是當前亟須回答的關鍵命題。本文認為,先從資料存證、共享入手是務實策略,考慮到技術前沿在公有鏈,我們應支援公有鏈的研究,為了防範風險,須改造公有鏈。基於現實環境,聯盟鏈或許是應用落地的較優選擇。應加強國產密碼演算法應用和創新發展,以保障我國區塊鏈安全可控。當前最重要的是,我們應提倡區塊鏈的高質量發展,為此,需要加強鏈上和鏈下資料治理(Data Governance),建立有效的區塊鏈數字治理體系。習近平總書記在中共中央政治局第十八次集體學習的講話內涵豐富,思想深邃。他敏銳地抓住現代資訊科技發展的前沿熱點,強調要加快推動區塊鏈技術和產業創新發展,高屋建瓴地提出我國區塊鏈技術發展藍圖,為我們指引了方向。同時他又要求客觀辯證地看待創新技術的“雙刃劍”效應,強調要加強對區塊鏈技術的引導和規範,加強風險研究和分析,加強行業自律,落實安全責任,依法治鏈,推動區塊鏈安全有序發展。應該說,要不要發展區塊鏈,已無爭議,怎麼發展才是當前亟須回答的關鍵命題。本文認為,先從資料存證、共享入手是務實策略,考慮到技術前沿在公有鏈,我們應支援公有鏈的研究,基於現實環境,聯盟鏈或許是應用落地的較優選擇。密碼學是區塊鏈技術的重要基石,應加強國產密碼演算法應用和創新發展,以保障我國區塊鏈安全可控。當前最重要的是,我們應提倡區塊鏈的高質量發展,為此,需要加強鏈上和鏈下資料治理(Data Governance),建立有效的區塊鏈數字治理體系。先從資料存證、共享入手,逐步向價值網路發展,是務實的落地策略從現階段技術成熟度看,區塊鏈在價值轉移方面,還存在效能上的爭議,但其本身就是一個點對點的資料共享網路,因此其在資料存證、共享方面的適用性存在較少分歧。在總書記的重要講話中,促進資料共享是他指出的五大區塊鏈作用之一,也是他強調的區塊鏈重點應用方向。利用區塊鏈資料可信優勢,建立資料存證、共享的創新模式,可實現政務資料跨部門、跨區域共同維護和利用,促進城市地區在資訊、資金、人才、誠信等方面更大規模的互聯互通,保障生產要素在區域內有序高效流動,提升城市管理的智慧化、精準化水平。但是區塊鏈技術本身對資料高度冗餘的要求,客觀上增加了計算與儲存開銷;另外,區塊鏈技術在資料透明方面的特性,須結合安全多方計算、同態加密、零知識證明等隱私保護技術,才能在各方自主可控前提下大範圍應用,而隱私保護技術本身的效率還在提高過程中。因此,當前比較合理的實現方法是鏈上共享資料的Hash指紋存證與資訊披露,真實資料按照“資料不出門、資料不落地、資料可用不可見”三原則,依託安全隱私保護技術在鏈下按照授權來共享使用。將來隨著基礎設施與安全技術的進步,有計劃地將系統和受保護的真實資料遷移到區塊鏈上,進而發展成為價值網路。技術研究在公有鏈,場景應用在聯盟鏈從私有鏈到聯盟鏈、公有鏈,社羣信任程度逐步遞減,相應帶來的技術難題(比如共識機制、效能問題、隱私保護等)逐步遞增。私有鏈類似於傳統資訊系統,聯盟鏈是相互信任的機構之間的互聯互通,介於去中心化和中心化之間,根據業務場景的要求,不一定只採用POS或POW,可採用PBFT等傳統共識機制,也可以採用多種共識協議相結合的混合共識機制,Libra即是聯盟鏈。而公有鏈的相互信任程度最低,高度開放和容錯下的安全和效能挑戰所要求的技術水平最高。公有鏈的前沿技術突破,將為聯盟鏈和私有鏈現有技術問題提供新的解決方案。因此,就學術而言,區塊鏈的技術創新關鍵點更多的是在公有鏈上。支援公有鏈的研究,推進聯盟鏈的應用,是我國區塊鏈發展戰略的應有之義。以監管科技應對金融科技,是區塊鏈治理的應對之道可以說,區塊鏈的去中心化對金融監管提出了全新的命題和挑戰,完全開放自由的公有鏈存在合規風險,如承載金融科技應用則必須予以改進。應對之道或許是以監管科技應對金融科技,聯盟鏈是許可鏈,既可以開展跨機構應用,也可為行業自律和監管提供服務。有鑑於此,可考慮在不損害區塊鏈技術優勢的前提下,在公有鏈上增加監管節點,保障公有鏈的合法合規,或者採用多鏈策略,即採用聯盟鏈+公有鏈的“二元模式”,聯盟鏈向相關監管部門註冊,開展鏈上監管,去中心化應用則使用公有鏈,開展去中心化商業活動。若有需要,監管者亦可從聯盟鏈穿透到公有鏈,管控全域性。基於依法合規的現實要求,聯盟鏈或許是應用落地的較優選擇。國產密碼演算法的應用和創新發展,是我國區塊鏈安全可控的基礎本質上,區塊鏈是一個基於密碼學原理的分散式共享儲存與計算系統,其對中心化機構的揚棄和對密碼學技術的依賴,標誌著一種全新正規化的控制權的轉移。就這一個角度而言,國產密碼演算法的應用和創新發展,意義重大。關鍵領域的區塊鏈應用,密碼學技術必須符合國家密碼標準。目前,國家密碼局公佈的中國自主研發的國家商用密碼演算法,包括SSF33、SM1(SCB2)、SM2、SM3、SM4、SM7、SM9、祖沖之密碼演算法(ZUC)等。其中SSF33、SM1、SM4、SM7、ZUC是對稱演算法;SM2、SM9是非對稱演算法;SM3是雜湊演算法。國密演算法有優點,但也有需要改進的地方。以SM2為例,相比傳統的橢圓曲線簽名演算法ECDSA,兩者的簽名和驗籤的核心步驟相近,SM2簽名驗證演算法加入了較多的檢錯功能,提高了簽名驗證系統的資料完整性、系統可靠性和安全性;與廣泛應用的RSA數字簽名演算法相比,SM2在同等安全強度下所需金鑰位數更少,且金鑰對生成速度,簽名速度均優於RSA數字簽名演算法。但SM2也有其劣勢,比如驗籤速度相比RSA處於明顯的劣勢,尚需改進。目前國密演算法還沒有覆蓋到同態加密、零知識證明、多方安全計算等,亟須拓展相應國密演算法庫,並實現標準化。而隨著我國區塊鏈應用跨出國門,國密演算法也應一併走向世界,成為國際標準。這些都對我國國密演算法提出了更高的要求。雖然區塊鏈的應用是去中心化的,但區塊鏈的密碼標準體系是由特定的機構來制定的。某種意義上,誰掌握了密碼標準體系,誰就掌握了區塊鏈發展的話語權。加強鏈上和鏈下資料治理,是現階段推動區塊鏈高質量發展的關鍵如前述所言,資料的互聯互通應是現階段區塊鏈技術的重點應用方向,聯盟鏈或將是其主要形式。但我們應提倡區塊鏈的高質量發展,警惕“大幹特幹,一擁而上”的無序低質量發展。需要強調的是,區塊鏈上的資料應該是具備較高價值的可公開的不宜修改的資料。這是它的特性,更是它的優勢和品質所在。若無謂地把無價值的且可隨意更改的資料上鍊,實際上是對區塊鏈技術的濫用,也無法構建起符合實際業務需求的應用。為此,我們需要建立有效的區塊鏈資料治理體系,以保障區塊鏈應用的質量和品質。通俗來說,資料治理是指所有為提高資料質量而展開的業務、技術和管理活動,包括組織架構、政策制度、技術工具、資料標準、流程規範、監督考核等。國際資料管理協會(DAMA)的《資料管理知識體系指南(DMBOK)》則將資料治理框架定義為資料控制、資料架構管理、資料開發、資料操作管理、資料安全管理、資料質量管理、參考資料和主資料管理、資料倉儲和商務智慧管理、檔案和內容管理、後設資料管理等10個方面。針對區塊鏈技術的特性,或許可從以下幾個方面入手,構建區塊鏈資料治理體系:第一,加強鏈下資料治理的評估與監督,防止短板效應區塊鏈技術可以解決鏈上的信任問題,保障鏈上資料的真實性、準確性與一致性,但對於鏈下資料,區塊鏈則“鞭長莫及”,無法保證其質量。倘若鏈下源頭資料被“汙染”了,區塊鏈上流轉的資料就成了“垃圾”,也就是所謂的“垃圾進垃圾出”(“Garbage in, Garbage out”)。因此,高質量鏈下資料是高質量區塊鏈的前提。而要實現這個前提,則需要依靠各節點的鏈下資料治理。雖然說各節點的鏈下資料治理似乎是各家自己的事情,但某一節點的資料治理缺失往往會限制區塊鏈的整體質量和價值,形成短板效應。因此,各節點應採取有效的技術工具、管理手段和組織體系,對資料在計劃、獲取、儲存、共享、維護、應用、消亡全生命週期可能存在的質量問題,進行識別、度量、監控、預警和改進。為了避免短板效應,可考慮成立聯盟鏈聯合工作組,評測各節點鏈下資料治理的成熟度,督促各方提高上鍊的資料質量,必要時可設定資料治理成熟度的准入門檻。目前已經有了比較成熟的資料治理評價模型可供採用,比如IBM的資料治理成熟度評估模型、CMMI的資料能力成熟度模型(DMM)、EDM的資料能力成熟度模型(DCAM)、DataFlux的資料治理成熟度模型、Oracle MDM主資料管理成熟度模型、MD3M主資料管理能力成熟度模型,以及我國資訊科技標準化技術委員在2014年啟動並於2018年釋出的《資料管理能力成熟度評估模型》(Data Capability Maturity Model,簡稱DCMM)國家標準。第二,參照主資料管理理論,開展鏈上資料治理在資料治理框架中,主資料管理是核心。所謂的主資料是指描述機構核心業務實體的、在機構內外被廣泛應用和共享的資料,是機構的核心資產,具有高價值和高敏感性。構建統一的主資料標準,可將原先各個處於豎井之中的業務系統在主資料層面實現互通和共享,保障主資料的全域性一致性和準確性。事實上,區塊鏈技術也可看作跨節點主資料的整合技術或架構。因此,我們可參照主資料管理理論,開展鏈上資料治理。一是清晰的業務需求。不是所有的資料都要上鍊。只有需要多方共享的高價值資料,或者說只有主資料,才需要上鍊,早期甚至只有主資料的Hash指紋存證在鏈上。二是明確的主資料規則和標準。聯盟鏈的各方應預先在標準和規則層面達成一致:是各節點的上鍊資料在鏈下統一標準,還是各自規範,僅在上鍊時透過資料抽取引擎(比如ETL、ESB),將異構資料轉為鏈上統一格式的標準資料集。如果是前者,那麼各方應共同制定鏈下資料標準,即統一的資料定義、分類、記錄格式和編碼,以及分類規範、編碼結構、資料模型、屬性描述。如果是後者,各節點在資料上鍊之前透過資料抽取引擎,對欲上鍊的資料進行一系列的加工處理,以形成標準統一的主資料,然後再根據鏈上資料操作規範要求進行資料存證與資訊披露。三是統一的鏈上後設資料標準。為了使多源的鏈上資料能被區塊鏈各參與節點方準確理解和使用,需要事先對每個資料元素進行後設資料定義,消除資料的二義性,降低資料整合的成本,讓各方能夠在統一的邏輯框架上解讀和驗證鏈上與鏈下資料。四是適當的干預機制。歐盟《通用資料保護條例》(General Data Protection Regulation,簡稱GDPR)規定資料主體享有知情同意權、訪問權、拒絕權、可攜權、刪除權(被遺忘權)、更正權、持續控制權等多項權利。其中,刪除權(被遺忘權)是資料主體有權要求資料控制者立刻刪除與其有關的個人資料及其副本、備份和任何連結。更正權是指資料主體有權要求資料控制者更正並且完善與其有關的個人資料的權利。從這一角度看,區塊鏈的難以篡改與上述兩個資料主體權利存在一定的衝突。因此,需要在聯盟鏈上建立適當的干預機制,以滿足法律上的資料主體權利保護要求和其他合規要求,而且這也是保障良好網路生態的應有之義。五是科學的管理體系。數字治理本質上是一種管理活動,需要有相應的運維組織、管理流程和考核機制,推動資料標準規範的落地實施和有效執行。比如可考慮成立聯盟鏈聯合工作組,負責開展明確資料需求、制定標準、統一規則、監督評估等治理工作,並負責評測各節點的鏈下資料治理成熟度,行使節點的許可准入權力。第三,加強資料安全管理與隱私保護,保障資料資產價值隨著數字經濟時代的到來,資料已成為關鍵的生產要素。資料具有經濟價值,是重要資產。如何在資料共享的同時避免資料洩露,自然是資料治理的重中之重。在需求規劃時,各節點應預先梳理各自的資料,識別哪些是非密資料,哪些是保密資料,哪些是敏感資料,哪些是邊緣資料,哪些可公開,對誰可見,和誰共享,在此基礎上,根據資料的價值、敏感性和隱私性進行分級,制定訪問控制矩陣和差異化隱私策略。在資料上鍊時,應保證介面安全。無論鏈上資料訪問,還是鏈下資料訪問,應有身份認證、分級授權等訪問控制,防止攻擊者假冒合法使用者獲得訪問許可權,保證系統和資料的安全。在資料的傳輸和共享過程中,可根據資料的共享和安全需要,對不同的資料進行脫敏,或者採用資料加密技術,比如零知識證明(ZKP)演算法對資料加密,亦可採用一些通道技術來限制資料共享範圍,控制資料洩露風險。結語當前,區塊鏈技術已儼然成為一種不可阻擋的技術趨勢,是全球產業變革的全新賽道,各國均在發力,加速佈局。在這樣一個全球矚目的陣地,我們應紮實備戰,搶佔技術制高點。習總書記的講話是我國區塊鏈技術創新和產業發展的指導思想和根本遵循,我們應積極貫徹落實總書記重要講話精神,珍惜戰略機遇,求真務實,勇於探索,使區塊鏈技術在建設網路強國、發展數字經濟、助力經濟社會發展等方面真正發揮作用。本文僅代表個人學術觀點,不代表所在機構意見。本文刊發於《清華金融評論》2020年1月刊,2020年1月5日出刊,編輯:王曄君#姚前#區塊鏈#網際網路金融
免責聲明:
- 本文版權歸原作者所有,僅代表作者本人觀點,不代表鏈報觀點或立場。
- 如發現文章、圖片等侵權行爲,侵權責任將由作者本人承擔。
- 鏈報僅提供相關項目信息,不構成任何投資建議。
推荐阅读