所謂“數字化”,是指大資料、人工智慧、移動網際網路、雲端計算、區塊鏈等一系列數字化技術組成的“數字綜合體”。結合所學知識和實踐經驗,我談談在“數字化”背景下的人類經濟社會發展的 新特徵、新趨勢。
01雲端計算、大資料、人工智慧和區塊鏈
雲端計算
雲端計算可以被理解成一個系統硬體,一個具有巨大的計算能力、 網路通訊能力和儲存能力的資料處理中心(Internet Data Center,簡 稱 IDC)。資料處理中心本質上是大量伺服器的集合,資料處理中心 的功能、規模是以伺服器的數量來衡量的。
比如,2015年北京市有2000多萬部手機、2000多萬部座機、七八百萬臺各種各樣上網的膝上型電腦和臺式電腦,以及七八百萬臺家庭的電視機機頂盒。中國移動、中國電信等電信公司處理所有北京市的上述資訊的後臺服務系統和資料處理中心擁有的伺服器共計25萬臺。上海差不多也是20 多萬臺。谷歌處理全世界的網際網路大 資料且需要進行智慧化處理,它需要多少伺服器呢?據悉,谷歌有150萬臺伺服器分佈在全世界七八個地方,現在正在建設的伺服器還有100萬臺。
雲端計算有三個特點。第一,在資料資訊的儲存能力方面,伺服器中能儲存大量資料。第二,在計算能力方面,每個伺服器實質上是一臺計算機。與 20世紀60年代、70年代世界最大的計算機相比, 當代計算機的運算能力更強、佔用空間更小。第三,在通訊能力方面,伺服器連線著千家萬戶的手機、膝上型電腦等移動終端,是網際網路、物聯網的通訊樞紐,是網路通訊能力的具體體現。
由此可見,資料處理中心、雲端計算的硬體功能,具有超大規模 化的通訊能力、計算能力、儲存能力,賦予其虛擬化、靈活性、伸 縮性的特點。服務商以 IDC 為硬體,以私有云、公共雲作為客戶服 務的介面,向客戶提供資料服務。就像居民透過水龍頭管道向自來 水廠買水一樣,各類客戶以按需購買的方式,利用 IDC 資源購買所需的計算量、儲存量、通訊量,並按量結算費用。資源閒置時也可供其他客戶使用,這樣就能夠有效、全面、有彈性地利用雲端計算架構中的資源,既能同時為千家萬戶服務,又能使大量伺服器不發生閒置。
大資料
大資料之大,有靜態之大、動態之大和運算之後疊加之大。資料量之大有三個要點。第一是資料量大,例如大英博物館的藏書能 全部以數字化的形式儲存。第二是實時動態變數大。每一秒鐘、每 一分鐘、每一小時、每一天,資料都在產生變化。全球 70 億人約有六七十億部手機,這些手機每天都在打電話,每天都在計算,每天都在付款,每天都在搜尋。所有的動態資料每天不斷疊加、不斷豐富、不斷增長。“量變會引起質變”,就像累積 60 張靜態照片可以形 成一秒鐘的實時電影,大量靜態資料的存放也會不斷更新、累積,形成新的資訊。第三是資料疊加處理後的變數之大。人們根據自身的主觀需求,對動態的、靜態的資料進行處理分析、綜合挖掘,在 挖掘計算的過程中,又會產生複核計算以後的新資料。這種計算資料也是資料庫不斷累計的資料。
總之,所謂大資料之大,一是靜態資料,二是動態資料,三是經過人類大腦和計算機處理、計算後產生的資料,這三者共同構成大資料的資料來源。
大資料若要轉化為有用的資訊、知識,則需要消除各種隨機性和不確定性。資料在計算機中只是一串英語字母、字元或者阿拉伯數字,可能是混亂的、無序的。資料應用一般有三個步驟:資料—資訊, 資訊—知識,知識—智慧。
第一步,資料變資訊。任何結構化、半結構化或非結構化的數 據本身是無用的、雜亂無章的,但資料經過分析去除隨機性干擾以後,就變成了有指向的資訊。資料變資訊的處理過程用的工具有濾波器、關鍵詞,濾波以後提煉出相關的資訊。
第二步,資訊中包含的規律,需要歸納總結成知識。知識改變命運,但知識不簡單地等於資訊。如果不能從資訊中提取知識,每天在手機、電腦上看再多的資訊也沒用。
第三步,有知識後要運用,善於應用知識解決問題才是智慧。綜合資訊得出規律是將資訊轉化為知識的過程。有的人掌握了知識,對已發生的事講得頭頭是道,但是一到實幹就傻眼, 這是沒智慧的表現。所謂智慧,實際上就是在資訊中抓取決策的意圖、決策的背景等相關資訊,最後在“臨門一腳”時能夠做出決策。
資訊和知識是輔助決策系統,它們幫助人做出決策,人根據機器做出的決策實施,這就是智慧化的過程。
所謂大資料蘊含著人工智慧,就在於把雜亂無章的資料提取為資訊,把資訊歸納出知識,透過知識的綜合做出判斷,這就是大資料智慧化所包含的三個環節。
人工智慧
第一,人工智慧如何讓資料產生智慧?大資料之所以能夠智慧化,能夠決策,能夠輔助決策,是因為在人工智慧或計算機操作過 程中有四個步驟:一是採集、抓取、推送,二是傳輸,三是儲存, 四是分析、處理、檢索和挖掘。第一步,在大資料中不斷地過濾出 有一定目的意義的資訊,也就是採集、抓取、推送。第二步、第三 步是傳輸和儲存,內涵不言自明。大資料之大,不是在抽屜裡靜態的閒置大資料,而是在雲裡儲存、動態傳輸的大資料。第四步是分 析、處理、檢索和挖掘,關鍵技術在於演算法。演算法是輔助人類在非 常繁雜、非常巨大的海量資料空間中,快速找到目標、路徑和方法的工具。
第二,人工智慧依靠大資料在分析、處理、檢索和挖掘中產生智慧的關鍵在於大資料、演算法以及高速度的計算處理能力。沒有資料和大資料的長期積累、重複驗證,有智慧管理也沒有用;有了演算法和大資料,沒有高速度的計算能力也沒有用。演算法是人工智慧的 靈魂,它變得“有靈氣”需要用大資料不斷地“餵養”,不斷地重複和訓練。在這個意義上,大資料如果沒有演算法,就沒有靈魂,就沒有大資料處理的真正意義。
但是如果演算法沒有大資料來“餵養”,即使數學家想出好的演算法,智慧也未必有效。以柯潔與阿爾法圍棋的人機大戰為例,阿爾法圍棋中的演算法是來源於人類各種各樣的棋譜、高明棋手的下棋步驟。人工智慧工程師將這些資料全部放入谷歌的演算法中執行,執行了幾萬次、幾十萬次。因為有網路深度學習的模組,每執行一次就聰明一點。這個過程是一個不斷反覆、不斷學習的過程。
總而言之,人工智慧、大資料和這些要素有關,轉化為真正人工智慧的時候,一靠大資料,二靠演算法,三還要靠高速度。人類對工具使用的發展,本質上是一個計算能力不斷提高的過程。
在農業社會,中國人曾用自己的聰明智慧發明了算盤。算盤一 秒鐘兩三個珠子撥動,每秒計算兩三下。到了工業社會初期,電被 廣泛運用。20 世紀 20 年代,以繼電器作為基本器件的計算機問世。繼電器計算機震動頻率非常高,每秒抖動幾十次,比算盤快 10~20 倍。到了 20 世紀 40 年代,第二次世界大戰期間,電子管問世。電 子管計算機每秒可計算幾萬次,是繼電器計算機的 1 000 倍,運算速 度非常快。到了 20 世紀 60 年代,半導體問世,以三極體、二極體 為元器件的電腦,一秒鐘能運算幾十萬次到幾百萬次。到了 20 世紀 80 年代,半導體晶片問世,積體電路計算機的運算速度到達每秒幾 千萬次甚至幾億次。中國的超算在 10 年前達到了億次,2015 年前後 到了 10 億億次,最新推出一個超算系統已經超過 100 億億次。但是, 超級計算機不是一個晶片、一個電腦的運算速度,而是幾千個電腦、 幾千個伺服器組合而成一個矩陣和一個演算法。超級計算機能夠做到 一秒鐘10億億次、100億億次,但單個晶片難以達到每秒運算10億億次。
我們為什麼非常重視一個晶片每秒能計算 10 億億次呢?在 2012 年出版的《奇點臨近》一書中提到,大概二三十年後,人造機器的 計算速度將超過人腦。作者提出,人腦的運算速度是每秒計算 10 億 億次。當計算機到了每秒計算 10 億億次以上時,其運算速度將超過人腦,拐點就會到來。大家討論人工智慧最終能不能超過人類智慧,人是不是會被人工智慧圈養,各有各的說法。從科學的角度講,人工智慧的計算能力不斷增強,是人對工具使用的智慧不斷髮展的結果。強大的計算能力、大資料、演算法連在一起,超越了幾千小時、 幾萬小時、幾十萬小時,人無法等待的時間,使得大智慧逐步發展。
第三,雲端計算、大資料、人工智慧的軟體植入在雲端計算廠商提 供的資料處理中心硬體中,對客戶形成三種線上服務。雲端計算的雲 是一個硬體,是一個具有通訊能力、計算能力、儲存能力的基礎設 施。雲中除了存放大資料之外,同時提供各種各樣的演算法作為一種 服務軟體處理。大資料公司往往在蒐集、組織管理了大量資料的基 礎上,使用人工智慧演算法後為客戶提供有效的資料服務,形成一個 大資料的服務平臺。所謂的人工智慧公司,往往是依靠大資料平臺 支撐提供演算法服務,演算法軟體也是一種服務。它們共同形成了“數 字化”的三大功能:第一個是 IaaS,是基礎設施作為使用的服務;第 二個是 PaaS,是大資料的平臺作為使用的服務;第三個是 SaaS,算 法軟體也是一種服務。這三個片語代表了“數字化”三兄弟,三種功能不同的軟體。
當然,“數字化”也離不開網際網路、移動網際網路和物聯網。一句話解釋就是,網際網路的時代是 PC(個人電腦)時代,移動網際網路的時代是手機加膝上型電腦的時代,物聯網時代就是萬物萬聯的時代。
區塊鏈
區塊鏈本質上是一個去中心化的分散式儲存資料庫,它打破了 中心化機構授信,透過資料協議、加密演算法、共識機制,點對點地 傳輸到這個區塊中的所有其他節點,從而構建一種去中心化、不可 篡改、安全可驗證的資料庫,建立一種新的信任體系,這種信任體系表現為五個特徵。一是開放性。區塊鏈技術基礎是開源的,除了 交易各方的私有資訊被加密外,區塊鏈資料對所有人開放,任何人 都可以透過公開介面查詢區塊鏈上的資料和開發相關應用,整個系 統資訊高度透明。二是防篡改性。任何人要改變區塊鏈裡面的資訊, 必須要攻擊或篡改 51% 鏈上節點的資料庫才能把資料更改掉,難度 非常大。三是匿名性。由於區塊鏈各節點之間的資料交換必須遵循 固定的、預知的演算法,因此區塊鏈上節點之間不需要彼此認知,也 不需要實名認證,而只基於地址、演算法的正確性進行彼此識別和數 據交換。四是去中心化。正因為區塊鏈裡所有節點都在記賬,無須 有一箇中心再去記賬,所以它可以不需要中心。五是可追溯性。區 塊鏈是一個分散資料庫,每個節點資料(或行為)都被其他人記錄, 所以區塊鏈上的每個人的資料(或行為)都可以被追蹤和還原。
| 按照目前的應用場景,區塊鏈可以分成三大類。
一是公有鏈。主要指全世界任何人都可以讀取、傳送資訊(或 交易)且資訊(或交易)都能獲得有效確認的,也可以參與其中的“共識過程的區塊鏈”。
二是私有鏈,也稱專有鏈。它是一條非公開的鏈,通常情況,未經授權不得加入(成為節點)。而且,私有鏈中各個節點的寫入權 限皆被嚴格控制,讀取許可權則可視需求有選擇性地對外開放。
三是聯盟鏈。聯盟鏈是指由多個機構共同參與管理的區塊鏈, 每個組織或機構管理一個或多個節點,其資料只允許系統內不同的 機構進行讀寫和傳送。
| 就當下而言,區塊鏈涉及四大技術領域。
一是分散式賬本技術。人類社會發明的記賬技術先後有四種。早在原始社會時,人類發明了“結繩記賬”,農業社會時發明了“記 流水賬”,工業社會時發明了“複式記賬”。複式記賬的平衡表使賬目一目瞭然,適應了工業社會的企業管理,但它避免不了經理人與 會計可能從原始資料來源頭造假。分散式賬本是一種在網路成員之間 共享、複製和同步的資料庫。分散式賬本一起記錄參與者間的資料 行為(如交易、資產交換行為等),這種技術所內含的防篡改、可追 溯特性從源頭上杜絕了造假的可能,而共享機制降低了“因調解不 同賬本”所產生的時間和成本。
二是非對稱加密技術。儲存在區塊鏈上的交易資訊是公開的, 但每個賬戶的身份資訊是高度加密的。單個賬戶只有在擁有者授權 的情況下才能訪問到,從而保證資料的安全和個人隱私。
三是共識機制技術。開發者必須首先考慮用怎樣的技術可以使 更多人對一種規則達成共識,同時還要考慮透過多少個特殊節點的 確認,才能在很短的時間內實現對資料行為的驗證,從而完成一筆 交易。一般而言,區塊鏈技術需要若干利益不相干的節點對一筆交 易進行確認,如果確認就認為達成共識,認為全網對此也能達成共 識,這樣才算完成一筆交易。
四是智慧合約技術。基於大量可信的、不可篡改的資料,可以 自動化地執行一些預先定義好的規則和條款,比如彼此間定期、定 息、定額的借貸行為。
區塊鏈技術屬於資訊科技、記賬技術。從應用視角來看,基於 區塊鏈能夠解決資訊不對稱問題,實現多個主體之間的協作信任與 一致行動,無論是公有鏈、私有鏈,還是聯盟鏈,其首要目標是確 保資訊資料的安全、有效、無法篡改。
| 目前,區塊鏈技術在社會中的應用場景主要有以下幾方面。
一是金融。金融已經數字化了,所以這是區塊鏈應用最為得心 應手的領域。目前,在國際匯兌、信用證、股權登記和證券交易所 等領域已經開始嘗試使用區塊鏈技術,區塊鏈在金融領域有著巨大的潛在應用價值。人們的探索是,將區塊鏈技術應用在金融領域是 否可以“省去中介環節”,實現點對點對接,在降低交易成本的同 時,更加快速地完成交易。例如,利用區塊鏈分散式架構和信任機 制,可以簡化金融機構電匯流程,尤其是涉及多個金融機構間的復 雜交易。
二是供應鏈和物流。區塊鏈在物聯網以及物流單據管理領域也 有得天獨厚的優勢,企業透過區塊鏈可以降低物流單據管理成本, 可以監控和追溯物品的生產、倉儲、運送、到達等全過程,提高物 流鏈管理的效率。另外,區塊鏈在供應鏈管理領域也被認為具有豐 富的應用場景,比如上下游之間的直接交易可以加大透明度,提高 信任和效率,如果區塊鏈中包含供應鏈金融,那將大大提高金融的效率,同時降低金融機構和企業的信用成本。
三是公共服務。區塊鏈在公共服務、能源、交通等與民眾生活息息相關的資訊領域也有較為豐富的應用場景。比如,目前由於信 任缺失,中心管理者有時無法確定民眾反映的需要解決的問題是個性問題還是共性問題,但使用區塊鏈技術之後,這個問題可能瞬間就可以找到正確答案。
四是認證和公證。區塊鏈具有不可篡改的特性,可以為經濟社 會發展中的“存證”難題提供解決方案,為實現社會徵信提供全新 思路,存在很大的市場空間。比如,最近,騰訊推出了“區塊鏈電 子發票”,成為區塊鏈技術應用的“爆款”。
五是公益和慈善。區塊鏈上分佈儲存的資料的不可篡改性,天然適合用於社會公益場景。公益流程中的相關資訊,如捐贈專案、募集 明細、資金流向、受助人反饋等資訊,均可以存放在一個特定的區塊 鏈上,透明、公開,並透過公示達成社會監督的目的。
六是數字版權開發。透過區塊鏈技術可以對作品進行鑑權,證明文字、影片、音訊等作品的存在,保證權屬的真實性和唯一性。作品在區塊鏈上被確權後,後續交易都會進行實時的分散式記錄, 實現數字版權的全生命週期管理,也可為侵權行為的司法取證提供 技術保障。
七是保險。在保險方面,保險機構負責資金歸集、投資、理賠 等過程,往往管理和運營成本較高,但區塊鏈技術有可能提高效率、 降低成本;尤其在理賠方面,透過區塊鏈實現“智慧合約”,則無須 投保人申請,也無須保險公司批准,只要投保人行為觸發符合規定 的理賠條件,即可實現當即自動賠付。
八是資訊和資料共享。目前,全國各級政府公共資訊資源平臺 在大力整合,目的是使各個資訊系統之間的資訊有效共享,節約存 儲空間和提升使用效率。在實現技術上,如果能夠利用區塊鏈分佈 式的特點,既可以打通監管部門間的“資料壁壘”,破除“資料孤島”,實現資訊和資料共享,還能提升公眾調取政府公開資源的效 率,減少資金浪費。
總體而言,區塊鏈透過創造信任來創造價值,使離散程度高、管理鏈條長、涉及環節多的多方主體能夠有效合作,從而提高協同效率、降低溝通成本。