區塊鏈有可能改變世界接近大資料的方式。
編者按:本文來自CSDN,作者: cqacby2798,星球日報經授權轉發。
在過去幾年中,區塊鏈可能是 IT 領域最重要的發展,它有可能改變世界接近大資料的方式,增強安全性和資料質量。
“可以說是過去幾年資訊科技最重要的發展,區塊鏈有可能改變世界接近大資料的方式,增強的安全性和資料質量只是使用Satoshi Nakamoto 標誌性技術為企業帶來的兩個好處。 ”
什麼是區塊鏈?
Blockchain 是一個分散式資料庫系統,充當儲存和管理事務的“開放式分類帳”。資料庫中的每個記錄稱為塊,幷包含諸如事務時間戳之類的詳細資訊以及指向前一個塊的連結。這使得任何人都無法回溯地更改有關記錄的資訊。此外,由於在多個分散式資料庫系統上記錄相同的事務,該技術在設計上是安全的。
考慮到上述情況, 區塊鏈是不可變的:只要網路存在,資訊就會保持相同的狀態。
區塊鏈和大資料
當你在比特幣的背景下談論區塊鏈時,與大資料的聯絡似乎有點脆弱。如果區塊鏈不是比特幣,而是其他金融交易的分類賬,該怎麼辦?還是商業合同?還是股票交易?
金融服務業開始認真研究區塊鏈技術。瑞銀集團資訊長奧利弗·巴斯曼(Oliver Bussmann)表示,區塊鏈技術可以“將交易處理時間從幾天縮短到幾分鐘”。
區塊鏈金融服務的業務需求是強大的。想象一下這種規模的區塊鏈。包含每個金融交易完整歷史的巨大資料塊,均可用於分析。區塊鏈提供分類帳的完整性,但不用於分析。這就是大資料和相關分析工具將發揮作用的地方。
大資料分析——區塊鏈應用
一家由 47 家日本銀行組成的財團與一家名為 RP/" target="_blank"">Ripple 的區塊鏈創業公司簽約,以利用區塊鏈促進銀行賬戶之間的資金轉賬。此舉背後的主要原因是以極低的成本執行實時轉賬。傳統實時轉賬昂貴的原因之一是潛在的風險因素。雙重支出(這是一種交易失敗的形式,其中相同的安全令牌被使用兩次)是實時轉移的真正問題。使用區塊鏈,可以在很大程度上避免這種風險。 大資料分析使得識別消費者支出模式和識別風險交易的速度比目前更快。這降低了實時交易的成本。
在銀行業以外的行業中,採用區塊鏈技術的主要動力是安全性。在醫療保健,零售和公共管理部門,企業已開始嘗試使用區塊鏈來處理資料,以防止駭客攻擊和資料洩露。在醫療保健領域,區塊鏈等技術可以確保在每個級別的資料訪問中都尋求多個“簽名”。這可以幫助防止諸如2015年襲擊事件的重複,這些事件導致超過1億的 患者記錄被盜 。
區塊鏈應用大資料的優勢
1. 實時分析的可能性
到目前為止,實時欺詐檢測只是一個白日夢,銀行機構一直依賴於使用技術來回顧性地識別欺詐性交易。由於區塊鏈每個交易都有一個資料庫記錄,因此它為機構提供了一種實時挖掘模式的方法,如果需要的話。
但所有這些可能性也引發了對隱私的質疑,這與區塊鏈和比特幣首先變得流行的原因直接矛盾。一些行業專家表示擔心,能夠提供每筆交易記錄的技術可用於“從客戶分析到其他不太良性的原因”的所有事情。
然而,從另一個角度來看,區塊鏈極大地提高了資料分析的透明度。與以前的演算法不同,區塊鏈設計拒絕任何無法驗證且被認為可疑的輸入。因此,零售等行業的分析師只處理完全透明的資料。換句話說,區塊鏈系統識別的客戶行為模式可能比現在更加準確。
2.發現交易資料
區塊鏈中的資料預計價值數萬億美元,因為它繼續進入銀行,小額支付,匯款和其他金融服務。事實上,到 2030 年,區塊鏈分類賬的價值可能高達整個大資料市場的 20%,年收入高達 1000 億美元。從這個角度來看,這種潛在的收入超過了Visa,Mastercard 和 PayPal 目前產生的收入。大資料分析對於跟蹤這些活動以及幫助使用區塊鏈的組織做出更明智的決策至關重要。
資料情報服務正在興起,以幫助金融機構,政府和各種組織深入研究他們可能在區塊鏈上與誰進行互動並發現“隱藏”模式。
3.揭開社交資料
隨著比特幣在 2014 年和 2015 年的普及,由於現實世界事件和公眾對該技術的看法,虛擬貨幣開始大幅波動。這些波動證明虛擬貨幣具有幾個特徵,使其成為社交資料預測的理想選擇。
根據 Freshminds 的 Rick Burgess 的說法:“使用社交資料預測消費者行為並不是什麼新鮮事,許多交易者一直在尋求將社交指標納入其交易演算法。但是,由於大多數金融工具的定價涉及很多因素,因此預測市場將如何變化可能非常困難。“
幸運的是,比特幣使用者和社交媒體使用者傾向於很好地協調,並且將它們用於資料分析可能是有益的, 因為他進一步解釋說:
比特幣使用者往往與社交媒體使用者處於相同的人群中,因此他們對比特幣的態度,意見和情緒都有很好的記錄。
比特幣和其他加密貨幣的價值幾乎完全由市場需求決定,因為市場上的硬幣數量是可預測的,並且與任何實物商品無關。
比特幣主要由個人而非大型機構進行交易。
影響比特幣價值的事件首先在社交媒體上傳播。
資料分析師現在正在挖掘社交資料,以深入瞭解關鍵的加密貨幣趨勢。反過來,這可以幫助組織發現強大的人口統計資訊,並將比特幣的表現與世界事件聯絡起來。
4.新形式的資料貨幣化
根據戴爾 EMC 服務公司技術長 Bill Schmarzo 的說法,區塊鏈技術“還有可能透過消除中間人促進交易來實現資料和分析的共享和貨幣化的民主化。”在商業領域,這為消費者提供了更強大的公司談判權力。它允許消費者透過區塊鏈控制誰有權訪問他們的資料。然後,他們可以要求定價折扣,以換取他們個人消費公司產品或服務的資料。
Schmarzo 還解釋了區塊鏈如何導致新形式的資料貨幣化,因為它具有以下大資料分支:
參與交易的所有各方都可以訪問相同的資料。這加速了資料採集,共享,資料質量和資料分析。
所有交易的詳細記錄儲存在單個“檔案”或區塊鏈中。這提供了從頭到尾的完整事務概述,消除了對多個系統的需求。
個人可以管理和控制他們的個人資料,而無需第三方中介或集中儲存庫。
最終,區塊鏈可以成為資料貨幣化的關鍵推動因素,透過建立新的市場,公司和個人可以直接相互分享,銷售和提供他們的資料和分析見解。
在大規模採用比特幣的帶頭下,區塊鏈技術在整個商業和金融領域都在不斷髮展。它促成的快速安全交易可能會徹底改變傳統資料系統。根據畢馬威和 Forrester Consulting 的調查, 三分之一的決策者信任他們公司的資料。但是使用區塊鏈技術,這種信任可以大大加強,真正的應用程式將變得更加普遍。
現在,每個公共區塊鏈上都存有數百萬位元的資料。它的潛在價值是巨大的。
然而,還沒有一種簡單的方法可以全面地檢視它,這意味著我們無法研究,跟蹤或以其他方式充分利用它。
這是一個失去的機會,因為可以用這些資料做很多事情。例如,如果我們將這些資料植入機器學習模型,我們就可以跟蹤有助於我們防止惡意使用者行為的趨勢,例如盜版或販毒。
區塊鏈與大資料總結
目前,我們僅將區塊鏈用於交易目的。
我們使用比特幣區塊鏈將錢從一個地址匯到另一個地址。透過以太坊的智慧合約,區塊鏈上的各個地址可以在另一個地址上呼叫一個函式。
但是,資料僅用於事務或狀態機目的。
我們需要考慮的是:這筆錢是如何被轉移的?它在哪裡?誰在做什麼?我們可以將哪些地址識別為騙子或恐怖分子地址——黑暗網路的中心?
想象一下,如果我們可以標記這些地址。然後,我們可以生成一個模型,以防止資金進入我們知道是恐怖分子,毒販或其他不良行為者的財產的交易所或地址。這對個人,公司和情報機構都很有用。但是這樣的功能還可以讓我們獲得某些經濟洞察力,例如能夠隨時間預測代幣的價格,我們可以透過跟蹤投機和移動的趨勢來做到這一點。
問題是,我們還沒有可用的機制來幫助我們進行跟蹤。
使用者可以檢視區塊鏈並訪問與他們及其周圍人員進行的交易有關的資訊,但他們無法在更廣泛的範圍內或以有意義的視覺化方式執行此操作。在以太坊中,很容易透過 etherscan 跟蹤一個使用者,但不能同時跟蹤一大堆使用者。當然,這禁止我們利用這些資料進行潛在的有價值的事情,例如跟蹤資金流動的位置。
其中一個原因是區塊鏈本身仍處於概念驗證階段。它的資料結構已被證明是合理的,但它還沒有發展到它提供明顯效用的程度。它仍然只是一種儲存資料的機制。但現在有大量的資料,它相當於未開發的金礦。但那很快就會改變。資料就在那裡 – 它就在那裡使用,它就在那裡進行實驗。現在是時候開始使用區塊鏈上的資料來建立實用程式了。
在許多方面,區塊鏈的出現與早期的網際網路類似。當網際網路首次啟動時,它實際上只是一個相互連線的計算機社羣。那個社羣確實產生了資料,但沒有多少。
但隨後,當越來越多的人開始使用它時,資料量呈指數級增長。人們意識到,如果他們能夠使用這些資料從中學習,訪問,閱讀,以允許其他人找到它的方式建立更多資料 – 他們需要某種增強的搜尋能力。這就是為什麼搜尋引擎以及後來的社交媒體平臺誕生的一個重要原因。區塊鏈應該進行類似的計算。
僅在以太坊和比特幣上,已經有數百萬筆交易。ICO 已經建立。我們進入了一個新時代,這種技術在 90 年代早期就採用了與網際網路類似的規模。我們需要的是專門為利用這些資料而設計的應用程式。這種技術已經在其他領域廣泛使用。
有些公司(如 Palantir )收集和分析與電話,銀行賬戶和訊息相關的資料,並將這些資訊提供給 FBI 以協助搜尋嫌疑人。可以輕鬆構建類似的東西來跟蹤,分析和利用跨各種區塊鏈收集的資料。建立機制以幫助我們跟蹤和使用區塊鏈上的資料不僅僅是一個機會。這是保證我們的資金和資料安全的一種手段。