區塊鏈基礎密碼演算法:加密雜湊函式

買賣虛擬貨幣
傳說,在人類成功打造出第一臺超級智慧電腦之時,決定做一個小測驗,來試試看這臺超級電腦的能耐到底能到多少?實驗的設計很簡單:讓超級電腦計算圓周率是多少。於是,在人們還沒反應出來的一瞬間,這臺超能電腦已經攻佔整個地球,然後對外太空發動了戰爭,征服整個銀河系,把整個可知的宇宙空間變成了巨大的超能電腦,最後花上了無盡的時間,只為了計算出人類給它的這個問題:圓周率。這是我在閱讀人類大歷史這本書中讀到的一篇故事,原文討論的內容是演算法程式對於人類的威脅;那些不斷產生出來並且持續的在最佳化、改進,聲稱用以改善人類生活的演算法軟體,既使一開始創作者本身是完全出於良好善意,或是學術研究而建立的系統,最終仍可能會完全失控的造成毀滅性的結果。這個故事讓我想起了Bitcoin等加密貨幣的挖礦程式演算法,在過去一段時間以來對我們生活的衝擊影響。還記得2017年加密貨幣正夯時,全球的挖礦熱潮引爆的全民搶電瘋,當時就有媒體報導指出,加密貨幣的挖礦機器將會導致社會大眾無電可用,甚至有人傳言,那年夏天的幾次臺電臨時跳電事件,就是太多人在挖比特幣造成的。這篇文章,就是要來談談比特幣挖礦背後的那個演算法:加密雜湊函式。原本呢,我是計劃在第二篇就開始進入程式開發的部分,只是我發現到,不先了解雜湊函式的原理功能、或是留給讀者自行google,會破壞這個系列文章的完整性,尤其是在實作記憶體塊鏈的不可逆性、或是Key建立等功能,讀者的感受與理解會有差異,所以還是決定,在進入開發區塊鏈之前,寫一篇文章來專門介紹雜湊函式,尤其是其在密碼學方面的應用雜湊函式應用在區塊鏈的哪些地方?
1. 區塊鏈透過雜湊函式的結果,將資料串聯成為一條難以篡改的連線2. 比特幣、以太幣、瑞波幣等電子加密貨幣(題外話,有人說要正名為密碼貨幣),透過雜湊函式產生錢包地址3. 在加密貨幣挖礦(Mining)的世界,使用Hash Rate: TH/s(trillions of hashes per second)來計算區塊鏈 network的運算能力4. Bitcoin透過調整雜湊函式的難度,控制整個Bitcoin network平均每10分鐘產生一個block記憶體塊。
那我們就開始來了解雜湊函式演算法吧首先,雜湊函式具有下列兩項特點:1. 無論傳入(input)雜湊函式的資料量大小,雜湊函式回傳的資料長度都是固定的相同的input,回傳2. 相同的output;不同的input,回傳不同的output;換句話說,雜湊函式的回傳結果(稱之為hash value),是一個長度一致,但是資料內容卻是獨一無二(unique)的數值。所以,如果看到兩個完全不一樣的”hash value”,我們就可以推斷其原始的input一定是不一樣的;反之,兩個相同的hash value,其原本的input值則會是一模一樣的。
我們可以用Python內建的SHA-256 Hash Algorithm,展示一下上述的雜湊函式特性import hashlibx1=”my 1st Bitcoin”.encode()y1=hashlib.sha256(x1).hexdigest()x2=”I am not Satoshi Nakamoto”.encode()y2=hashlib.sha256(x2).hexdigest()
print(f’y1= {y1}’)print(f’y2= {y2}’)print(f’y1 include {len(y1)} words’)

print(f’y2 include {len(y2)} words’)

如果尚未安裝Python,可以利用下面這個網址試試,看看將my 1st Bitcoin Hash後的值是不是和上圖用Python跑出來的值(y1=後面的那串)是一樣的:

https://anders.com/區塊鏈/hash.html

加密雜湊函式是雜湊函式於密碼學上的一項應用,上述的SHA-256就是一個加密雜湊函式的實作產品。

雜湊函式還有另一項特點:one-way(單向)function

以上述的Python程式為例,在已知input值=”my 1st Bitcoin”,透過sha256 function,可以快速的算出hash value=”a5e4c0673fcedff2bc2174123e97b511d5d17f4317869e7bd60d0a6d3d7fa1c6”;但反過來說,我們想從”a5e4c0673fcedff2bc2174123e97b511d5d17f4317869e7bd60d0a6d3d7fa1c6”這一串資料中反推出input的值:”my 1st Bitcoin”,唯一的方式是透過暴力解法,也就是不斷地丟字串給sha256 function,直到得到hash value是一樣時,也就是傳入的input字串為”my 1st Bitcoin”時,才能得到答案。各位可以想像這猜中的機率是多低?如果你能一猜就中,那你也不用在這研究記憶體塊鏈了,直接去買樂透比較快。

區塊鏈透過上述雜湊函式的三個特性,構架起了記憶體塊鏈中的資料,只要一經寫入就無法修改的獨特功能。

各位可以到下面這個網址體驗區塊鏈如何透過雜湊函式,緊密的連線起每一個Block記憶體塊,並且堅固地保障了已經建立完成的Block區塊,其內容是難以被竄改的。

https://anders.com/區塊鏈/區塊鏈.html

Base58編碼

在文章前頭,我們曾提到過雜湊函式應用在加密貨幣錢包地址的例子,你可能在一些網站或Blog上,看到過這些亂碼數字。實際應用上,部落客或是賣家,會提供一組很像亂碼的Bitcoin addresses,讓你可以支付比特幣給對方;Bitcoin addresses,看起來似乎是一堆英數字的隨機編碼,但其中也是有特殊的設計:所有的Bitcoin addresses都是使用Base58進行編碼。

解釋Base58前,先來看看比較常見的,例如已經應用在Email上的電腦編碼:Base64。Base64編碼包含了26個小寫英文字母、26個大寫英文字母、10個阿拉伯數字(0~9),和兩個特殊字元(+和 — )。

Base58是Base64的子集合,提供一個較高可讀性、和較容易發現和防範錯誤的編碼格式,因此廣為眾多加密貨幣所使用。Base58剔除了容易辨識錯誤、或是在某些字型格式看起來十分類似的字元:數字0,大寫的英文字母O,小寫的英文字母l、大寫的英文字母I,並且移除了特殊字元(+和 — )。換句話說,Base58就是包含了大、小寫英文字母,和阿拉伯數字,但移除了四個字元(0,O,l,I)的集合:

Bitcoin’s Base58 alphabet:
123456789ABCDEFGHJKLMNPQRSTUVWXYZabcdefghijkmnopqrstuvwxyz

Hashing Power

最後,如果對於Bitcoin Network hashing power有興趣的讀者,可以到下面這個網址檢視Bitcoin網路的hash rate變化:

https://www.區塊鏈.com/charts/hash-rate

粗略估算,Bitcoin network整體的hashing power,從2009年一秒鐘不到一個MegaHash(MH/sec),如今一秒鐘已經超過40個ExaHash(EH/sec),光用表面數字計算,成長幅度超過40兆。

HashPower的單位換算可參考下列網址

https://coinguides.org/hashpower-converter-calculator/

OK,我們已經透過兩篇文章對記憶體塊鏈有ㄧ定程度的基礎瞭解了,該是動手寫一個區塊鏈程式的時候了。

在進入下一篇文章進行開發前,請各位先確定電腦的開發環境已經安裝好下列Python版本和相關modules

· Python 3.6+
· flask 0.12.2
· requests 2.18.4

我另外使用了兩個flask module,以建立表單和畫面

· flask-wtf
· flask-bootstrap

上述modules皆可透過PIP安裝

· pip install flask
· pip install requests
· pip install flask-wtf
· pip install flask-bootstrap

那,就先請各位準備好Python環境啦。

免責聲明:

  1. 本文版權歸原作者所有,僅代表作者本人觀點,不代表鏈報觀點或立場。
  2. 如發現文章、圖片等侵權行爲,侵權責任將由作者本人承擔。
  3. 鏈報僅提供相關項目信息,不構成任何投資建議

推荐阅读

;