為什麼說區塊鏈是一座全新的博弈競技場？

作者：安比實驗室

區塊鏈到底有什麼用？

針對這個問題，以太坊基金會成員 Virgil Griffith 曾以以太坊為例，提出了一個讓人眼前一亮的觀點[t1]：

Ethereum is an unprecedented arena for playing cooperative games（以太坊是前所未有的合作博弈競技場）。

區塊鏈和博弈論是兩個不同的領域，乍一看似乎並沒有太大的關聯性，但事實並非如此。幾乎所有的博弈論經典案例都可以藉助區塊鏈構建出新的博弈關係。Virgil Griffith 在他的文章中以以太坊為基礎，借用博弈論中經典的案例解釋瞭如何利用區塊鏈來建立新的博弈關係。

兩敗俱傷 or 合作共贏？—— 把“非合作博弈”轉變為“合作博弈”

博弈論（Game Theory）是經濟學的一個分支，是研究博弈行為中鬥爭各方是否存在著最合理的行為方案，以及如何找到這個合理的行為方案的數學理論和方法[t2]。其中具有競爭或對抗性質的行為稱為博弈行為[t2]。

博弈論中有一個大家都熟知的經典案例——囚徒困境[t3]。

有兩個共謀犯罪的囚徒張三和李四被捕，他們之間不能互相交流。如果雙方都不揭發對方，則每個人都只被關押 1 年；若他們雙方有一方揭發，而另一方選擇沉默，則揭發者將立即獲釋，沉默者則將被關押 8 年；若互相揭發，雙方將同時被關押 5 年。

很顯然如果雙方都保持沉默，是對他們最有利的選擇。但實際上，最終雙方都會傾向於揭發對方。

是什麼導致瞭如此反直覺的結果呢？

我們用下圖的矩陣來簡單解釋一下。

對於張三來說，若選擇沉默，結果有兩種：

被關押 1 年，此時李四選擇沉默，同樣被關押 1 年；
被關押 8 年，此時李四選擇揭發，直接釋放。

若張三選擇揭發，其兩種結果為：

直接釋放，此時李四選擇沉默，被關押 8 年；
被關押 5 年，此時李四選擇揭發，同樣被關押 5 年。

所以無論張三怎麼選擇，對李四較來說，揭發張三都是對他個人比較有利的選擇。同樣對張三來說亦然。

因而在雙方未進行溝通協商的前提下，張三和李四隻會做出對個人最有利的選擇。囚徒雙方的這種博弈關係被稱為非合作博弈。這裡囚徒雙方的選擇被稱為基於個體理性的決策，與之相反的是基於群體理性做出的決策。這裡雙方在做出決策揭露對方後即達到了博弈的納什均衡點。

博弈的分類根據不同的基準也有不同的分類。一般認為，博弈主要可以分為合作博弈和非合作博弈[t2] 。合作博弈論是指一些參與者以形成聯盟、互相合作的方式所進行的博弈。合作博弈的相反是非合作博弈，指的是參與者不可能形成聯盟或任何合作機制都必須為自我履約契約(例如，透過置信威脅的方式)[t4]。

“納什均衡點”是指相互作用的經濟主體在假定所有其他主體所選策略為既定的情況下選擇他們自己最優策略的狀態。如果某情況下無一參與者可以透過獨自行動而增加收益，則此策略組合被稱為納什均衡點[t5]。

在博弈論中，形成合作博弈需要滿足兩個基本條件[t6]：

對聯盟來說，整體收益大於其每個成員單獨經營時的收益之和。
對聯盟內部而言，每個成員都能獲得比不加入聯盟時多一些的收益。

囚徒困境的問題在於，在不知道對方選擇的前提下，選擇不合作將被關押的時間更短（即他們個人獲得的收益更大），所以不滿足合作博弈的基本條件。

Virgil Griffith 給出了一個實現合作博弈的解決方案——藉助區塊鏈智慧合約建立新的契約關係來建立新的規則。

我們先將囚徒雙方被關押的年數轉換成其在以太坊上的收益（如收益為 -1ETH 即指的是被關押 1 年）來解釋這個問題。

在張三和李四被逮捕之前，他們在以太坊上部署一個合約，合約內容如下：兩人同時抵押 1000 ETH，並且保證選擇沉默。如果任意一方選擇不遵守諾言，將燒掉其在合約中鎖定的 1000 ETH，即他將損失 1000 ETH，這遠遠大於他們原本在選擇沉默或是揭發時的損失，所以囚徒困境的納什均衡被打破。

透過部署一個不可修改且自動執行的合約，就可以使囚徒之間達成一個具有約束力且強制執行的協議，原來基於個人理性而做的決策被相互合作的決策所替代，我們成功得將非合作博弈關係轉換成了合作博弈。

不僅僅是囚徒困境，幾乎所有的非合作博弈都能借助智慧合約構造新的博弈關係。

我們再來看一個非合作博弈轉化為合作博弈的例子 —— 獵鹿賽局[t7] 。

兩名獵人 A 和 B一起去打獵，他們可以獵取鹿，也可以獵取野兔。鹿需要兩個人合作才能獲取，野兔一個人就可獵得，但獵鹿所得的收益大於獵野兔所得的收益。如下圖所示，我們假定獵取野兔的收益為 1 ETH，獵取鹿的收益為 3 ETH。

雖然兩名獵人同時選擇獵取鹿的收益最大，但卻需要承擔對方不選擇獵取鹿的後果。所以獵人們可能會更傾向於做出獵取野兔這種收益小但風險也小的選擇。

與囚徒困境類似，這裡我們同樣可以利用區塊鏈在獵人之間建立合作關係。獵人們先在以太坊上建立合約，雙方各自向合約中抵押 1000 ETH，若任意一方最終獵取了野兔，則將其抵押的 1000 ETH燒掉，於是此時任何一名獵人此時都不會選擇獵取野兔。

在上述例子中，我們將博弈方的收益和損失都轉換為了以太坊上的價值符號表示，但在實際的應用場景中，能否以此來代替實際的收益還有待商榷；另外智慧合約如何感知實際場景中的決策結果並自動觸發合約執行也相對困難。因此如何找到適合的機制讓現實博弈的關鍵操作與鏈上合約繫結至關重要。

博弈革命——競技場上的角逐新規則

其實區塊鏈和智慧合約並不是改變博弈的必要條件，但區塊鏈智慧合約在應用和部署博弈模型方面有著巨大的潛力。

由於真實情況下我們難以找到適合的可信第三方來做為公平的仲裁者，輔助執行博弈結果的利益裁定。而區塊鏈及智慧合約的出現讓這一切變得十分容易，正如 Upgradeability is a bug[t8] 這篇文章中所說的那樣，智慧合約最大的價值恰恰是在於它的 Trustless。

不僅僅是非合作博弈，幾乎任意的博弈關係都可以與區塊鏈結合，創造出新的規則。

2.1

1. 懦夫博弈

在非合作博弈中打造競爭優勢。

懦夫博弈也叫"膽小鬼博弈"，是指兩名車手甲和乙相對驅車而行，最先轉彎的一方被恥笑為“膽小鬼”（chicken），另一方勝出，但如果兩人拒絕轉彎，任由兩車相撞，最終誰都無法受益[t9]。

我們假定當兩人同時轉彎時記為收益為 0；當一方轉彎，另一方直行時，轉彎的一方記為收益 -1 ETH，另一方收益為 10 ETH；當兩人同時直行時記為收益為 -100 ETH。

很顯然，這個遊戲只有當一方選擇直行，另一方選擇轉彎收益最大，但是誰選擇直行誰選擇轉彎卻很難判定。

為了打破僵局獲得最大收益，車手甲可以在遊戲開始之前建立合約，抵押 1000 ETH ，並通知車手乙。若其選擇轉彎，合約將自動燒燬其抵押的 1000 ETH，這就使得車手甲必定選擇直行，而乙就不得不選擇轉彎以將損失降到最低。

2.2

2. 爵士樂隊表演

藉助智慧合約保障合作博弈中的利益公平分配。

爵士樂隊表演是一個合作博弈的案例[t10]。假設一個場景，某臺晚會需要招募表演人員，可供選擇的表演人員包括一名吉他手，一名架子鼓手和一名歌手。

若招募的結果是隻招募到一個人（歌手，吉他手，架子鼓手任意一人），則僅支付 1 ETH；
若招募到一名歌手和一名吉他手，則共支付他們 7 ETH；
若招募到一名歌手和一名架子鼓手，則共支付他們 5 ETH；
若招募到一名吉他手和一名架子鼓手，則共支付他們 4 ETH；
若同時招募到歌手，吉他手和架子鼓手 3 人，則共支付他們 10 ETH。

在上述表演費用中，顯然歌手，吉他手和架子鼓手組成一個樂隊參與表演的收益是最大的，他們有很大的動力組成一個聯盟去參加表演。三個人組成樂隊得到10個以太幣的報酬之後，每個人應該分配多少個以太幣才合理呢？

我們可以簡略分析一下樂隊中每個成員的貢獻：

有歌手參加的二人合作總收益為：7+5=12

有吉他手參與的二人合作總收益為：7+4=11

有架子鼓手參與的二人合作總收益為：5+4=9

在二人合作中，我們可以看到歌手的價值最高，吉他手的價值居中，架子鼓手的價值最低。

2012年諾貝爾經濟學獎獲得者夏普利曾提出一個Shapley值的概念，解決了在合作博弈中合理分配收益給參與者的問題[t11]。如果依據他的理論進行分配，歌手應該得到 4，吉他手 3.5，架子鼓手 2.5。

舉辦方可以將分配的Shapley值計算公式寫入智慧合約，在演奏結束之後讓合約自動轉賬給演奏參與者，從而保證分配的公平性。

2.3

3. 從他人的博弈中套利

空手套白狼：干擾他人博弈以套利。

假設在一個博弈關係中有兩個參與者：A 和 B。A 可以執行兩個動作，向上或者向下；B 也可以執行兩個動作向左或者向右。

若 A 選擇向上，B 選擇向左，則雙方均獲得 10 ETH 的收益；
若 A 選擇向上，B 選擇向右，則雙方沒有收益；
若 A 選擇向下，B 選擇向左，A沒有收益，B 獲得 1 ETH的收益；
若 A 選擇向下，B 選擇向右，A獲得 1 ETH的收益，B 沒有收益。

顯然這個時候 A 選擇向上，B 選擇向左是對雙方最有利的選擇。

在遊戲開始之前，第三方 C 建立一個合約，A 需在遊戲開始前向 C 轉 5 ETH,

若 A 按照要求向 C 轉 5 ETH，C將不再幹預遊戲，最終 A 獲得 5ETH收益，B 獲得 10 ETH的收益。
若 A 未按照要求向 C 轉 5 ETH，C將干預遊戲，遊戲結束後若B選擇向右，合約自動向 B 轉 100 ETH，那麼 A 最多獲得 1ETH 的收益，B 則獲得 100 ETH的收益。

對於 B 來說，他需要根據 A 是否事先向 C 轉賬來決定他的選擇。而對於 A 來說，向 C 轉 5 ETH最終他還能獲得 5 ETH的收益，如果不轉則最多隻能獲得 1 ETH 的收益。面對理性的 A 和 B，C 僅需要建立一個合約，不支付任何費用，就可以讓 A 乖乖得將部分收益轉讓給他。

面對這種赤裸裸的 "敲詐" 行為，A 是否可以藉助區塊鏈來逆轉局面呢？

（聰明的小夥伴如果想到了解決的辦法，歡迎新增小安的微信 secbit_xiaoanbi 來參與討論）

2.4

道阻且長 —— 尋找鏈上鍊下的繫結機制

正如 Virgil Griffith 所說，

Ethereum enables powerful economic vehicles we don't yet understand.（以太坊支援我們不甚知曉的強大的經濟學工具。）[t1]

區塊鏈作為一種去中心化，執行結果明確，不可篡改的"可信第三方"，打破了傳統的思維，為打破博弈關係建立新的規則提供了非常有效的途徑。作為一座全新的博弈競技場，區塊鏈和智慧合約必定會為博弈的應用和改變注入更多的靈感。

但正如上文所提到的，如何找到適合的機制讓現實博弈的關鍵操作與鏈上合約繫結，還需要更進一步的探索。或許距離這座"競技場"真正運轉起來，我們還有很長的路要走。

（完）

作者：安比實驗室

參考連結：

[t1] https://medium.com/@virgilgr/ethereum-is-game-changing-technology-literally-d67e01a01cf8

[t2] https://en.wikipedia.org/wiki/Game_theory

[t3] https://en.wikipedia.org/wiki/Prisoner's_dilemma

[t4] https://en.wikipedia.org/wiki/Cooperative_game_theory

[t5] https://en.wikipedia.org/wiki/Nash_equilibrium

[t6] https://wiki.mbalib.com/wiki/合作博弈

[t7]https://en.wikipedia.org/wiki/Stag_hunt

[t8] Upgradeability Is a Bug https://medium.com/consensys-diligence/upgradeability-is-a-bug-dba0203152ce

[t9] https://en.wikipedia.org/wiki/Chicken_(game)

[t10] https://www.coursera.org/lecture/mathematical-game-theory/shapley-value-and-core-gWuz9

[t11] https://en.wikipedia.org/wiki/Shapley_value

為什麼說區塊鏈是一座全新的博弈競技場？

推荐阅读

近期文章

新手教程

1什麼是區塊鏈？區塊鏈能做什麼？

2區塊鏈是如何運作的？

3區塊鏈和比特幣的關係？

4比特幣有什麼價值？

5如何購買比特幣？