膽小鬼博弈論：如何假裝死磕到底？－x0z7blog01的部落格

（）：膽小鬼博弈論：如何假裝死磕到底？

俗話說，狹路相逢勇者勝。不過從死理性派的角度來看，有勇無謀不足誇，智勇雙全才是王道。天生膽小沒關系，隻要你有大智慧，一樣能夠死磕到最後。讓我們一起來看看如何才算謀定而後動，知止而有得。

膽小鬼博弈

假設這樣一種情形：兩名賽車手各自駕駛汽車沿著一條劃定的直線相向而行，相撞前首先轉向的一方就是“膽小鬼”，英語中常用 chicken 來形容膽小的人，所以這個假想遊戲也被稱為 chicken game。雖然聽起來有些荒誕，不過在電影和現實中這種情境並不少見，比如《天下無賊》中劉德華與黎叔手下的四眼在火車頂上“比膽”，兩人站在疾馳的火車上，迎面而來的是黑洞洞的隧道，先蹲下的那個自然是輸瞭比賽，但堅持到最後卻需要極大的膽量，稍有不慎就會“肝腦塗地”。《裸婚時代》中也有類似的情節，主角劉易陽與樊少爺在地下停車場打賭，看誰最後剎車後離躺在地下的姑娘最近。此外，現實中的勞資談判問題也可以看做是膽小鬼博弈——雙方都不妥協必然就會兩敗俱傷，一方妥協往往意味著重大讓步。

在膽小鬼博弈中，我們假定雙方可以采取的策略隻有 2 種：死磕到底（用Dare或D表示）或者認慫（用Chicken或C表示），雙方（甲、乙）采取不同策略的收益可以用下表來表示：

這裡數字的絕對值並不十分重要，主要是用來表示雙方損失或收益的的相對大小。通常一個結果可以用(D, C)這樣的形式來表示，即甲方死磕到底，乙方最終認慫。

認慫固然丟面子，但相比玉石俱焚的結果來說，保命顯然更重要。因此對一個足夠理性的人來說，應該在他能夠控制的最後時刻選擇C策略，即果斷認慫。而如果甲方相信乙方是一個足夠理性的人的話，那他應該能夠預料到乙方會在最後時刻放棄，所以甲方的最佳策略是死磕到底（D策略），對應的結果就是(D, C)，類似的情況反轉過來是(C, D)。當然要是雙方都這麼想的話，最後的結果很可能是(D, D)。有趣的是，在膽小鬼博弈中當一方的選擇受到瞭限制時，其贏面可能會變大。例如在賽車的虛擬遊戲中，甲方的方向盤被鎖死，不得不選擇 D 的話，乙方再傻也會知道識時務者為俊傑，選擇 C 的結果 -1要遠好於同歸於盡的 -10。

通常， (C, D) 和 (D, C) 被稱為膽小鬼博弈的納什均衡點，即在這個狀態下，如果一方不改變其策略，不論對方采取什麼策略都不會有更大收益。例如對於 (D, C) 而言，甲方心意已決，就算乙方將對策由認慫改為死磕，結果也是兩敗俱傷而不會收益更高。類似的，如果乙方已經決定認慫，甲方不再死磕也選認慫的話，其收益將從 +1 變為 0。

這兩個納什均衡點被稱為“純策略均衡點”，即雙方采取的是一個 C 和 D 之間一個確定策略。而當甲乙至少有一方采取的策略是不確定的時候，我們可以用下圖來表示雙方的決策：

其中 x 表示甲方的策略， y 表示乙方的策略，位於 [0,1] 區間的 p' 表示某方采取 D 策略的概率。左邊的圖意味著甲方以概率 p' 采取 D 策略，乙方則一定會根甲方 D 到底。中間的圖表示相反的情形。右邊的圖表示甲乙雙方是否采取 D 策略都都屬於不確定事件，兩條虛線的交點就是膽小鬼博弈的第三個納什均衡點（混合策略均衡點）。假定甲乙雙方無差別，也就是說他們都以同樣的概率 p' 來決定是否死磕到底（策略D），因此混合策略均衡點總是在對角線上。

現實中的例子：勞資談判

一般來說，混合策略的納什均衡點隻是局部最優，換言之，如果雙方能夠在某種意義上“合作”的話，收益將大於混合策略均衡點的情形。讓我們來考慮一個實際中的例子：勞資談判。這裡同樣用 C 來表示妥協， D 表示堅持：

假定勞資雙方在充分考慮損失後，都決定以 1/3 的概率選擇 D 策略，那他們的期望收益（因為表中的收益是對稱的，隻需要計算一方的結果即可）就是：

如果現在有一個第三方機構介入（比如某個調解機構），這個機構可能給出的裁決結果是 (C, D)、(D, C) 和 (C, C) 中的一個，三種結果的概率各為 1/3。在該機構裁決後，會分別向勞方和資方通報他們各自應當采取的策略，但不告訴他們對方得到的結果。從收益上講，盡管不知道對方被告知的策略是什麼，勞資雙方仍然會傾向於接受該機構的裁決。因為拒絕接受這個調解策略也不可能有更大收益。

比如勞方被告知應當采取 D 策略，那資方一定會被建議采取 C 策略（雙輸的結果不在可能的裁決范圍內），顯然這是最有利的結果。如果勞方被告知應當采取 C 策略，可以認為資方被告知選 C 策略和 D 策略的可能性分別是1/2，所以資方期望收益就是：

如果勞方對這個裁決結果不滿意，強行采取D策略，期望的收益則會變為：

這個收益小於勞方接受裁決結果的期望收益。因為資方和勞方的收益表是對稱的，同樣的分析也適用於資方。

由此可見，一方不論被建議的策略是 C 還是 D，接受該策略的期望收益都大於采取另一策略的情形。當然在現實中，雙方的收益表、損失評估（即采取不同策略的概率）和第三方機構作出不同裁決的可能性都會有所變化，對具體的例子，是否接受裁決結果仍然要計算以後才能知道。

史上玩的最大的膽小鬼博弈：古巴導彈危機

歷史上玩的最大的膽小鬼博弈可能就是古巴導彈危機瞭。 1962年，為報復美國在意大利和土耳其部署的針對蘇聯的核導彈，蘇方在古巴境內秘密部署針對美國的核導彈，但這一舉動很快被美國發現。一時間美蘇雙方針鋒相對，互相威脅將冷戰升級為熱戰，在 13 天的危機交涉中，雙方軍隊在加勒比海地區險些擦槍走火。最終雙方相互妥協，蘇聯撤走瞭部署在古巴的導彈，美國保證不會入侵古巴並承諾稍後撤走部署在土耳其的導彈。

在古巴導彈危機中，美蘇雙方都在實踐美國前國務卿杜勒斯在 1956 年提出的戰爭邊緣理論(Brinkmanship)，杜勒斯說，“不怕走到戰爭邊緣，但要學會走到戰爭邊緣，又不卷入戰爭的必要藝術”。

在博弈論中，有時也用“邊緣博弈”來表示一種特殊的膽小鬼博弈：雙方在盡量對自己有益的情況下避免雙輸局面。像勞資談判這種情況，要是實在達不成共識，大不瞭一拍兩散。但對兩個手握核武器的超級大國來說，問題就不這麼簡單瞭。

在邊緣博弈中，雙方往往互相恐嚇，恐嚇的關鍵在於讓對方相信自己有能力也有決心實現這些恐嚇（甚至是讓對方相信自己出於某些不可控制的原因必須毫不退讓）。假如美國剛發現蘇聯在古巴部署的導彈就威脅要對蘇聯本土的全部軍事目標實施核打擊，那這就是一個不很可信的恐嚇，因為蘇聯會懷疑美國是否有這樣的決心在剛有風吹草動時就全面開戰。

事實是美國宣佈要封鎖古巴，這就是個可信的威脅，美國具有這樣的能力也很可能有這樣的決心。但美國封鎖古巴對其影響仍然有限，所以蘇方繼續在古巴部署導彈並聲稱封鎖不可接受，還聲稱導彈隻是防禦性質的。這說明盡管美國的恐嚇是可信的，但其程度仍然不能阻嚇對方。

美國為瞭證明自己言出必行，果然開始封鎖古巴。並在次日，美國戰略空軍司令部戰備級別提高， B-52 進入 15 分鐘起飛狀態， 145 枚洲際導彈進入發射準備。肯尼迪向他的國傢安全執行委員會表示唯一的解決辦法是入侵古巴，蘇聯此時仍沒有任何退讓的意思，雙方陷入僵局。

另一方面，在美蘇秘密接觸進行外交努力的同時，似乎雙方的軍隊和古巴方面已經不受控制瞭。美軍進行瞭一次運載火箭發射試驗卻沒有通知肯尼迪的執行委員會。一架 U-2 偵察機未經授權對蘇聯遠東地區進行瞭 90 多分鐘的越境偵查。一架海軍飛機向一艘位於古巴附近的蘇聯核潛艇投擲瞭深水炸彈（美當時不知道這艘潛艇攜帶瞭核彈頭），要知道蘇聯艇長在出航前收到的命令是開戰後可自行決定是否使用核導彈，在核導彈已做好發射準備的情況下，這艘潛艇還是放棄瞭發射，決定上浮。而美國派往古巴的偵察機也被防空導彈和高射炮擊落。

就在所有人都以為第三次世界大戰不可避免時，事情峰回路轉。肯尼迪決定不進行報復並密電赫魯曉夫表示同意赫氏的建議，撤回部署在土耳其的導彈並保證不入侵古巴，以此作為蘇聯撤回古巴導彈的交換條件。古巴導彈危機隨即得到解決。

在邊緣博弈中，最重要是要讓對方相信自己的恐嚇絕不是虛張聲勢，甚至讓對方相信自己的決策是身不由己（例如美國軍方的某些行動就沒有經過肯尼迪的同意）。由於雙方都有強烈的願望避免雙輸的局面出現，因此最終的結果往往都是雙方達成一致，各自妥協。

當然，古巴導彈危機本身牽涉甚廣，除美國和蘇聯之外古巴也扮演瞭重要角色（例如卡斯特羅曾密電赫魯曉夫建議蘇聯先下手），此外美蘇國內各方的壓力也對各自的決策產生瞭影響，因此很難以最簡單的膽小鬼博弈來分析，有興趣的讀者可以參考這篇文章，作者 Steven Brams 是美國紐約大學政治系的教授，他以對政治學和博弈論的研究而知名。

Orignal From: 膽小鬼博弈論：如何假裝死磕到底？