博弈論第二章零和二人博弈——必然有輸有贏-全文小說網

日常生活中，我們經常會陷入選擇兩難的困境，有時認為甲比較不錯，有時又認為乙也令人滿意。那麼，我們對此應該做何選擇呢？有些事情決策失誤後還有重新選擇的機會，但是有些事情一旦決策失誤就會面臨無法改變的狀況。如何才能讓自己做出正確的決策，遠離痛苦和後悔的深淵呢？我們每個人都需要一種更好的選擇方法，那就是博弈。

我們需要重視任何一次博弈，並且能充分地從歷史資料和研究中掌握博弈的規則和理論，以此提升我們的博弈理論水平以及策略選擇能力，更好地面對社會中重要的抉擇。其實人生就是一場永無止境的博弈，我們需要學會在博弈中生存，與他人友好相處，以及學會適應和使用世界上的其他法則，在這個過程中更好地為自己做出選擇。

一人博弈：一場「鬥智」之戰

前面的介紹與分析讓我們瞭解到對於博弈的形式化的描述，也瞭解到了博弈策略的雛形，這讓我們能夠用簡單、直觀的形式對複雜的博弈做出清晰的概述。透過一些簡單的博弈，讓我們看到了前者與後者之間的等價關係。為了方便研究和討論，我們還會用另外比較簡單的方式給它們命名，我們將這些不同的命名方式稱為廣闊和正規化的不同形式。

我們對其的命名方式是完全等價的，我們可以按照在實際情況中較為方便的形式給它們不同的名稱，而且這樣的做法並不會影響到我們對其討論的正確性和一般性。

事實上，那些非常正規化的形式更加適合於我們推匯出博弈的一般定理，但是對於其中比較特殊的情況，還需要我們運用更加靈活多變、廣闊的形式。換言之，正規化的方式能夠幫助我們建立關於博弈所共有的性質，但是後者能夠更加直觀清楚地告訴我們不同的博弈之間性質的差別，以及如何解決這些博弈所出現的結構性差異。

我們已經對博弈進行了較為完整的描述，那麼接下來就需要對此建立正面的理論。我們可以試著想象，若要建立這一理論，需要我們從簡單的博弈逐漸過渡到複雜的博弈，這就意味著我們將按照其難度、複雜程度的遞增次序對其進行討論和研究。

我們可以根據參與博弈賽局的參加者數量對其進行劃分，即由n個參與者參加的博弈屬於n人博弈，同時，這也根據博弈是否為零和進行分類。由此一來，需要我們區分開零和n人博弈與一般n人博弈。

首先，我們對一人博弈做出說明。在正規化的形式中，我們能夠看到一人博弈的組成是隨機選擇一個數，博弈中的唯一的局中人將會得到對應的結果。此時，我們能夠非常明瞭地看出，零和的博弈中是一種空無一物的狀態，那麼我們便不需要對它再做出任何說明。

其實，我們能夠用一種極其簡單化的形式對一人博弈做出描述，假設我們用a表示博弈中變化的量，但它所表示的東西，並不只是在一個「著」中，而是代表了局中人的策略，它意味著在一個博弈賽局中所有可能出現的情況。同時，它也代表了這個局中人應對這些情況的所有策略和一套完整的「理論」。

此時，我們需要明白，即使一個人的博弈，可能出現的所有形式也可能是錯綜複雜的。簡單地說，它有可能同時包括「機會的著」「人的著」，而且這些都屬於同一個局中人，甚至每一種可能出現的「著」都包含著各種不同的走法。同時在出現任何一個「人的著」時，可以參照局中人掌握的情報資訊，也可以根據提前設定的方案應對出現的情況。

我們可以列舉出很多單人獨玩的遊戲，它們的表現形式複雜多變，而且十分細緻，但是有一種非常重要的情況——我們所進行的單人獨玩的遊戲中沒有滲透出上述的情形，而這正是不完全情報的一種體現。簡言之，在同一局博弈中，唯一的局中人的不同的「人的著」中，具備先現性與前備性等價的情況的要求是：唯一的局中人有兩個「人的著」，即a和b，在進行每個「著」時，局中人並不知道另一個「著」的選擇結果，在情報不完整的情況下這種情況是難以實現的。

但是我們前面講到過，可以通過把局中人拆分成兩個或者多個具有相同利害關係，同時在情報交換方面是不完全的人，便能夠實現先現性和前備性等價的情況。我們可以通過橋牌博弈的例子構造出類似於一人博弈的情形，只是單人遊戲的多種形式都不屬於這種博弈型別。還有一些雙重單人遊戲的規則是在兩個參與者之間進行的競爭，它屬於二人博弈的範疇。

這些情形在實際生活中有一定的意義，諸如一些分配方案的決策，當互相交換已經不存在時，且只有一個機構能夠轉嫁社會產品，那麼所有的社會成員的利益關係是一致的。需要注意的是，在這種情況下，我們不能將每位成員都看作博弈的局中人，主要原因是在成員之間不存在利害關係，更不可能出現某些成員聯手對付其他成員的情況。因此，我們需要將這個機構看成一個一人博弈，只是在這些社會成員之間存在著不同的聯絡，這就意味著其中可能會出現不同的不完全情報。

在這種嚴謹的分配方案的例子中，我們很難對此種分配方案自身進行鑑定，因此我們可以將分配方案與博弈規則聯絡起來。由於博弈的規則是絕對的、不容侵犯的、不接受批評的，我們可以通過對博弈策略的瞭解，簡單地解決博弈規則內的方案分配問題。

「偷雞」：「虛張聲勢」促成功

配銅錢、石頭剪刀布等博弈相對簡單，而且它們之間的廣闊形式和正規化並無本質性的差別。但是，接下來我們所要講到的是一種形式更加廣闊的博弈，因為這些博弈中的局中人有若干個「著」，這就意味著在這些博弈中，廣闊的形式和正規化的過渡之間變得更加豐滿而有意義。

我們會對撲克中的博弈進行嚴格的討論，而實際過程中的撲克相對複雜，但是我們又想進行極其細緻的討論。在此種情況下，可以對其進行一些簡化處理，甚至是進行一些根本性的改變，方便我們對其中的博弈情況進行研究。基於此，我們對撲克的所有修改都會保留其最初的基本性質和觀念。

實際上，撲克可以由任意人數參與，但是我們所要研究的是零和二人博弈，因此我們將參與撲克的人數規定為兩人。

進行撲克博弈之前，我們將從所有的牌中拿出5張撲克牌給賽局中的每個人，在此種情況下，每個人所獲得撲克牌的組合會有2598960種，這種情況下，我們將其稱為一「手」牌。此時，每個人將自己所獲得的撲克牌按照從大到小的順序進行排列，按照我們的前提規定，即每個人一「手」牌的大小對應的是撲克牌的強弱。

其實，撲克牌在實際的玩法中有很多種，或者可以說它有多種變形，我們可以將是否換牌作為區分其是何種博弈的參照點，即「換牌」博弈與「不換牌」博弈兩種。

在「換牌」博弈中，參與賽局的局中人可以換掉自己手上的某張撲克牌，或者換掉手上的所有撲克牌，而且這種換牌的方式是「千奇百怪」的。在某些換牌變形中，局中人手中的一「手」牌，往往是在同一賽局中相繼獲得的。相對來說「不換牌」博弈相對簡單，即在同一賽局中，必須保證自己手上的撲克牌不發生變化。因此，我們為了在研究過程中偏向簡單，所以只研究「不換牌」博弈。

在「不換牌」博弈中，賽局中的參與者便不需要將一「手」牌作為一手牌，這裡所說的一手牌指的是局中人所獲得的撲克牌的組合。假設我們令局中人所獲得的撲克牌的總數為s，每個人所獲得的撲克牌數為s。由於前面已經提到在博弈中如果使用全副牌，那麼每個局中人手中的撲克牌的組合為s=2598960。由於發牌是按照一定的規則進行的，所以每個人獲得撲克牌的可能性是相同的，那麼從全副牌中隨便抽取一張撲克牌的數作為s，而s便是賽局中的「機會的著」，而且兩個局中人獲得其中可能的值的機率是相同的。因此，「不換牌」博弈便由「有機會的著」開始了，我們將參與博弈的局中人分別命名為甲和乙，而給他們抽取的撲克牌數為甲1和乙2。

上述為撲克博弈的第一個階段，通常情況下撲克博弈進行到第二階段時，便需要賽局中的參與者進行「叫價」。所謂「叫價」，指的是兩個參與者需要下賭注，而這個賭注有大有小，完全取決於局中人自己的決策。一般情況下，當其中的一個局中人「叫價」之後，另一個局中人會有三種選擇，即「看牌」「不看牌」「加叫」。

「看牌」指的是這個局中人接受了第一個局中人的「叫價」，他需要將自己手上的撲克牌全部攤開，與「叫價」的局中人的撲克牌進行比較，最後兩個局中人手上擁有較強的一「手」牌的局中人獲勝，而且能夠獲得此次「叫價」的收益，並且結束此局博弈。

「不看牌」指的是，局中人願意接受他在前一局中最後一次的「叫價」，而且他所接受的這個金額要比現在的數額低，而且兩個參與者都沒有其他的異議，此時，兩個局中人便不會在意各自手上握有怎樣的牌，因為他們手上的牌無須全部攤開。

「加叫」指的是，對方能夠給出「叫價」者更多的叫價，以此還擊「叫價」者給出的叫價，那麼在這種情況下，兩個局中人的地位便會發生反轉，即前面「叫價」的局中人此時便會有三種選擇：「不看牌」「看牌」「加價」。其餘的對局，便以此類推。

但是，在進行撲克博弈的對局中，若是參與者中的一方手上握有強牌，那麼他有極大的叫高價的可能性，而且會根據情況進行不少加叫，主要是因為他有足夠的信心覺得自己能夠在賽局中獲勝。這就說明在他進行加叫或者叫高價的過程中，向他的對手釋放了一個資訊，即他的對手可以假設他手上握有強牌，那麼對手在這種情況下，極有可能在進行決策時會選擇「不看牌」。這也意味著，雙方在「不看牌」的決策下，無法對雙方的撲克牌進行對比。此時，若是手上的牌是弱牌的一方，他便可以選擇加價或者叫高價，進而引起對手不看牌，以此達到一種自己手上握有強牌的假象，利用這種方式極有可能用手上的弱牌贏過對方手上的強牌。

在撲克博弈中，這種現象被稱為「偷雞」。顯而易見，這種策略大都是在撲克博弈中有經驗的參與者才經常使用的方法，但是對於上面的分析一定會有人產生異議，這種研究是否是「偷雞」的真實原因呢？

其實，我們對此還有更容易理解的解釋：當進行撲克博弈時，假設我們都知道其中的一個局中人手上握有強牌，他便會做出叫高價的行為；此時，面對這種情況，他的對手極有可能選擇「不看牌」。因此，手上握有強牌的一方便不能再繼續叫高價或者多加叫，正是出於此，他手中的牌才能夠幫助他贏得此局博弈。所以，他在這種情況下，儘量不能讓對手得知自己的真實情況，反過來說，他需要傳遞給對手的資訊是自己手上握有弱牌，但是還在叫高價。

通過上面的分析，我們能夠清晰地發現，撲克博弈中的「偷雞」其實包含兩種可能存在的動機：一種是其中的一個局中人手上握有弱牌，但是想要給對手營造出一種手上握有強牌的假象，進而混淆對方的決策。另一種是其中的一個局中人手上的確握有強牌，卻要製造出一種自己手上其實是弱牌的假象。這兩種動機都是為了向自己的對手傳遞出反面的訊號，給對手的決策造成干擾，進而增大自己在博弈中獲勝的可能性。

關於這兩種動機是否能夠獲得更高的收益，還取決於對手最終的決策。比如在第一種情況下，若想真的「偷雞」成功，需要對手真正選擇「不看牌」，才能獲得最終意義上的成功。而對於第二種情況來說，其中的一個局中人在對手選擇「看牌」策略時，便能成功給對方製造混亂情報，最後獲得此局博弈的勝利。

事實上，採用這種反方向的策略帶有一定的風險性，由於其中的一個局中人無法判斷出對手是否會順著自己的方向走，所以這種「叫價」的方式自身具有冒險性。

假設使用了不正確的「偷雞」法，便會偏離好策略，最後導致局中人利益受損。在這種情況下，對手只需要選擇堅持一個正確的策略就可以了。當對手選擇了一個完美的策略後，即使不正確的「偷雞」法，也不會給局中人造成損失。但是，當對手在博弈賽局中逐漸偏離完美的策略後，便會給前面的賽局中的局中人造成損失。

這就告訴我們，若想成功地「偷雞」，其實並不需要在博弈中遇到一個實力相當的對手，而是在於對手是否會在博弈賽局中偏離完美的策略，同時，「偷雞」對這種情況是有所防備的。

通過上述描述，我們清楚地發現，撲克的此種變形所擁有的完美策略並非一成不變或者最佳的，所以在這種情況中，永久最優的策略是不存在的，而且「偷雞」其實是在博弈中的一種具有防禦性的措施。

你真的會打撲克嗎？——「叫價」的藝術

我們在前面的研究中多次強調指出，讓博弈中的兩個局中人的策略選擇相等，是零和二人博弈中最簡單的一種方式。在這種博弈中，局中人的策略選擇被稱為純策略。事實上我們不應該用這個名稱，用「著」來表示似乎並沒有顯得太誇張。而且，在上面已經講到的問題中，它們之間存在的廣闊形式和正規化之間似乎沒有任何明顯的區別。因此，在這些型別的博弈中，我們會將「著」和策略等同起來，而這些原本就屬於正規化的形式特徵。但是我們現在將對一個廣闊形式的博弈進行探究，這類博弈中的局中人有若干個「著」，而且這些「著」能夠更直觀地向正規化的形式和策略進行過渡。

撲克本身具有很多規則，正是這些技術性的規則才避免了賽局中的局中人進行無限次的加叫，保證叫價的次數是有限的。參與撲克博弈的雙方，都會自動避免不現實的叫高價，為了避免對手在叫價的過程中出現超人意料的叫價，所以在每局博弈中，都規定了一個最高叫價的數值。除此之外，還規定不能出現過小的叫價，這種規定保證了博弈順利進行。

第二章 零和二人博弈——必然有輸有贏（第1頁，共2頁）

第二章零和二人博弈——必然有輸有贏（第1頁，共2頁）