博弈論第一章策略博弈——瞭解對手，戰而勝之-全文小說網

博在古代指的是賭博，而弈則是下棋或者圍棋；棋盤中的每一步都暗藏著玄機。博弈的觀點經常出現在我們的視線中，究竟何為博弈？博弈對於我們的生活又會產生怎樣的影響呢？我們從通俗意義上講，博弈可以被看成「遊戲」。簡單來說，博弈指的是一個組織或者個人，甚至一個團體，根據自身所掌握的資訊，在一定的大環境，以及約束條件下，同時或有先後之分的，一次甚至多次，從符合規則和自身選擇的行為以及策略中做出抉擇，並且加以實施，最後根據自己的決策從中獲得某種收益或者選擇結果。

其實，博弈就是根據自己所掌握的情況，在自身所處的環境中做出最佳選擇的一種謀略。博弈並非深不可測或者多麼高深的一門「學問」，而是一種淺顯易懂、非常容易被掌握、在生活中非常實用的一門「藝術」。

何為博弈——博弈的分類與基礎構成

對於博弈的分類，有一種表述方式是這樣的：在宣佈博弈結束時，所有參與博弈的局中人所獲得報酬的總和是否永遠為零？若總和為零，那麼就相當於支付只在局中人之間進行，並不產生其他事物的生產與消耗，即我們所接觸到的一切具有娛樂性質的遊戲。這種博弈稱為零和博弈，反之則稱非零和博弈。

首先，如果我們可以建立一套針對零和博弈的理論，那麼就可以藉助這一理論幫助我們處理其他一切博弈。我們將會在零和二人博弈的基礎上應對局中人增多的零和n人博弈，零和n+1人博弈。

在零和二人的博弈中，應該注意的根本問題是：博弈中的每個局中人是怎麼策劃其活動的？在博弈的各個階段，他們又有什麼情報資訊呢？若其中一個參與者瞭解到另一個參與者的策略，會對整個博弈產生什麼樣的影響呢？若瞭解了全部關於博弈論的理論知識，又能起到什麼樣的作用呢？

我們首先要做的就是在概念上對博弈進行定義。

關於博弈的概念，有很多是比較基本的，但博弈是一個具有組合性質的概念，在日常語言描述中，它的用法經常模稜兩可。對於博弈的解釋，有時表示一種含義，有時又另有所指，甚至會讓人認為對博弈的解釋就是它的近義詞，基於此，我們將會給出專業的術語：

首先，博弈是一個十分抽象的概念，它與某些博弈比賽有著一定的差別。我們必須將博弈的抽象概念與博弈中的賽局進行區分和分辨。前者指的是，那些能夠描寫博弈這個抽象概念的規則全體，是博弈從開始到結束，按照特定的方式進行，整個進行的過程稱為一場博弈。在日常生活中，我們通常會將「一場」稱為一個競賽，諸如，國際象棋、撲克、體育運動等。

其次，「著」（讀作zhao）是博弈的構成元素，我們也應該知道其界定。「著」指的是，在賽局的所有可能選擇中做出抉擇的權利，此項權利可以交給賽局中的某一個人執行，或者採用隨機的方式進行，而這些方式在博弈的具體細則中都有非常明確的規定。因此，「著」不僅代表了博弈中的「決定權」，還是博弈的組成元素。在每一個具體的賽局中，所有的抉擇都是由一種特定的走法決定的。所以，「著」對於選擇而言就相當於局對於博弈。簡言之，一系列的「著」共同組成了博弈，一系列的選擇構成了整個局。

最後，要明確博弈的規則與整個賽局中的人的選擇、策略並不相同。在賽局中，每個人都可以隨意做出自己的選擇，我們將這種選擇的任意性稱為支配個人選擇的一般原則。由於每個人的策略在本質上有著好壞之分，是否採用他們的決策則是每個賽局中的參與者的自由，但是這些都是在博弈的規則下進行的，而博弈的規則是不允許被打破的。假設博弈規則遭到破壞，那麼整個事件將不再使用最初的規則進行描述了。事實上，在大多數情況中，甚至是在物質基礎上，規則都是不會被破壞的。

簡單說，國際象棋比賽的規則要求所有棋手都不能使用自身的王棋進行「將軍」，這就如同禁止「卒」棋橫走一樣，這些鐵定的規則是不容許違反和破壞的。但是，若是棋手把自己的「將」棋放到了下一步對手就能把他「將」死的位置上，那麼這是一種不聰明的下棋方法，自然就不屬於國際象棋比賽的規則。

假設在一場博弈t中，有n個局中人，為了方便我們瞭解博弈的基本組成要素，我們將這n個局中人分別標記為1，……，n。根據我們前面的講述，這個賽局是由一系列的「著」所組成的；假設在賽局進行之前我們便將所有的數目和它們的順序全部設定完了，在進行的過程中，我們便會發現這些設定好的東西並不重要，想要把它們取消是一件非常簡單的事情。此時，在整個博弈局中，我們用字母v表示「著」中特定的數量，而這個v是一個正整數，它表示1，2，……，我們用m1，……，m（v）表示博弈中的「著」，同時假設這便是它們在規定中出現的順序。

在此次博弈中，每一個「著」m（k），k=1，……，v，它們代表了無數種可能出現的走法，這些不同的選擇構成了「著」。此時，我們用a（k）表示賽局中可能出現的不同的走法的數量，用w（1），……，w（k）（ak）表示博弈中所有走法的自身。

在賽局中，可以將「著」分為兩種。假設在局中人中指定任意一人做出選擇，那麼將會依賴他的自由選擇權，其中不摻雜任何其他的因素，這種選擇被稱為「著」中的「第一類的著」，亦或者「局中人的著」。假設在賽局中所做出的選擇是建立在某種機械規則上的，那麼便會依據一個確切的機率來決定它最終的結果，這種選擇方式被稱為「第二類的著」，抑或者「機會的著」。因此，對於前者而言，需要指定任意一個局中人的選擇來確定「著」的結果，即應該明確指出這個「著」是哪個局中人的意志選擇的。若我們用k（k）來標記這個局中人，即他的序列號碼，由此一來，k（k）=1，……，n。

對於第二種「機會的著」，我們提前設定好，令k（k）=0。在此種情形下，便會出現不同的走法，即w（k），……，w（k）（ak），那麼前提條件是它們的機率必須是已知的，我們用p（k）1，……，p（k）（ak）來表示這些已知的機率。

因此，在任意一個「著」m（k）中的選擇，都是從w（1），……，w（k）（ak）中所得到的。即，隨機挑選出一個數1，……，a（k）。假設我們用θ（k）表示隨即挑選出來的某個數，那麼我們能夠非常清晰地看出，這個數便是從θ（k）=1，……，a（k）中選擇出來的。在此基礎上，我們能夠將所有的「著」所對應的不同選擇表示出來，即m1，……，m（v），那麼整個賽局便能清晰地表示出來。簡單說，這個賽局便能夠用一個直觀的數列表示出來，即θ1，……，θ（v）。

事實上，整個博弈t中的所有規則必須提前明確，若一個賽局是由一個已知數列θ1，……，θ（v）表示，那麼，任何一個局中人k=1，……，n，在此賽局中的結果是什麼，這就說明，在整個賽局結束時，參與博弈的每個人將會獲得怎樣的報酬。假設我們用f（k）表示每個局中人應得的報酬，當k獲得一筆報酬，那麼f（k）＞0；假設他在對局中付出了一筆報酬，那麼f（k）＜0；若以上兩種情況都不符合，則f（k）=0。因此，對於每個f（k）都應該是由函式θ1，……，θ（v）所得出的，即：

f（k）=f（k）（θ1，……，θ（v）），k=1，……，n。

此時，必須強調博弈t的規則僅表示了f（k）=f（k）（θ1，……，θ（v））是一個函式，這就意味著每一個f（k）所對應的變數θ1，……，θ（v）是一種抽象的依從關係，而且其中的任意一個θ（k）是一個變數，它的取值範圍是1，……，a（k）·θ（k）的特定數值。簡言之，它是從數列θ1，……，θ（v）中選擇的，並不屬於博弈t裡。正如我們前面所講到的，這便是對一個局的定義。

博弈的解——混合策略

假設博弈中的每一個局中人在博弈開始前就已經設想了可能發生的一切情形，並做出了相應的應對決策，也就是說局中人事先已經對博弈有了一套完整的計劃，只要局中人對於每一種可能發生的情況，以及在那個時刻他所掌握的每一條情報資訊的判斷，與博弈規則提供給局中人的情報形式相一致，這個計劃將明確他會採取什麼樣的選擇。這時，我們把這種計劃稱為一個策略。

相信不少人都玩過井字棋遊戲，假設在遊戲中自己先行，只要自己的方法是正確的，那麼對手將無法擊敗自己。相反地，假設對方採用了正確的方法先行，那麼自己將無法贏得對手。對於這種型別的博弈來說，它們最終的勝負結果都是隨機的。

假設在某個博弈中，參與者輪流將硬幣往桌上放，直到參與博弈的一方放不下硬幣時，就意味著這個參與者在博弈中失敗了。若在這個博弈中，自己作為先行的一方，那麼便會採用完美的策略保證自己最終獲勝。最簡單、常用的策略是先行的一方將硬幣放在圓桌的正中心，由此一來，不論對手將硬幣放在何種位置，先行的一方都能夠將硬幣放在恰好對稱的位置，這能夠保證先行的一方永遠不會輸，而且輸掉博弈的人只能是對手。

象棋實際上也和上述的博弈一樣簡單，假設參與博弈的兩個人都擁有非常良好的計算能力，那麼博弈的結果無外乎：雙方打成平手、先行者必然獲勝、後行者必然獲勝。雖然我們並不知道最終的博弈結果是哪一種，但是我們通過博弈的逆向推理，博弈論很好地證明了象棋必定具有這種簡單屬性。

假設我們將象棋看成簡單的博弈，那麼猜硬幣則不屬於此類博弈，若是參與猜硬幣的雙方想要保持一致，那麼當其中的一方選擇正面時，另外一方也需要選擇正面，但是假設先行者選擇了正面，同時對手知道了先行者的選擇，對手為了戰勝先行者，便會選擇反面。這時先行者又會選擇反面，那麼對手知道後，便會選擇正面。由此看來，這是一個無限迴圈。

通過這類博弈，我們能夠清楚地認識到，如果你不想讓對手知道自己的「秘密」，那麼自己也不要知道。或許你可以採用投擲硬幣的方式，並且用正反面決定自己所要採取的行動，在這種隨機的決定下，即使你的對手十分理性，同時知道了你的政策，最後他能獲勝的機率也僅僅是一半罷了。

我們經常玩的遊戲「石頭、剪刀、布」，還有「配銅錢」等，都屬於零和二人博弈的問題。但是這些博弈問題中，往往包含參與者自身的經驗和生活常識等影響因素。

比如，有些人玩過的「配銅錢」遊戲，無非是出「正面」或者「反面」兩種博弈的策略選擇方式，重中之重是參與博弈的人需要猜測對方的策略，這種方式似乎非常困難，而且不具有規律性。由於這個遊戲的博弈規則十分明確地規定了，當其中的一個參與者做出自己的決策時，另外一名參與者禁止得到對方做出的選擇的任何資訊。但是這種說法僅考慮到理論層面，實際生活中進行類似的遊戲時並非如此。

假設，兩個局中人進行一次「配銅錢」遊戲，其中的一個參與者在此次賽局中不會刻意去揣測對方的意圖，而另外一位局中人是智力中上等的參與者。那麼，這個局中人在博弈中要做的就是，儘量避免讓對方猜到自己的對策。因此，他會在連續的局中毫無規律地出「正面」或者「反面」。

實際上，我們需要了解的是參與博弈的人在同一單獨局裡的對局策略，那麼我們便需要針對一局進行研究和討論，而不是討論局中人在一連串的局中的策略。假設我們不用局中人是否出「正面」或者「反面」，而是規定出「正面」的機率為1/2，出「反面」的機率也是1/2。為了保證博弈的有理性，我們規定博弈的局中人可以在他們選擇行動前，採用隨機的方法，來選擇自己究竟是出「正面」還是「反面」，這樣就能夠保證他們的利益不受到損失。這種前提規定的優點是，不論對方選擇出哪一面，前面的局中人對博弈賽局的期望值永遠是0。這種方式的特別之處在於，若是其中的一方十分確定對方要出「正面」或者「反面」，那麼他對整個賽局的數學期望都將是0。此時，若是對手也選擇了和局中人同樣的做法，那麼結果自然是一樣的。

假設我們提前設定，「配銅錢」博弈中的一個局中人能夠自主選擇他認為的所有可能獲勝的策略進行整合，在這種情況下，能夠保證他自身的利益不受損。由此一來，採用這種決策方式，不論對手做何選擇，他都不會有利益損失。相同地，假設對方也使用這種策略，便能讓前面博弈對局中的人不論怎樣也贏不了。

「石頭、剪刀、布」中的博弈亦是同樣的道理，因為每一局的玩法都會出現3種可能，與上面所提到的「配銅錢」遊戲相似，選擇所有可能的「混合」方式，便能獲得最好的博弈策略。

除了「配銅錢」中的博弈外，我們還可以針對生活甚至文學裡的內容研究博弈，就像下面這個福爾摩斯探案集中的故事：

為了躲避一直在追蹤他的莫里亞蒂教授，夏洛克·福爾摩斯迫切想要離開倫敦，然後前往多維爾港，再從那裡前往歐洲。然而一切並非他想象中的那樣，當他乘上火車，列車將要出發時，一個他最不想看見的面孔出現在站臺上，他看見莫里亞蒂教授正在站臺上望著他。

第一章 策略博弈——瞭解對手，戰而勝之（第1頁，共2頁）

第一章策略博弈——瞭解對手，戰而勝之（第1頁，共2頁）