博弈論第二章零和二人博弈——必然有輸有贏-全文小說網

在實際進行撲克博弈時，參與賽局中的任意一個人率先叫價，緊接著剩下的局中人進行輪流叫價。在這種博弈過程中，所包含的有利因素和不利因素自身就是一個非常有趣的問題。而且撲克本身是一個比較複雜的博弈，但是為了方便研究叫價和加叫次數的限制，我們將其進行簡化。

撲克自身就具有一種不對稱性，正是受到這種因素的影響，所以希望在研究的過程中不受這種情況的干擾，這樣便能夠研究出撲克在最簡單的形式下的主要特徵。基於此，我們假設參與博弈賽局的兩個局中人，在博弈進行中都會根據自己的選擇開叫，而且他們不知道另一個局中人做何決策，當這兩個局中人分別選擇完自己的叫價後，才讓對方知道自己的叫價結果，簡單說就是讓對手知道自己的叫價究竟是「高」還是「低」。

在此基礎上，我們再對此種撲克博弈進行簡化：假設我們規定參與賽局的每個人都只有兩種決策權，即「不看牌」和「看牌」。這就意味著，在進行此次博弈時，排除了「加叫」這種決策。簡言之，「加叫」只是在用一種更加巧妙和激烈的方式來達成局中人的某種意圖，只是早在其中的一個局中人進行高叫價的時候，便能展現出他的這種意圖。由於我們想要更加直白、明瞭地看待撲克博弈的問題，所以要盡最大可能避免使用多種意圖來表示此次博弈中的一種意圖。

參照上面的方式，我們設定下面這些條件：除了賽局中的參與者不讓對方知道自己的真實意圖外，還要考慮到其中的一個局中人的決策被對方知道的情況。試想，當參與撲克博弈的局中人的叫價同為「高」或者同為「低」時，便需要兩個參與者將自己手上的牌同時攤開，比較它們的大小。這時，某個局中人手上如果握有強牌，那麼他將獲得對方手上的數額；假設雙方手上握有的牌大小相同，那麼便不需要其中的一方進行支付。

除此之外，當其中的一個局中人選擇了「高」的叫價，而另一個人選擇了「低」叫價時，那麼選擇「低」叫價的一方便會有兩種選擇，即選擇「不看牌」或者「看牌」。此時，當「低」叫價的一方選擇「不看牌」時，而且在不考慮到手上的牌的強弱的前提下，便意味著他將付給對方自己低叫價的數值；當「低」叫價的一方選擇「看牌」時，那就意味著他的選擇發生了改變，即由「低」叫價變成了「高」叫價，針對這種情況的處理方式便會和最初都選擇「高」叫價時一樣。

我們再次對撲克的技術性規則進行討論：在撲克博弈中，我們為了避免局中人會沒有限制地加叫，便規定了局中人叫價次數是有限的，這便是終止規則。為了避免不切實際的叫高價發生，因為這對於對手而言將會產生不可預料的後果，所以在博弈賽局中規定了叫價以及加叫的一個上限數值，同時通常情況下，還會規定禁止過小的加叫。因此，我們將會給予叫價和加叫一個限制性的條件，我們在博弈進行前，就設定兩個數目，a和b，而且讓a＞b＞0。

同時，我們還規定博弈中的局中人的每次叫價，即要麼叫價「高」，要麼叫價「低」。在這種情況下，我們將前者定義為a，後者定義為b。叫價高低之間的比值是此次博弈中唯一有聯絡，並且會發生變化的因素。

假設在進行撲克博弈的過程中，a與b的比值明顯比1大，那麼這就說明博弈的風險和冒險性極高；相反地，若是a與b的比值僅僅比1大一點，那麼這就意味著此次博弈較為安全。

現在，我們將叫價和加價的次數限制對整個博弈過程進行簡化。實際上，在日常生活中進行撲克遊戲時，其中的一個局中人率先開始叫價，之後局中人開始輪流叫價。

由於在撲克博弈中，其中的一個局中人擁有第一次叫加權，同時他也要第一個做出行動。這時，不僅有有利因素，還有不利因素，這自身就是一個非常有趣的問題。我們已經對撲克不對稱形式進行過討論，而且這個問題佔有一定地位。只是我們在最初研究這個問題時，希望能夠避開這個帶有困擾性的問題。換言之，我們避免在此博弈中研究所有的不對稱情況。由此一來，我們將會得到撲克博弈的最純粹、最簡單的形式下的重要特徵。

為此，我們可以在進行撲克博弈前假設，賽局中的每個局中人都擁有自己的開叫，而且每個局中人在博弈中並不知道其他局中人的選擇，當博弈的雙方都做出自己的叫價後，其中一個局中人的選擇才被另一個局中人得知，即讓每個局中人清楚另外一個局中人的選擇，這時才知道對手的叫價究竟是「高」還是「低」。

除此之外，我們還能對此種博弈進行簡化：我們提供給賽局中的局中人兩種選擇，一種是選擇「看牌」，另一種是選擇「不看」。這就意味著，我們在進行此次撲克博弈時，並沒有「加叫」這個選擇。「加叫」在某種程度上只是局中人巧妙、強烈地表達自己的某種意圖的方式，尤其是在一個高開叫價的博弈局中，更明顯地表達出了這種意圖。我們的研究目的是希望問題能夠變得簡單，所以會盡可能地避開這些用不同方式表達同種意圖的情況。

根據上面的這些前提條件，我們對此做出下面的規定：當兩個局中人所做出的選擇被對方得知時，假設兩個人都選擇了「高」的叫價，或者同時選擇了「低」的叫價，此時兩個局中人手上的牌必須攤開，那麼手上擁有較強牌的局中人，將從他的對手那裡獲得a或者b的數額。假設這兩個局中人手上所擁有的牌是相等的，那麼雙方不需要進行支付。

除此之外，還有另外一種情況，當其中的一個局中人選擇了叫「高」價，而另外一個局中人選擇了叫「低」價。這時，選擇了叫「低」價的人擁有兩個選擇，即選擇「不看」或者選擇「看牌」。當另外一個局中人選擇了「不看」之後，在不考慮兩手牌的強弱的情形下，他將支付給對手低價的數額；若他選擇了「看牌」，則表示他的選擇發生了改變——由叫「低」價轉換成了叫「高」價。而對這種情況的處理方式，則與兩個局中人都選擇叫「高」價時一樣。

我們對於上面提到的簡化版的撲克博弈規則加以總結：參與博弈賽局的每個局中人，能夠通過一個「機會的著」獲得他的一「手」牌；然後，每個局中人可以通過一個「人的著」對a、b進行選擇，簡單說就是選擇叫「高」價還是叫「低」價；最後，賽局中的每個局中人都瞭解了另外一個局中人的選擇，但是他並不知道他手上的牌，即雙方都知道自己手中的一手牌以及自己的選擇。假設其中的一個局中人在博弈中選擇了叫「高」價，而另外一個局中人的選擇是叫「低」價，那麼後者將會擁有兩種選擇，即「看牌」或者「不看」。

這是一場博弈賽局的過程，當一場賽局結束時，他們的支付方式如何呢？假設兩個局中人同時選擇了叫「高」價，或者一個局中人選擇叫「高」價，而另外一個局中人選擇叫「低」價，並且在後來還選擇了「看牌」，那麼前一個局中人將從後一個局中人那裡獲得三個數額，即a、0、-a；假設兩個局中人都選擇了叫「低」價，那麼前一個局中人將從後一個局中人那裡獲得三個數額，即b、0、-b；假設另外一個局中人選擇了叫「低」價，並且在後來選擇了「不看」，那麼，「人的著」屬於選擇了叫「低」價的人。

「優勝劣汰」：二人博弈中，到底誰為魚肉？

我們暫時不對n個局中人的博弈t進行直接的研究，我們在現階段還不具備此種條件，所以先對另外兩個博弈進行思考和研究，因為它們與n個局中人的博弈有著緊密的聯絡，而且對它們的探究是我們能夠非常輕易做到的。

關於n個人的博弈t的難點在於：參與博弈賽局中的局中人1在進行選擇時，無法預測到此賽局中的局中人2會做出怎樣的策略選擇，反之亦是如此。由此一來，我們將帶有這種困難的n人博弈t與沒有這種困難的其他博弈進行簡單的比較。

首先，我們用t1表示所要研究的博弈，它與博弈t在細節上的唯一不同之處在於：當局中人2要做出自己的策略選擇時，局中人1必須已經做出了自己的策略選擇。簡單說，當局中人2進行選擇時，已經清楚了局中人1的策略選擇，這就意味著局中人1的「著」前備於局中人2的「著」。

在此博弈t1中，我們能夠非常清晰地看出，局中人1所處的地位遠遠低於他在博弈t中的地位，這種博弈賽局相對於局中人1來說是十分不利的，因此我們將博弈t1稱為博弈t的劣勢博弈。

相似的，我們重新定義另一個博弈t2，它與博弈t唯一不同的細節在於：當局中人1做出自己的策略選擇之前，局中人2必須做出自己的策略選擇，這就意味著局中人1在做出自己的選擇時已經知道了局中人2的選擇，即局中人2的「著」前備於局中人1的「著」。在這個博弈中，我們能夠明顯地發現局中人1所處的地位遠遠比原來在博弈t中的地位有利，因此，我們講博弈賽局t2是博弈賽局t的優勢博弈。

我們藉助這兩個博弈t1、t2，幫助我們達到了以下目的：從常識方面來看，對於博弈t1、t2而言，我們清楚地瞭解到了參加博弈最佳的行為方式。另一方面，我們能夠發現博弈t顯然是處在博弈t1、t2「之間」。比如，我們從局中人1的角度來看，t1相對於t而言總是不利的，但是t1總是要比t有利。嚴格意義上說，這裡的「不利」應該指的是「不利或者與其相等」，而「有利」則是指「有利或者與其相等」。

由此一來，我們可以想象博弈t中所有重要的量，t1、t2能夠幫助它們提供上、下界。事實上，我們還可以用更加嚴格的形式討論其中的問題。考慮到上界和下界之間的問題，那麼我們在很大程度上，對於博弈t的認知和了解都是不確定的。若是初看起來，很多博弈中的情況都是如此。但是我們可以利用這種技巧，找到某些新的方法，以便在最後能夠找到一套嚴謹的關於博弈t的理論，而且它能夠對所有的問題給出合理的解釋。

我們針對劣勢博弈t1進行討論，當局中人1做出了自己的策略選擇後，局中人2知道了局中人1的選擇，並做出了自己的選擇。由於局中人1先做出了選擇時，他對整個博弈的情況有了簡單的瞭解，便能夠做出對自己有利的策略選擇。

上面所講到的情況比較特殊，但是我們能夠十分清楚地看到它們之間的相互關係，這能夠幫助我們在更加複雜的情況中認識它們，而且這種方式能夠幫助我們更加準確地做出判斷。

再來考慮優勢博弈t2，t2與t1是不同的，不同之處在於局中人1和2的地位發生了轉變，即局中人2需要率先做出自己的策略選擇，在此基礎上，局中人1在清楚局中人2的策略選擇之後，才做出自己的策略選擇。在這種情形下，我們可以在博弈t1中將局中人1和2進行互換，由此一來便得到了博弈t2。

我們應該清楚博弈t1和t2之間存在著一種對稱關係，當對t1和t2的局中人進行互換之後，我們就能從一個研究跨越到另一個研究中，僅從博弈自身來看，這種t1和t2之間的互換是不具有對稱性的。實際上，正是由於局中人1和2的互換，使得博弈t1和t2發生了互換，因此，不管是局中人還是兩個博弈都發生了改變。

在此，我們應該觀察到，博弈t相對於兩個局中人1和2來說，在這兩個博弈中所處的地位都是不同的，而且有著本質的區別。對於博弈t而言，它處於t1和t2的中間地位，可以採用同樣的方式對一個博弈的局進行定義。這些只是一些具有啟發性的闡述，直到現在我們還未對博弈t做出證明，通過上述的一些簡單討論，我們逐漸將剩下的空白進行填補，針對現階段而言，我們的討論還受到一些限制，但是借用一些新的技巧就有機會解決這些困難。

國際象棋——有智還需有謀

我們已經講到過關於先現性與前備性是等價的，即具備完全情報的零和二人博弈。這種博弈被稱為具有有理性質的博弈。同時我們還證明了這種博弈是嚴格的，當任何博弈包含「機會的著」時，我們的證明依然成立，而這種事實則是無法根據「通常看法」驗證的。

國際象棋自身不具有「機會的著」，而雙陸則含有「機會的著」，但它們都屬於完全情報博弈，對於所有的這類博弈而言，我們已經討論過它們具有一個固定的、最佳的策略，只是我們用一種抽象的形式證明了它們的存在性。在大多數情況下，需要我們對它們的結構進行研究，但是它們比較複雜、冗長，還無法在實際中得到應用。

因此，我們將更加細緻地對國際象棋進行研究和考察。

最後，我們用一種簡單又不形式化的方式針對我們的討論做出總結，即所有具有完全情報的零和二人博弈都是需要嚴格確定的。說到這裡，一定會有讀者十分疑惑，究竟哪種討論不能算是一個系統的論證呢？我們需要系統地將可信的論證進行歸納，並且我們能夠對上述所有型別的博弈t的任意賽局，給出合理的答案，但是這種論證過程會遇到一些難題。事實上，我們在對博弈賽局進行討論時，沒有必要解決掉所有的困難。

一般情況下，在那些具備完全情報的博弈中，我們將採用不同的思路得到最佳的博弈的解。由此一來，便能夠讓零和二人博弈與一般情形下的差別表現得更加明瞭，這足以說明處理一般情況時，不得不採用完全不同的方法。

在零和二人博弈的對局中，我們可以假設對手的博弈行為的合理性，倘若對手的行為是不合理的，那就意味著不會給另外的局中人造成不利。事實上，參與零和二人博弈的局中人只有兩個，而且利益的和為零。在此種情形下，對手需要為自己的不合理的行為承擔損失，同時將會給另一個局中人帶去相等的收益，這樣的論據在現階段來看並不十分精準，但是我們能夠在某種程度上讓它變得更加準確，不過我們並不需要在這裡對它進行討論。

初等博弈中的特殊例子

前面我們已經討論過零和二人博弈的例子，接下來我們將對其中包含的特殊例子進行討論。而且，我們將要研究的這些特殊案例，能夠更好地幫助我們認識到所研究的理論的各個組成部分。特殊之處在於，它能夠幫助我們對理論中的某些形式化的東西進行直觀的解釋。針對那些「實際的」「心理上的」某些現象，得到較為嚴格的形式化體系，尤其是那些在通常意義上被認為不容易用嚴謹的方法進行處理的東西。

我們假設在正規的博弈中，兩個局中人所能採用的策略的數量分別為b1和b2，而且針對這兩個策略數目的大小對博弈的影響做出了簡單的統計，在這裡我們不講兩個數之一，或者二者都為一的情況。在此種情況下，其中的某個局中人對於博弈的影響並不重要，甚至可以說局中人沒有選擇的餘地。此時，這裡所講到的博弈實際上是一人博弈，而且不是零和的。所以，我們在討論這類博弈時，最簡單的方式就是讓b1和b2相等。

第二章 零和二人博弈——必然有輸有贏（第2頁，共2頁）

第二章零和二人博弈——必然有輸有贏（第2頁，共2頁）