查看《博弈論》小說信息

第二章 零和二人博弈——必然有輸有贏(第1頁,共2頁)

字體:

日常生活中,我們經常會陷入選擇兩難的困境,有時認為甲比較不錯,有時又認為乙也令人滿意。那麼,我們對此應該做何選擇呢?有些事情決策失誤後還有重新選擇的機會,但是有些事情一旦決策失誤就會面臨無法改變的狀況。如何才能讓自己做出正確的決策,遠離痛苦和後悔的深淵呢?我們每個人都需要一種更好的選擇方法,那就是博弈。

我們需要重視任何一次博弈,並且能充分地從歷史資料和研究中掌握博弈的規則和理論,以此提升我們的博弈理論水平以及策略選擇能力,更好地面對社會中重要的抉擇。其實人生就是一場永無止境的博弈,我們需要學會在博弈中生存,與他人友好相處,以及學會適應和使用世界上的其他法則,在這個過程中更好地為自己做出選擇。

一人博弈:一場「鬥智」之戰

前面的介紹與分析讓我們瞭解到對於博弈的形式化的描述,也瞭解到了博弈策略的雛形,這讓我們能夠用簡單、直觀的形式對複雜的博弈做出清晰的概述。透過一些簡單的博弈,讓我們看到了前者與後者之間的等價關係。為了方便研究和討論,我們還會用另外比較簡單的方式給它們命名,我們將這些不同的命名方式稱為廣闊和正規化的不同形式。

我們對其的命名方式是完全等價的,我們可以按照在實際情況中較為方便的形式給它們不同的名稱,而且這樣的做法並不會影響到我們對其討論的正確性和一般性。

事實上,那些非常正規化的形式更加適合於我們推匯出博弈的一般定理,但是對於其中比較特殊的情況,還需要我們運用更加靈活多變、廣闊的形式。換言之,正規化的方式能夠幫助我們建立關於博弈所共有的性質,但是後者能夠更加直觀清楚地告訴我們不同的博弈之間性質的差別,以及如何解決這些博弈所出現的結構性差異。

我們已經對博弈進行了較為完整的描述,那麼接下來就需要對此建立正面的理論。我們可以試著想象,若要建立這一理論,需要我們從簡單的博弈逐漸過渡到複雜的博弈,這就意味著我們將按照其難度、複雜程度的遞增次序對其進行討論和研究。

我們可以根據參與博弈賽局的參加者數量對其進行劃分,即由n個參與者參加的博弈屬於n人博弈,同時,這也根據博弈是否為零和進行分類。由此一來,需要我們區分開零和n人博弈與一般n人博弈。

首先,我們對一人博弈做出說明。在正規化的形式中,我們能夠看到一人博弈的組成是隨機選擇一個數,博弈中的唯一的局中人將會得到對應的結果。此時,我們能夠非常明瞭地看出,零和的博弈中是一種空無一物的狀態,那麼我們便不需要對它再做出任何說明。

其實,我們能夠用一種極其簡單化的形式對一人博弈做出描述,假設我們用a表示博弈中變化的量,但它所表示的東西,並不只是在一個「著」中,而是代表了局中人的策略,它意味著在一個博弈賽局中所有可能出現的情況。同時,它也代表了這個局中人應對這些情況的所有策略和一套完整的「理論」。

此時,我們需要明白,即使一個人的博弈,可能出現的所有形式也可能是錯綜複雜的。簡單地說,它有可能同時包括「機會的著」「人的著」,而且這些都屬於同一個局中人,甚至每一種可能出現的「著」都包含著各種不同的走法。同時在出現任何一個「人的著」時,可以參照局中人掌握的情報資訊,也可以根據提前設定的方案應對出現的情況。

我們可以列舉出很多單人獨玩的遊戲,它們的表現形式複雜多變,而且十分細緻,但是有一種非常重要的情況——我們所進行的單人獨玩的遊戲中沒有滲透出上述的情形,而這正是不完全情報的一種體現。簡言之,在同一局博弈中,唯一的局中人的不同的「人的著」中,具備先現性與前備性等價的情況的要求是:唯一的局中人有兩個「人的著」,即a和b,在進行每個「著」時,局中人並不知道另一個「著」的選擇結果,在情報不完整的情況下這種情況是難以實現的。

但是我們前面講到過,可以通過把局中人拆分成兩個或者多個具有相同利害關係,同時在情報交換方面是不完全的人,便能夠實現先現性和前備性等價的情況。我們可以通過橋牌博弈的例子構造出類似於一人博弈的情形,只是單人遊戲的多種形式都不屬於這種博弈型別。還有一些雙重單人遊戲的規則是在兩個參與者之間進行的競爭,它屬於二人博弈的範疇。

這些情形在實際生活中有一定的意義,諸如一些分配方案的決策,當互相交換已經不存在時,且只有一個機構能夠轉嫁社會產品,那麼所有的社會成員的利益關係是一致的。需要注意的是,在這種情況下,我們不能將每位成員都看作博弈的局中人,主要原因是在成員之間不存在利害關係,更不可能出現某些成員聯手對付其他成員的情況。因此,我們需要將這個機構看成一個一人博弈,只是在這些社會成員之間存在著不同的聯絡,這就意味著其中可能會出現不同的不完全情報。

在這種嚴謹的分配方案的例子中,我們很難對此種分配方案自身進行鑑定,因此我們可以將分配方案與博弈規則聯絡起來。由於博弈的規則是絕對的、不容侵犯的、不接受批評的,我們可以通過對博弈策略的瞭解,簡單地解決博弈規則內的方案分配問題。

「偷雞」:「虛張聲勢」促成功

配銅錢、石頭剪刀布等博弈相對簡單,而且它們之間的廣闊形式和正規化並無本質性的差別。但是,接下來我們所要講到的是一種形式更加廣闊的博弈,因為這些博弈中的局中人有若干個「著」,這就意味著在這些博弈中,廣闊的形式和正規化的過渡之間變得更加豐滿而有意義。

我們會對撲克中的博弈進行嚴格的討論,而實際過程中的撲克相對複雜,但是我們又想進行極其細緻的討論。在此種情況下,可以對其進行一些簡化處理,甚至是進行一些根本性的改變,方便我們對其中的博弈情況進行研究。基於此,我們對撲克的所有修改都會保留其最初的基本性質和觀念。

實際上,撲克可以由任意人數參與,但是我們所要研究的是零和二人博弈,因此我們將參與撲克的人數規定為兩人。

進行撲克博弈之前,我們將從所有的牌中拿出5張撲克牌給賽局中的每個人,在此種情況下,每個人所獲得撲克牌的組合會有2598960種,這種情況下,我們將其稱為一「手」牌。此時,每個人將自己所獲得的撲克牌按照從大到小的順序進行排列,按照我們的前提規定,即每個人一「手」牌的大小對應的是撲克牌的強弱。

其實,撲克牌在實際的玩法中有很多種,或者可以說它有多種變形,我們可以將是否換牌作為區分其是何種博弈的參照點,即「換牌」博弈與「不換牌」博弈兩種。

在「換牌」博弈中,參與賽局的局中人可以換掉自己手上的某張撲克牌,或者換掉手上的所有撲克牌,而且這種換牌的方式是「千奇百怪」的。在某些換牌變形中,局中人手中的一「手」牌,往往是在同一賽局中相繼獲得的。相對來說「不換牌」博弈相對簡單,即在同一賽局中,必須保證自己手上的撲克牌不發生變化。因此,我們為了在研究過程中偏向簡單,所以只研究「不換牌」博弈。

在「不換牌」博弈中,賽局中的參與者便不需要將一「手」牌作為一手牌,這裡所說的一手牌指的是局中人所獲得的撲克牌的組合。假設我們令局中人所獲得的撲克牌的總數為s,每個人所獲得的撲克牌數為s。由於前面已經提到在博弈中如果使用全副牌,那麼每個局中人手中的撲克牌的組合為s=2598960。由於發牌是按照一定的規則進行的,所以每個人獲得撲克牌的可能性是相同的,那麼從全副牌中隨便抽取一張撲克牌的數作為s,而s便是賽局中的「機會的著」,而且兩個局中人獲得其中可能的值的機率是相同的。因此,「不換牌」博弈便由「有機會的著」開始了,我們將參與博弈的局中人分別命名為甲和乙,而給他們抽取的撲克牌數為甲1和乙2。

上述為撲克博弈的第一個階段,通常情況下撲克博弈進行到第二階段時,便需要賽局中的參與者進行「叫價」。所謂「叫價」,指的是兩個參與者需要下賭注,而這個賭注有大有小,完全取決於局中人自己的決策。一般情況下,當其中的一個局中人「叫價」之後,另一個局中人會有三種選擇,即「看牌」「不看牌」「加叫」。

「看牌」指的是這個局中人接受了第一個局中人的「叫價」,他需要將自己手上的撲克牌全部攤開,與「叫價」的局中人的撲克牌進行比較,最後兩個局中人手上擁有較強的一「手」牌的局中人獲勝,而且能夠獲得此次「叫價」的收益,並且結束此局博弈。

「不看牌」指的是,局中人願意接受他在前一局中最後一次的「叫價」,而且他所接受的這個金額要比現在的數額低,而且兩個參與者都沒有其他的異議,此時,兩個局中人便不會在意各自手上握有怎樣的牌,因為他們手上的牌無須全部攤開。

「加叫」指的是,對方能夠給出「叫價」者更多的叫價,以此還擊「叫價」者給出的叫價,那麼在這種情況下,兩個局中人的地位便會發生反轉,即前面「叫價」的局中人此時便會有三種選擇:「不看牌」「看牌」「加價」。其餘的對局,便以此類推。

但是,在進行撲克博弈的對局中,若是參與者中的一方手上握有強牌,那麼他有極大的叫高價的可能性,而且會根據情況進行不少加叫,主要是因為他有足夠的信心覺得自己能夠在賽局中獲勝。這就說明在他進行加叫或者叫高價的過程中,向他的對手釋放了一個資訊,即他的對手可以假設他手上握有強牌,那麼對手在這種情況下,極有可能在進行決策時會選擇「不看牌」。這也意味著,雙方在「不看牌」的決策下,無法對雙方的撲克牌進行對比。此時,若是手上的牌是弱牌的一方,他便可以選擇加價或者叫高價,進而引起對手不看牌,以此達到一種自己手上握有強牌的假象,利用這種方式極有可能用手上的弱牌贏過對方手上的強牌。

在撲克博弈中,這種現象被稱為「偷雞」。顯而易見,這種策略大都是在撲克博弈中有經驗的參與者才經常使用的方法,但是對於上面的分析一定會有人產生異議,這種研究是否是「偷雞」的真實原因呢?

其實,我們對此還有更容易理解的解釋:當進行撲克博弈時,假設我們都知道其中的一個局中人手上握有強牌,他便會做出叫高價的行為;此時,面對這種情況,他的對手極有可能選擇「不看牌」。因此,手上握有強牌的一方便不能再繼續叫高價或者多加叫,正是出於此,他手中的牌才能夠幫助他贏得此局博弈。所以,他在這種情況下,儘量不能讓對手得知自己的真實情況,反過來說,他需要傳遞給對手的資訊是自己手上握有弱牌,但是還在叫高價。

通過上面的分析,我們能夠清晰地發現,撲克博弈中的「偷雞」其實包含兩種可能存在的動機:一種是其中的一個局中人手上握有弱牌,但是想要給對手營造出一種手上握有強牌的假象,進而混淆對方的決策。另一種是其中的一個局中人手上的確握有強牌,卻要製造出一種自己手上其實是弱牌的假象。這兩種動機都是為了向自己的對手傳遞出反面的訊號,給對手的決策造成干擾,進而增大自己在博弈中獲勝的可能性。

關於這兩種動機是否能夠獲得更高的收益,還取決於對手最終的決策。比如在第一種情況下,若想真的「偷雞」成功,需要對手真正選擇「不看牌」,才能獲得最終意義上的成功。而對於第二種情況來說,其中的一個局中人在對手選擇「看牌」策略時,便能成功給對方製造混亂情報,最後獲得此局博弈的勝利。

事實上,採用這種反方向的策略帶有一定的風險性,由於其中的一個局中人無法判斷出對手是否會順著自己的方向走,所以這種「叫價」的方式自身具有冒險性。

假設使用了不正確的「偷雞」法,便會偏離好策略,最後導致局中人利益受損。在這種情況下,對手只需要選擇堅持一個正確的策略就可以了。當對手選擇了一個完美的策略後,即使不正確的「偷雞」法,也不會給局中人造成損失。但是,當對手在博弈賽局中逐漸偏離完美的策略後,便會給前面的賽局中的局中人造成損失。

這就告訴我們,若想成功地「偷雞」,其實並不需要在博弈中遇到一個實力相當的對手,而是在於對手是否會在博弈賽局中偏離完美的策略,同時,「偷雞」對這種情況是有所防備的。

通過上述描述,我們清楚地發現,撲克的此種變形所擁有的完美策略並非一成不變或者最佳的,所以在這種情況中,永久最優的策略是不存在的,而且「偷雞」其實是在博弈中的一種具有防禦性的措施。

你真的會打撲克嗎?——「叫價」的藝術

我們在前面的研究中多次強調指出,讓博弈中的兩個局中人的策略選擇相等,是零和二人博弈中最簡單的一種方式。在這種博弈中,局中人的策略選擇被稱為純策略。事實上我們不應該用這個名稱,用「著」來表示似乎並沒有顯得太誇張。而且,在上面已經講到的問題中,它們之間存在的廣闊形式和正規化之間似乎沒有任何明顯的區別。因此,在這些型別的博弈中,我們會將「著」和策略等同起來,而這些原本就屬於正規化的形式特徵。但是我們現在將對一個廣闊形式的博弈進行探究,這類博弈中的局中人有若干個「著」,而且這些「著」能夠更直觀地向正規化的形式和策略進行過渡。

撲克本身具有很多規則,正是這些技術性的規則才避免了賽局中的局中人進行無限次的加叫,保證叫價的次數是有限的。參與撲克博弈的雙方,都會自動避免不現實的叫高價,為了避免對手在叫價的過程中出現超人意料的叫價,所以在每局博弈中,都規定了一個最高叫價的數值。除此之外,還規定不能出現過小的叫價,這種規定保證了博弈順利進行。

小說目錄