策略博弈論,我們通常將它稱為博弈論,有些時候也會用「競賽論」或者「對策論」來表示。但是,只有博弈論更符合原意,因為它能夠更好地表達出此理論所要探究的基本概念和相關問題,同時,它也是在最近十幾年間逐漸發展起來的、運籌學的主要組成部分,本書是博理博弈論的經典著作。
馮·諾依曼的這本思想史上的經典之作已經問世近70年之久。這本《博弈論》不僅是成千上萬讀者的精神食糧,還支撐著馮·諾依曼之後的研究者。與此同時,《博弈論》還直接推動了個人機率、統計決策、運籌學等諸多問題的研究程式。實際上,這本經典著作在各個領域都產生了一定的影響。
為了讓讀者能夠更加直觀地看到博弈中的邏輯推理,馮·諾依曼先構造出一個概念,其包含了所有參與者的策略選擇。通俗意義上說,一個參與者的一個策略選擇就是一套簡單的行動法則,是提供給這個參與者所有可能情況下的行動指導。假設任意一名參與者需要遵循給定的各種策略,那麼博弈的整個過程可以說是已知的,顯而易見所有參與博弈的人在博弈結束時,能夠獲得的收益其實是確定的。
按照作者馮·諾依曼的觀點,博弈論的方法是最適合研究經濟問題的數學方法。儘管博弈論的提出沒能幫助作者完成解決經濟問題的任務,但這一數學理論的提出與建立仍然是具有里程碑意義的。因為博弈論研究的是鬥爭,在無數鬥爭的場景中,都有可能通過使用博弈論來解決相關的技術問題。例如人對自然財富的索取,人對自然災害的抵抗,人對於未知領域的探索,以及軍事上的鬥爭等等。博弈論可以使人們在有限的條件和既定的要求下,從繁多的數量關係裡尋找出最適宜、最高效的解決方案。
馮·諾依曼創作《博弈論》的初衷是推動經濟學理論的革命,但是他在很長一段時間內沒有完成這個偉大的目標。不過,在他的影響下,人們開始了對整個時代經濟學理論的質疑。從這一方面來看,《博弈論》確實是天才之作,必將被世人永遠銘記。
經濟學在未來是什麼樣子的?在《博弈論》中已經有了回答:它必將是充滿數學符號的。對不少人來說,《博弈論》更像一部希臘文著作,只有當我們理解它超過理解一種文化時,我們才能真正讀懂它。或者,如果說《博弈論》是貝多芬的一部樂曲,那麼還需要懂樂譜的人才能理解它。《博弈論》中最好的工具是數學,如果有人對數學一無所知,那麼他很難進入現代科學的大門,或邁入現代哲學的世界,這無疑是令人遺憾的。數學不同於街頭俗論,它體現著許多方面的思維能力。一般來說,擁有數學潛力的孩子往往具有更好的語言和邏輯能力。
馮·諾依曼在《博弈論》中對多人博弈和個體最大化問題進行了區分,並指出了兩者的主要差異。例如,研究一個典型的最大化問題:如何用周長1英里的籬笆圍出最大的面積?對於這個問題,我們只需要利用代數或微積分知識便可給出答案。若縮小範圍,只允許在三角形中做選擇,那麼等邊三角形要比其他三角形更優。若只允許在四邊形中做選擇,那麼正方形是最佳的答案。若在所有正多邊形中做選擇,那麼邊數越多越接近最優解。如果沒有邊數限制,用周長1英里的籬笆圍出最大的面積,圓形無疑是最佳選擇。
在多人博弈中,比如當兩個理性頭腦為了一個目標產生衝突的時候,最終的答案總是會同時依賴於兩者的決定,所以這時的形勢與個人最大化問題的形勢便不再相同。兩個人一起玩井字棋時,如果甲方先行,且行棋方式完全正確,那麼乙方將永遠無法擊敗他;同樣,若乙方先行,且行棋方式完全正確,那麼甲方也永遠無法擊敗他。這種博弈的方式是隨機的,它的解也是隨機的。
如果兩個人一起玩向圓桌上放硬幣的遊戲:雙方輪流向桌子上放硬幣,率先放不下硬幣的人就算失敗。在這個博弈中,若a是先行者,他便可以用這樣的策略獲勝,即首先將一枚硬幣放在桌子的正中央,接著每當對方放下一枚硬幣,就在與之對稱的位置上放上一枚硬幣,這樣一來,他便永遠不會輸,誰後放誰就會輸。這是一個完美的資訊博弈,只要知道誰先誰後就能知道誰贏誰輸。
同樣,象棋也是一個完美資訊博弈,它與上面兩種博弈一樣簡單。若兩個計算能力相當的人一起下象棋,那麼只會有三種可能:一是先行者必勝,二是後行者必勝,三是平局。初看之下,我們並不知道最終的結局究竟屬於哪一個,但只要我們反向推導,就能推算出這一博弈結局與開始資訊的關係。象棋的這種簡單屬性可由博弈論予以證明。
在大多數人看來,猜硬幣與下象棋一樣都是簡單的博弈。但實際上,猜硬幣並非人們想象的那樣簡單。如果一個人要想與另一個人保持一樣,他就會在對方選擇正面時跟著選擇正面,在對方選擇背面時跟著選擇背面。但是,如果他一開始就知道對方準備選擇正面,好勝心就會驅使他去選擇背面,而若對方選擇的是背面,他就會毅然選擇正面。這就形成了一個無法跳出的迴圈。
約翰·馮·諾依曼在處理這個無限迴圈問題時表現出了自己的天賦。在他看來,不讓別人知道你的秘密的前提是,你自己也不知道;在投擲硬幣的時候,你只需要以正反面來決定你的行動,這樣一來,在這個隨意策略中,即使你的對手始終保持著理性,並能提前知曉你的策略,他也不可能以超過半數的機率戰勝你。
約翰·馮·諾依曼給我們呈現的是一個二人零和博弈。他用這個經典的博弈向我們證明了他的理論:參與這個零和博弈的人都試圖使自己的利益最大化,於是他們都想盡可能地使對方的利益最小化,因為只有這樣才能最大化自己的利益。
要判斷一條鐵鏈的強度,我們首先要知道它最弱的一環,要判斷一個木桶能盛多少水,首先要知道它的短板在哪裡。在最壞的情況下,最可能獲得的收益取決於最脆弱的一點。這個時候,參與者只需採用一種隨機策略,就能在最壞的情況下最大化自己的收益。這一意義深遠的定理可以在撲克牌遊戲中顯露其冰山一角:我們在玩撲克牌時常常會見到虛張聲勢的對手,甚至我們自己有時為了贏得最後的勝利,也會採取虛張聲勢的策略。我們發現一旦有人虛張聲勢就意味著他可能有一手差牌,而那些不動聲色的人則很可能拿到一手好牌。如果你的對手為了最大化自己的收益採取了隨機策略,那麼你在面對這樣的對手時有一個最優的虛張聲勢率可以確保使你的利益最大化。這種情況也出現在考試中,一個老師在為學生出考試題時會隨機從教科書中抽取內容,這樣一來,學生就需要複習整本教科書才能保證自己考到最優的分數。
《博弈論》一書既包含了對博弈數學理論的細緻說明,又包含了該理論多方面的應用與實踐。博弈數學理論於1928年開始發展和出版,它主要應用於博弈本身以及經濟學和社會學問題。約翰·馮·諾依曼也希望用數學方法來研究這些問題。
對馮·諾依曼來說,博弈論的最終歸宿應該在經濟學和社會學上。他從一些簡單博弈問題入手,深入淺出地闡述了這個理論,儘管這些問題不如實際問題複雜,但它們都具有根本性和代表性。利用它們可以進一步證明:不管是平行利益問題和相反利益問題、完全資訊問題和不完全資訊問題,還是自由合理的決定、機會影響問題等等,都能夠用一個精確的方法解決。