博弈論附錄一定律-全文小說網

零和博弈

零和博弈，作為博弈論中的一個概念，又稱為零和遊戲。生活中，下棋、撲克、乒乓球等比賽都屬於零和遊戲。我們可以將博弈看作兩個人在下棋，不論是象棋還是圍棋，在絕大多數情況下，其中的參與者總會有輸有贏。假設我們提前設定好贏的一方可以獲得1分，而輸的一方自然要扣掉1分，即（-1）。在此情況下，雙方的得分便是1+（-1）=0。這便是零和博弈最通俗的概述，一方輸另一方贏，那麼整個遊戲的總成績便是0。

因此，零和博弈屬於非合作博弈。即參與博弈賽局的雙方，在嚴格遵守博弈規則的前提條件下，若是其中一方可以獲得利益，也就意味著另一方的利益必然受損。所以，博弈雙方的收益和損失之和永遠為零，即博弈雙方不存在合作的可能。

事實上，早在2000多年以前，零和遊戲便被廣泛應用於輸贏明顯的競爭或者對抗中。後來，「零和遊戲」受到了更多的關注，因為人們逐漸認識到實際生活中有很多與「零和遊戲」十分相似的局面。與之相對的便是我們經常倡導的「雙贏」，能夠在某種程度上保證雙方達成「利己」但不「損人」，並且通過雙方建立合作、有效的談判達到令雙方滿意的結果。當下，由於零和遊戲的勝利者背後隱藏著失敗者的辛酸和痛苦，所以零和博弈正逐漸被「雙贏」所取代。

其實，不論是個人，還是國家，都在這個世界中進行著一場盛大的零和博弈遊戲。零和博弈理論認為，世界是一個封閉的空間，裡面的所有機遇、財富、資源等都是有限的，當世界中的某個地區或者國家的財富或者資源增加時，也就意味著別的地區或者國家的財富或者資源在減少，這便像一種無形的掠奪。當我們對稀有資源進行大肆開採時，留給後人的就會越來越少……

雖然能夠通過有效的合作或者談判達到雙方皆大歡喜的結果，但是從零和博弈遊戲走向雙贏是一個比較複雜的過程，不僅需要參與競爭的雙方真誠合作，還需要遵守整個「戲」規則，才有可能出現雙贏的局面，若是不遵守這種規則，最後承擔風險的還是參與者自身。

重複博弈

重複博弈是博弈論中比較特殊的博弈。重複博弈，顧名思義就是將同種賽局或者結構不斷進行重複，甚至無限次進行重複，而重複博弈中的每次博弈被稱為「段博弈」簡單來說，就是參與「段博弈」的每個人都有隨時採取行動的可能性，也有可能不會同時採取實際行動。在這個過程中，前面的局中人的所有實際行為是可以被後面的參與者看到的，所以，在重複博弈的賽局中，每個局中人的行動和策略，都會不同程度地受到前面的參與者的決策的影響，甚至可以說每個局中人的選擇都會依賴其他參與者的行為。

重複博弈是「態博弈」的主要內容，一方面它包含完全資訊（即掌握了某種環境或者狀態下的全部資訊）的重複博弈，另一方面它還包含不完全資訊（即沒有掌握在某種情況或者環境下的所有資訊）的重複博弈。

事實上，當所有的博弈僅僅進行一次時，人們往往更加關心它的最終結果；假設博弈會重複進行多次，那麼人們的注意力將會變成最終的收益，甚至會捨棄眼前的利益，只為獲得更加長遠的利益，進而根據情況做出不同的策略選擇。由此一來，重複博弈的結果便會取決於博弈所進行的總次數，而這個總次數又會影響到最終博弈均衡的結果。

在一次重複博弈中所有的前提條件都是相同的，但是重複博弈脫離不了最終利益的影響，因此，在進行重複博弈的過程中，所有的參與者在進行決策時，更多的會考慮到自身的選擇是否會影響到博弈進行到最後階段的抗爭、壓力，甚至是出現惡性競爭，簡單來說就是重複博弈不能像靜態博弈那樣只考慮自身或者當前的利益，而絲毫不顧及其他博弈方的利益。某種情況下，當參與重複博弈中的一方表現出合作傾向時，其他的參與者也會在接下來的決策行動中選擇與其合作的態度，進而幫助雙方達成長期獲利的合作。

事實上，可以將重複博弈總結成三個基礎特徵：第一，在進行重複博弈的過程中並沒有「物質」上的關聯，簡言之就是上一個階段所進行的博弈，並不會改變接下來所要進行的博弈結構。第二，在進行重複博弈的每個階段，所有的參與者都能夠看到前面的參與者所做出的決策。第三，對於參與重複博弈的參與者而言，他們所獲得的收益是在每個階段所獲得收益的加權平均數。

其實，影響重複博弈最終結果的因素，主要是重複博弈所進行的次數以及資訊的完整性。在重複博弈中，所有的參與者受到長期利益和短期利益的影響，因此他們可能會優先考慮這兩者哪個收益更高，從而做出一些帶有捨棄性的決策。

重複博弈所出現的選擇的結果，清晰地解釋了實際生活中出現的現象。然而，重複博弈中資訊的完整性，能夠影響博弈的最終結果的主要原因是，當參與博弈的人自身的所有資訊都不被他人所瞭解時，那麼他能夠在整個重複博弈的過程中建立良好的聲譽，藉此他極有可能獲得長遠的利益。

囚徒困境

囚徒困境是博弈論和非零和博弈中最經典的一個例子，它表示在某種情況下，那些有利於個人利益的選擇，相對於團體而言並非有益處。簡單來說，囚徒困境就是兩個被捕的囚徒之間所進行的一場特殊博弈。當這兩個囚徒想要建立合作、互相幫助時，便能夠讓雙方獲得利益，同時想要保持這種合作也是十分困難的。這種困難看似只是一種模型，實際上在我們的生活中也有很多鮮活的例子，諸如價格的競爭、環境保護，甚至是我們所面臨的社交問題，都存在著不同程度的「囚徒困境」。

20世紀50年代，囚徒困境首次被美國的梅里爾·弗勒德和梅爾文·德雷希爾提出，並擬定了相關困境的理論。隨後，美國蘭德公司的顧問艾伯特·塔克正式用「囚徒」的形式將其表述出來，而且正式命名為「囚徒困境」。

簡言之，當兩個共謀犯同時被抓捕入獄，而且不能互相交流時，若是這兩個人互不揭發對方，便會由於無法找到確切的證據，並且根據實際情況對兩人判處同樣的罪行，假設會判刑1年。但是，若其中的一方選擇揭發對方的罪行，但是另外一方選擇沉默，法官可能會將揭發者從輕處置，或者出於揭發者提供的證據，將揭發者利益釋放，而沉默的一方則會由於不配合警方的調查、揭發者提供的確鑿資訊隨即立案，被判處10年。還有一種情況便是共謀犯互相揭發、指證，那麼便會提供完整的證據，最後雙方都判刑8年。最終的結果往往更加偏向於最後一種，即由於無法交流、互不信任，最後互相揭發。這種情況，恰好印證了約翰·納什的非合作博弈理論。

事實上，囚徒困境僅發生一次和多次的結果是不同的。假設囚徒困境是重複進行的，那麼博弈便會在其中不斷重複進行，這時所有的參與者都可以做出決策去「懲罰」前面那些不願意參與到合作中的人，在這種情況下，便會產生所有的參與者想要合作的局面。那些參與此次重複博弈的人，便會主動放棄自身欺騙的動機或者行為，導致所有的參與者的決策都向合作靠攏，最終經過反覆博弈後，所有的參與者極有可能從最初的互相猜忌轉變為相互信任。

在囚徒困境中，所有的囚徒雖然選擇了合作，而且不會向警察或者法官說出事實，還能為其他人帶來利益，讓所有人都無罪。但是當對方的合作意圖並不是非常明顯，或者無法確認時，出賣自己的同夥便能夠讓自己減刑或者立即釋放，而且同夥可能也會為了自身的利益而招供出自己，在這種情況下，出賣自己的同夥是能夠讓自身的利益最大化的。

現實中，那些執法機構並不會用這種博弈的形式誘導罪犯說出作案的資訊，主要是由於罪犯不僅會考慮自身的利益，他們還會考慮其他的因素，比如揭發對方之後，很有可能會遭到不同形式的報復，而且他們無法將那些執法者所設定的利益作為自己是否揭發對方的考量標準。

智豬博弈

智豬博弈是納什理論中的一個經典例子，它是在20世紀50年代由約翰·納什提出的。若一個豬圈裡有一頭大豬，還有一頭小豬，在豬圈的一邊有一個投放飼料的豬槽，與豬槽相對的另外一邊則安放著一個可以控制豬槽投食量的按鈕，假設我們按一下這個投食按鈕，豬槽內便會出現10個單位的豬食，但是想要按這個按鈕，則需要拿出2個單位的豬食作為成本。在此種情況下，假設大豬先走到豬槽邊，它跟小豬的進食量之比為9:1；假設大豬和小豬同時到達豬槽，它們的進食量之比則為7:3；若是小豬先走到豬槽，那麼它們的進食量之比則為6:4。最後，若是兩頭豬都非常有智慧，那麼小豬便會在豬槽邊等待著。

其實，小豬選擇在豬槽邊等待，讓大豬去按下食物投放按鈕的答案一目瞭然。即當大豬去按下按鈕時，小豬在豬槽邊會獲得4個單位的豬食，當大豬走到豬槽邊時看似還有6個單位的豬食，實際上扣除按按鈕所需要的2個單位的豬食，大豬最終得到的只有4個單位的豬食；若是小豬和大豬同時出發，同時到達豬槽，那麼它們所獲得豬食的比例為1:5。

若是小豬選擇按投食開關，大豬在豬槽邊等待，那麼當小豬達到豬槽邊時，大豬已經吃下了9個單位的豬食，小豬隻能獲得一個單位的豬食，所以小豬最終的收益明顯小於它選擇行動的成本，這樣計算得出小豬最後的淨收益為（-1）單位的豬食。假設大豬也選擇在豬槽邊等待，那麼小豬的純收益將為0，而且小豬選擇等待的成本也是0。由此看來，不論大豬是選擇主動行動還是等待，小豬都選擇等待的收益要高於選擇行動所獲得的利益，這便是小豬在此次博弈中的佔優策略。

我們可以將小豬的這種方法稱為「坐船」，或者「搭便車」，暗示人們在某些情況下，若是選擇注意等待時機，將是一種明智之舉，即，不為才能有所為。

智豬博弈告訴人們，當在博弈賽局中處於弱勢的一方時，應該學會選擇這種等待的佔優策略。不論是在競爭中，還是博弈中，參與的雙方都在絞盡腦汁讓自己獲得最大的收益，但是這也暴露了一個問題，假設對方與你具有同樣的理性和智慧，那麼他是否會選擇和你同樣的做法呢？其實，博弈就是一場鬥智鬥勇的競爭。

鬥雞博弈

鬥雞博弈（chickengame）這個名詞其實是一種翻譯失誤的產物，在美國口語中chicken的釋義代表了「懦夫」，因此，它應該是「懦夫博弈」，但是這種音譯的失誤並不影響我們對它的理解。

假設我們設定一個情景，即兩個人狹路相逢。若是其中的一人想要主動行動，攻擊對方，而另外一方則選擇後退讓路，在這種情況下，選擇主動行動的一方便會獲得勝利，即獲得最大的收益。若是雙方都選擇退讓，那麼可以稱為平局；若是自己一直主動出擊，但是對方選擇了退讓，那麼最後的獲勝者就是自己，對方則成為失敗的一方。還有一種情況就是，雙方都選擇前進，結果便是兩敗俱傷。相較這些不同的選擇來看，最好的結果便是雙方都選擇退讓，既不會兩敗俱傷，又不會讓其中的某一方丟了顏面。

事實上，在這個博弈中，參與博弈的雙方都是平等的主體，假設雙方都選擇主動行動，便相當於通知對方自身已經處在給對方最後的通牒，甚至可以說是相互威脅的狀態。此博弈包含了兩個純策略的納什均衡原理，即其中的一方選擇主動前進，另一方則會後退；或者其中的一方選擇後退，而另一方主動前進。只是在這兩種決策中，我們不清楚哪一方會選擇進或者退，簡言之，雙方的選擇都是隨機的，其中的所有選擇背後的風險都是無法預料的。

其實，鬥雞博弈除了純策略外，還包含混合策略均衡，即參與者的所有選擇都是隨機的，可能是進，也可能是退。但是，我們對於這類博弈更加關注它的純策略均衡。任何一個博弈，若只有一個納什均衡點，那麼我們便能夠輕易地預測出此博弈的結果，因為這個納什均衡點就是已知的博弈的結果。反之，當一個博弈有多個納什均衡點時，想要對博弈的結果做出預測，便需要我們瞭解其中的所有細節資訊，諸如參與者究竟是哪一方選擇了進，哪一方選擇了退。根據這些額外的資訊，我們才能對博弈結果做出判斷。

獵鹿博弈

獵鹿博弈，最早出現在法國啟蒙思想家盧梭的《論人類不平等的起源和基礎》一書中，它又稱為安全博弈、協調博弈，或者獵鹿模型。

獵鹿博弈源自一則故事，即在古代的一座村莊裡，住著兩個獵人。而這個村子裡主要有兩種獵物：鹿和兔子。假設一個獵人單獨外出捕獵，只能捕到4只兔子；然而，如果兩個獵人同時出動且合作就能捕到1只鹿。而站在填飽肚子的角度看，他所捕到的這4只兔子能夠成為他4天的食物，但是1只鹿足以讓他在10天內都不用外出捕獵。

由此一來，這兩個獵人的行動策略就會產生兩種博弈結局：第一種就是單獨行動，不建立合作，那麼每個人可以獲得4只兔子；第二種是建立合作，共同外出捕鹿，則會獲得1只鹿，保證兩個獵人10天不用外出捕獵。因此，在這兩種情況下便會出現兩個納什均衡點，即兩個獵人單獨行動，每個人獲得4只兔子，並且每人能夠吃飽4天；或者兩個獵人建立合作，那麼每個人可以吃飽10天。

顯而易見，兩個獵人建立合作獲得的最終收益遠遠超過單獨行動的利益，但是這便需要兩個獵人在合作的過程中，個人的能力和付出是相等的。假設兩個人中的任何一個人捕獵能力較強，那麼他便會要求分得更多的利益，同時這會使另外一個獵人考慮到自身的利益，而不願意參加合作。雖然我們都非常清楚合作雙贏的目標，但是考慮到實際情況時，原因便十分明顯了。若想在博弈中建立合作，便需要參與博弈的雙方主動學會與對手建立良好的共贏關係，在保證自身利益的同時，也要考慮對方的利益。

簡單概括一下獵鹿模型，當這兩個獵人中的任何一個人有足夠的信心確定對方一定會捕捉鹿時，那麼最好的捕獵策略就是去捕捉鹿，在這種情形下沒有任何理由去捕捉兔子。除非這個獵人沒有足夠的信心，不確定另一個人的做法。這就是信心博弈，但是兩個獵人都會面臨極大的信任危機。所以便會出現兩個納什均衡點，簡單來說就是兩種不同的結果，而這種結果無法用納什均衡點進行衡量。

蜈蚣博弈

蜈蚣博弈的提出者是羅森塞爾，它指的是這樣一個簡單的博弈，即參與博弈的兩個人，分別命名為a和b，提供給他們的策略只有建立「合作」，或者拒絕「合作」（或者稱為背叛）這兩種可供選擇的策略。若我們令a先做出選擇，然後再由b做出選擇，再輪到a做出選擇……由此迴圈往復。我們設定a與b之間的博弈次數是有限的，即100次。假設此次博弈雙方的支付給定如下：

合作合作合作合作……合作合作

ababab（100，100）

合作合作合作合作……合作不合作

ababab（98，101）

那麼，在此前提條件下，a與b又會做出何種決策呢？

其實，正是因為這個博弈的形狀像極了蜈蚣，所以才被稱為蜈蚣博弈。

通過這個策略選擇圖，我們能夠發現蜈蚣博弈有一個極為特殊的地方：參與者a在進行決策時，他會考慮到此次決策的最後一次選擇，即第100次選擇；但是參與者b在進行決策時，會考慮第100次選擇究竟是合作還是不合作，假設b選擇合作那麼他將獲得100的收益，若是他選擇不合作，則會帶給他101的收益。

在這種情況下，即根據理性人的假定結果，b會選擇不合作。但是從此次博弈的次數和順序來看，是需要經過第99次選擇，才是b進行第100次選擇，若是a在第99次選擇中，考慮到b有可能會選擇不合作的情況，那麼他的收益將會是98，而且小於b在選擇合作時的收益，此時當博弈進行到第99次時，a的最優決策是選擇不合作，因為這樣的選擇能夠讓他獲得99的收益，要比選擇合作時的收益高……

按照這種決策的選擇情況進行推斷，可以得出若是在進行博弈的第一步時a便選擇了不合作，那麼a和b所獲得的最終收益都是1，這樣的選擇遠遠小於a選擇合作時的收益。

酒吧博弈

酒吧博弈是在博弈論的基礎上發展起來的一個博弈理論模型，簡單來說這個理論模型如下。

假設有100個人都喜歡去酒吧消遣娛樂，而酒吧的座位是有限的，這就說明這100個人在週末時都會考慮究竟是去酒吧還是待在家中，假設所有的人都選擇週末去酒吧，那麼去酒吧的人就會感到不舒服，而這時他們會覺得待在家中要比去酒吧更好。若我們設定酒吧的座位數是60，恰好在週末的時候酒吧座無虛席，那麼想要去酒吧的人便會有兩種決策：一種是不去，待在家中，另外一種是去。那麼，這100個喜歡去酒吧的人最終將會做何選擇呢？

其實這些喜歡去酒吧的人，往往會受上一次酒吧人數的影響，進而產生一些人數上的浮動，久而久之便會形成一種持續性波動的情況。這是由切斯特·艾倫·阿瑟博士提出的，他的理論如下：

假設每個想要去酒吧的人都是理性的，那麼酒吧每天接待的人數幾乎不會有過大的浮動。但是每個人都不是理性的。

後來，人們在他的這種研究之上發現了「神奇的60%客滿率」定理，即當人們選擇去酒吧時，最初的觀察結果並未找到任何規律，但是通過長時間的觀察發現，每次去酒吧的人數和不去酒吧的人數之比接近60:40。儘管這些人中的任何一個人都不能歸屬到經常去或者不去的行列中，但是不論這些人是否去，去酒吧的人數整體的比例基本上是保持不變的。但是人並不總能保持理性，當人們在第一次去酒吧時，若發現酒吧人數非常多，那麼這種現象會成為他們下次選擇的一個參考，他們會認為酒吧人數太多、十分擁擠、喧鬧，但是少數人可能會選擇去酒吧，這時他們發現酒吧的人數並不多，然後便會在下一次叫上自己的朋友一起去酒吧，由此一來迴圈便正式開始了。

從心理學的角度來看，最初去酒吧的那些人可能互相不熟悉，但是由於經常去酒吧而且能夠遇見對方，久而久之便會由陌生人變成朋友，那麼在這種情況下，便會由零散的個體變成一個大的群體，而這個整體中又會分支出小團體，而且這些小團體中的人，有一部分會佔據主導地位，另一部分人會處在服從地位。這就意味著團體中的每個人的決策都會受到他人的影響。

附錄一 定律（第1頁，共2頁）

附錄一定律（第1頁，共2頁）