博弈論導讀-全文小說網

什麼是博弈論？

在現實生活中，我們常常會用數學來解決經濟學問題。這種嘗試雖然很頻繁，但至今還沒有完全取得成功。之所以會出現這樣的現象，是因為人們照搬了物理學的方法來實施這種嘗試，而這些物理學方法主要是針對一個系統建立導數方程，並通過導數方程來預測該系統未來可能發生的情況。但是，約翰·馮·諾依曼在《博弈論》中所使用的方法與之卻有著天壤之別。約翰·馮·諾依曼沒有把經濟生活看作一個已知系統，而是將其看作一種由多人參與的博弈。在這種博弈中，參與者需要遵循一定的規則，並試圖讓自身的利益最大化。約翰·馮·諾依曼研究了參與者的多種可能的行為型別，這些行為既能保障相應參與者的利益最大化，又符合整個博弈的規則。

我們無論在什麼情況下對問題進行數學分析，都需要率先用一套公理體系對問題進行數學語言描述。因此，擁有一套完整的公理體系是數學分析的前提。若沒有這套公理體系，我們便不能用邏輯推理獲得結論。在使用這套公理體系的過程中，人們不用時刻考慮數學表示式對應的現實事物，只需要在邏輯推理的終點將數學符號還原為現實事物。也就是說，這裡的每一種數學符號都有其現實意義，但在邏輯推理過程中不需要考慮它們對應的現實意義，只需在得出結論之後再把結論反映為現實事物，這樣就能實現這一邏輯推理的價值。約翰·馮·諾依曼根據這一思路對博弈的概念進行了數學公理描述，在此之後，《博弈論》便不用再研究實際生活中的事物，而是成為忠於一種數學形式的理論。不過，實際的博弈順序仍然是約翰·馮·諾依曼理論的基礎，正是受到這些博弈的啟發，他才能順利展開其理論過程。另一方面，讀者即使不知道實際博弈的情況，他們也可能明白整個邏輯推理的過程，儘管這對不擅長數學的人來說有些困難。

《博弈論》中首先要構造的概念是個體的策略，具體來說，就是任何參與博弈的人都會採用的策略。在博弈的過程中，參與者勢必會有一套屬於自己的策略，這個策略也是他所要遵循的行動法則。參與者在任何情況下的行動都要依據這套策略的相關要求，若每個參與者都遵循各自的策略，博弈的過程就被理所當然地確定了，因為參與者最後的收益是已知的。不過，無論採用哪種策略，參與者只能控制自己的選擇，而不能決定對手的選擇。這就引出一個重要的問題，即每一名參與者在不瞭解其他參與者做何選擇的情況下，如何選擇策略才能使自身利益最大化？

這個問題在零和博弈中得到了解決。零和博弈的特點在於參與者只有兩人，且一方獲得的利益恰好等於另一方失去的利益，或者說一方勝利，另一方註定失敗。馮·諾依曼在這種資訊完美的博弈中證明了每一個參與者都可能擁有一個最優策略。這意味著博弈中存在兩種可能，即兩名參與者中的一個必定擁有取勝的策略，或者每一參與者不會獲得比平局更壞結果的策略。當然，這些情況僅限於資訊完美的博弈，如果在資訊不完美的博弈中，情況就不會如此簡單了。不過，馮·諾依曼仍然找到了解決辦法，他在兩人零和博弈中引入了混合策略這一概念，成功解決了這個問題。採用混合策略就意味著要按照一定機率施行不同的純策略。若合適的混合策略能確保先行者獲得的收益不低於1，那麼後行者便能阻止先行者獲得超過1的收益。通過引入混合策略，兩人零和博弈的問題就能全部解決了。

馮·諾依曼並不滿足於對兩人博弈的研究，他接著又進入了超過兩人的多人博弈問題的研究。在多人博弈中，參與者可能為了獲利而相互結盟，形成人數相同的兩個聯盟，或者形成一個多人聯盟和一個單人聯盟。這樣一來，多人博弈又變成了兩人博弈。在這裡，馮·諾依曼可以直接應用在二人零和博弈中得出的結論。這就意味著，每個聯盟都有與之對應的數值，這個數值表示：一個聯盟之外的所有參與者一起採取對該聯盟最不利的行動，該聯盟成員能獲得的最少總收益。簡言之，它表示在最壞的情況下每個聯盟最少能獲得的收益。

馮·諾依曼正是根據對各聯盟對應數值的研究來完整地論述這場博弈的。事實上，在研究博弈的過程中，馮·諾依曼需要討論的問題還包括形成聯盟所需的條件問題、聯盟總收益如何分配給各個成員的問題等。博弈的結果被看作一個歸責系統，它規定了每個玩家最終能從博弈中獲得的好處。這種好處既可以直接從博弈規則中獲得，也可以由聯盟其他成員自願支付。馮·諾依曼的這個理論儘管不能明確指出哪一個歸責系統將會實現，卻要求應該優先考慮一個特定的歸責系統，即博弈的解，這樣做的理由在於博弈之外的因素，如傳統習俗、價值觀等，也能影響博弈的解的確定。

博弈的不同解決方案反映了參與者組成的社會中的普遍接受的行為標準。在參與者的行為標準之中，哪一種歸責系統容易實現呢？馮·諾依曼用博弈的解對這個問題進行了描述。確定博弈解集的標準是：參與博弈的人沒有理由認為任意一種博弈解集的歸責系統要嚴格優於另外一種。與此同時，那些與博弈解集無關的歸責系統一定會被一些參與者認定為要劣於解集內的一種或者多種歸責系統。不過，對於所有博弈而言，是否都存在滿足該標準的解集還無法確定。另外，不少特殊的案例顯示，在一種博弈中，也可能存在多個不同的這樣的標準。

《博弈論》對讀者在數學知識方面有一定要求，但這個要求不超過基本的代數知識，且書中對一些數學概念都給出了較為詳盡的介紹和解釋。約翰·馮·諾依曼每提出一個理論總會提出相應的案例，他用數學方法詳細地討論了這些具體案例，同時抓住一切機會對其數學分析和結論給出文字性說明。基於這些因素，書中的內容對於有數學短板的讀者來說亦是非常有趣的。這部著作必將成為準確定義和清晰表述經濟學的重要工具。

博弈論的「前生今世」

日常生活中，我們總能見到大大小小的博弈，博弈可以是多人參與的，也可以是在多團隊之間進行的。在博弈中，參與者會受到特定條件的制約，且都希望能使自身得到的利益最大化。參與者往往會根據對手的策略來實施對應的策略。從這個意義上來看，博弈論又可以被稱作對策論，同時它還有一個較為通俗的名字，即賽局理論。博弈是具有鬥爭性和競爭性的現象，而博弈論所研究的就是有關這類現象的理論和方法。

博弈論中總是會運用到數學知識，所以它也被看作應用數學的一個分支，或者是運籌學的一門重要學科。遊戲和博弈中的激烈結構之間相互作用，而博弈論正是用數學的方法來研究這種相互作用。

在一個博弈遊戲中，參與者需要考慮對手的實際行為和預測行為，根據這些行為最佳化自己的策略。表面上來看，有些博弈中的相互作用是不同的，但它們在運作時卻可能表現出相似的激勵結構，最具代表性的案例是囚徒困境。

博弈行為通常是競爭性行為，所以這種行為往往會表現出對抗的性質。參與這類行為的人一般都具有各自不同的目標或利益。在博弈過程中，人人都會向著自己的目標努力，他們會充分考慮對手可能採取的行動方案，制訂自己的合理方案，使自身的利益獲得保障，我們在日常生活中進行的遊戲，如下棋、打牌等都屬於博弈行為。

由此，我們不難理解博弈論所要研究的內容：事實上，博弈論就是站在研究者的角度，充分考慮博弈各方所有可能的行動方案，並運用數學方法找出最合理的行動方案的一種理論或方法。由於它的主要工具是數學，所以嚴格來說它是一種數學理論或數學方法。

在中國古代，博弈論思想就已經存在，最具代表性的博弈論研究者是著名軍事家孫武，他的《孫子兵法》既是一本軍事著作，也是一部博弈論專著。人們最初常把博弈論思想用以研究娛樂性質的勝負問題，比如人們在下象棋、打牌或者賭博中都會用到這類思想。不過，在此階段的博弈論是相對粗淺的，人們只是根據經驗來把握博弈的局勢，努力使自身利益最大化，還沒有向著理論的方向發展。直到20世紀初，博弈論才正式發展成為一門學科。

最早開始研究博弈論的是策墨洛、波雷爾和馮·諾伊曼。策墨洛的研究是用數學方法研究博弈現象的第一次嘗試，波雷爾為博弈論的發展起到了巨大的推動作用，馮·諾伊曼和奧斯卡·摩根斯坦第一次對博弈論進行了系統化和形式化的研究。

此後，約翰·納什提出納什均衡的概念，他認定博弈中存在著均衡點，並運用不動定理成功證明了該點的存在，這一重要的研究為博弈論的普遍化奠定了基礎。什麼是納什均衡呢？它指的是：博弈中的所有人都將面臨的一種特殊情況，即當對手不改變自己的策略時，他當前的策略是最優選擇，如果參與者改變他當前的策略，他的利益就會受損。只要博弈參與者都保持理性，那麼他們在納什均衡點上就不會有改變自身策略的衝動。

要證明納什均衡點的存在，就需要提出一個新的概念，即博弈均衡偶。博弈均衡偶指的是若參與者a在兩人零和博弈中採取最優策略a+，那麼參與者b也會採用其最優策略b+；若參與者a採取策略a，那麼他的損失不會超過他採取策略a+時的損失，這種結果也適用於參與者b。若給博弈均衡偶下一個明確的定義，則是：策略集a中的策略a+和策略集b中的策略b+叫作均衡偶，對於策略集a和策略集b形成的成對策略a、b，總是滿足以下條件：偶對（a，b+）≤偶對（a+，b+）≥偶對（a+，b）。若納什均衡點在非零和博弈中，博弈均衡偶的定義則為：策略集a中的策略a+和策略集b中的策略b+叫作均衡偶，對於策略集a和策略集b形成的成對策略a、b，總是滿足以下條件：參與者a的偶對（a，b+）≤偶對（a+，b+）；參與者b的偶對（a+，b）≤偶對（a+，b+）。根據這兩個定義就可以得到納什定理：在兩人博弈中，只要參與者的純策略是有限的，其必然存在至少一個均衡偶，也稱為納什均衡點。要證明納什定理必須運用不動點理論，這一理論是研究經濟均衡的主要工具。也就是說，找到了博弈的不動點就等於找到了納什均衡點。

作為一種重要的分析工具，納什均衡點能讓博弈研究在特定的結構中找到有意義的結果。但是，由於納什均衡點的定義中規定參與者不會單方面改變策略，忽略了其他參與者改變自身策略的可能性，所以具有非常大的侷限性。納什均衡點的應用在多種情況下缺乏說服力，因此一些博弈研究者將它稱為「天真可愛的納什均衡點」。

除了策墨洛、波雷爾、馮·諾伊曼、奧斯卡·摩根斯坦、約翰·納什外，對博弈論的發展做出推動性貢獻的還有賽爾頓和哈桑尼等人。塞爾頓完善了納什均衡理論，他剔除了一些不合理的均衡點，形成了兩個精煉的均衡新概念，即子博弈完全均衡和顫抖之手完美均衡。

時至今日，博弈論已經發展成一門相對成熟和完善的學科。目前，博弈論在多個學科和領域獲得了廣泛的應用，特別是在生物學、經濟學、電腦科學、數學、政治、軍事等學科和領域的表現尤為出色。

例如，一些生物學家會利用博弈論來預測生物進化的某些結果，或者理解生物進化的原因。1973年，美國《自然》雜誌上刊登了一篇論文，其中便提出了一個有關博弈論的生物學概念，即進化穩定策略。此外，我們還能在演化博弈理論、行為生態學等方面見到博弈論的身影。作為應用數學的一個重要分支，博弈論還被應用於線性規劃、統計學和機率論等方面。

一般來說，博弈論引入經濟學是由美國著名數學家約翰·馮·諾伊曼和經濟學家奧斯卡·摩根斯坦在20世紀50年代率先完成的。現代經濟博弈論已經成為經濟分析的主要工具，它極大地促進了經濟理論的發展，特別是對資訊經濟學、委託代理理論和產業組織理論做出了重要貢獻。

1994年和1996年，以約翰·納什為代表的多位從事博弈論研究和應用的經濟學家，憑藉他們在經濟領域所做的突出貢獻成功獲得諾貝爾經濟學獎。在博弈論未被應用在經濟領域之前，傳統經濟學分析的思路較為狹隘，而博弈論的引入清晰地呈現出經濟主體之間的辯證關係，使得經濟學的分析有了新的思路。這不僅與現實市場競爭十分貼近，還為現代微觀經濟學和宏觀經濟學奠定了基礎。

博弈論的基礎是建立在眾多現實博弈案例之上的。博弈需要具備一定的要素，主要有五個方面：局中人、策略、得失、次序、均衡。

局中人是博弈的參與者，每個參與者都能對自身策略進行決策，但不能改變別人的決策。若博弈中的局中人只有兩個，這種博弈便稱為兩人博弈，若博弈中的局中人超過兩個，則這種博弈便是多人博弈。

策略是博弈過程中局中人做出的切實可行的行動方案，局中人的一個策略不是指他所採取的某一階段的行動方案，而是指他在整個博弈過程中從始至終所採用的一個行動方案。根據可能採取的策略的有限性或無限性，博弈可被分為有限博弈和無限博弈。在有限博弈中，局中人的策略是有限的；在無限博弈中，局中人的策略則是無限的。

每場博弈中，局中人最後的結果有得有失，每局博弈的結果便被稱為得失。局中人博弈的得失與兩個因素相關：一是其自身所選定的策略，二是其他局中人所選定的策略。每個局中人在博弈結束時的得失可根據所有局中人選定的一組策略函式來判定，人們把這個函式稱為支付函式。

局中人的決策總是有先有後的，同時，每個局中人都可能要做多個決策選擇，這些選擇也是有先後順序的，博弈的次序能決定博弈的結果。在其他要素相同的情況下，若局中人決策和選擇的次序不同，博弈也會不同。

每場博弈都會涉及均衡問題。所謂均衡，即指平衡，或者說相關量處於一個穩定值。這是經濟學中的常用術語。例如，若一家商場的商品能夠處於一個均衡值，人們想買就能買到這種商品，想賣就能賣出這種商品，那麼這個商品的價格就是這裡的均衡值。有了這個價格做保障，商品的供求就能達到均衡狀態。納什均衡就是這樣的一個穩定的博弈結果。

博弈的分類

根據不同的標準，博弈可以分為多種型別。

若根據博弈中的參與者是否達成一個具有約束力的協議來劃分，博弈可被分成合作博弈和非合作協議。具體來說，就是當相互作用的局中人就博弈過程制定了一個具有約束力的協議時，這個博弈就是合作博弈，如果局中人之間沒有制定這項協議，那麼該博弈就是非合作博弈。

若根據局中人行為的時間序列性來劃分，博弈也可分為兩類，即靜態博弈和動態博弈。所謂靜態博弈，指的是局中人同時選擇所要採取何種行動的博弈，或者在博弈過程中，後做出選擇的人不清楚先選擇的人的策略而做出行動的博弈。所謂動態博弈，指的是局中人的行動有先後順序，且後做出選擇的人知道先做出選擇之人的行動。在著名的囚徒困境中，局中人的選擇是同時進行的，或在相互不知道的情況下進行的，屬於典型的靜態博弈。在我們常玩的棋牌類遊戲中，後行者總是知道先行者選擇的行動，屬於動態博弈。

若根據局中人對彼此的瞭解程度來劃分，博弈同樣能分為兩類：一類是完全資訊博弈，在這類博弈中，每位參與者都能準確地知道所有其他參與者的資訊，包括個人特徵、收益函式、策略空間等；另一類是不完全資訊博弈，在這類博弈中，每位參與者對所有其他參與者的資訊不夠了解，或者無法對其他每一位參與者的資訊都有準確瞭解。

在經濟領域，人們所談論得最多的博弈是非合作博弈。一般來說，非合作博弈比合作博弈簡單，其理論也遠比合作博弈成熟。根據複合特徵來劃分，非合作博弈可分為四類，分別是完全資訊靜態博弈、不完全資訊靜態博弈、完全資訊動態博弈、不完全資訊動態博弈。其中完全資訊靜態博弈對應的均衡概念是納什均衡，完全資訊動態博弈對應的均衡概念是子博弈精煉納什均衡，不完全資訊靜態博弈對應的均衡概念是貝葉斯納什均衡，不完全資訊動態博弈對應的均衡概念是精煉貝葉斯納什均衡。

此外，根據局中人的策略是有限的還是無限的，或者根據博弈進行的次數是有限次還是無限次，又或者根據博弈持續的時間是有限時間還是無限時間，博弈又可被分為有限博弈和無限博弈。

若根據博弈的表現形式來劃分，博弈還可被分為戰略型博弈和展開型博弈。

博弈論是以數學為研究工具的理論方法。博弈論研究的第一步是透過現象看本質，即從複雜的現象中抽出本質元素，利用這些元素構建合適的數學模型，再利用這一模型對引入的、影響博弈形勢的其他因素進行分析並得出結論。這與用數學研究社會經濟的其他學科的研究方法如出一轍。

根據博弈元素抽象水平的不同，博弈可分為標準型、拓展型和特徵函式型三種。在日常生活中，我們只需利用博弈的這三種表達方式就能解決許多社會經濟性問題，由於它在社會科學方面的貢獻以及它自身攜帶的數學性質，人們形象地稱它為社會科學的數學。

博弈論是一門形式理論，它所研究的是理性局中人的相互作用。作為一個成熟的理論，其所具備的理論性質並不比其他學科弱。同樣，在實際應用方面，它也不比許多學科遜色。它不僅在數學領域佔有重要的地位，還應用於經濟學、社會學、政治學等多門社會科學。

嚴格來說，博弈論是這樣一個過程：它是個人或團體在一定規則約束下，依據各自掌握的關於別人選擇的行為或策略，決定自身選擇的行為或策略的收益過程。既然是一個計算收益的過程，定然與經濟學緊密相關，它在經濟學上就是一個十分重要的理論概念。

人們常說世事如棋，每一場博弈就像一個棋局，總是包含著變化與不變。若把世界看作一個大棋盤，每個人都是下這盤棋的人，人的每一個行為都是在棋盤中佈下一顆棋子。在棋局中，棋手們會盡可能保持理性，精明慎重地走好每一步。棋手之間會相互揣摩、相互牽制，為了贏得最後的勝利，他們會不斷變化棋勢，下出精彩紛呈的棋局。從這個意義上看博弈論，它正是研究棋手們出棋招數的一門科學。每一次出棋都是一個理性化和邏輯化的過程，若再把這個過程加以系統化，就變成了博弈論。在錯綜複雜的相互影響之中，棋手們如何才能找出最合理的策略，正是博弈論研究的內容。

毫無疑問，博弈論衍生於下棋、打牌這些古老的遊戲。數學家和經濟學家們將這些遊戲中的問題抽象化，同時建立起完善的邏輯框架，在一定的研究體系中探索其規律和變化。對博弈論的探索不是一件容易的事情，即使最簡單的二人博弈也大有玄妙：若在一場棋局中，棋手都是最理性的棋手，他們可以準確地記住對手和自己的每一步棋，那麼一方在下棋時，為了能戰勝對手，他就會仔細考慮另一方的想法；同樣另一方在出子時也會如此考慮。同時，一方還可能考慮另一方在想他的想法，另一方也可能知道對手想到了他的想法，如此往復，問題會變得越來越複雜。

這樣的抽象問題會像重重迷霧遮蔽人們的雙眼。博弈論要如何著手解決這些問題呢？它如何把現實問題抽象化為數學問題並求出其最優解呢？它如何以理論的方式來指導實踐活動呢？這些問題最先在美國大數學家馮·諾依曼那裡得到解決。20世紀20年代，馮·諾依曼正式創立了現代博弈理論。1944年，現代系統博弈理論初步形成，其標誌是馮·諾依曼與美國經濟學家奧斯卡·摩根斯坦合著的《博弈論與經濟行為》出版發行。

馮·諾依曼解決了二人零和博弈的問題。這種博弈是一種非合作、純競爭型的博弈。現實中的博弈案例包括兩人下棋、打乒乓球等。在這種博弈中，一人贏就意味著另一人必然輸，一人勝一籌，另一人必輸一籌，兩者的淨獲利相加始終為零。將兩人下棋的博弈抽象化後，就出現了這樣的問題：若知道參與者集合、策略集合和盈利集合，如何才能找到其中的平衡？如何讓博弈雙方都感到最合理？最優解或最優策略是什麼？怎樣才算合理？在解決這類問題時，人們常會使用傳統的決定論，並遵循其中的最大最小原則。具體來說，就是每一位參與者都會猜，為了讓自己最大程度失利，對手會實行什麼策略，並據此制定出最優策略。馮·諾依曼利用線性運算等數學方法成功證明了在二人零和博弈中可以找到一個最小最大解。

利用線性運算，二人零和博弈的參與者就能根據對應的機率分佈，隨機選擇最優策略中的步驟，使雙方利益最大化或相當。這一博弈論的深層意義在於，所得的最優策略與對手在博弈中的操作沒有依存關係。簡言之，其理性思想就是「抱最好的希望，做最壞的打算」。

博弈論的意義

博弈論的現實意義是廣泛而深刻的，從一些現實中的例子就能看出。

在日常生活中，我們會在消費過程中經歷大大小小的價格戰。例如，我們在選購智慧手機時，就能感受到智慧手機領域的巨大競爭，各種品牌層出不窮，各種款式讓人眼花繚亂，各種優惠活動令人應接不暇。賣家們為了提高銷量，打出知名度，一而再再而三地壓低價格，高配置低價格的手機越來越多。雖然這種價格戰的最終受益者是消費者，但是在市場競爭上，或者說對於企業來說，價格戰並不是什麼好現象。

除了智慧手機領域，各種家電的價格大戰也不斷上演。家電大戰的受益者同樣是消費者，每逢這種價格戰時，人們似乎都會偷著樂。明明知道會虧本，為什麼商家們還要不遺餘力地壓低價格，義無反顧地投入價格戰呢？這其實就涉及博弈問題。對商家來說，其目的是自身利益最大化。壓低價格雖然會使自身利益暫時受到損害，但能夠吸引更多的消費者購買產品，達到薄利多銷的目的，同時也能打出品牌知名度，實現品牌價值增值。另外，低價銷售還可以極大迎合消費者的心理需求，使消費者在購買本品牌產品後形成長期慣性消費，為企業的後期佈局打下基礎。

然而，商家之間的博弈是一種零和博弈，價格戰一旦打起來，往往誰都沒錢賺。博弈雙方的利潤之和正好是零，這意味著一方獲利，必有一方受損。價格戰的博弈永遠不可能達到雙贏或多贏的局面。價格戰博弈屬於一種惡性競爭，通常會導致多輸局面，不過，其競爭的結果也會趨於穩定，達到一種納什均衡。其結果可能有利於大多數消費者，但對企業來說卻是一場災難。因此，企業參與價格戰無異於自殺。從價格戰博弈中能夠引申提出兩個有價值的問題：第一是價格戰達到納什均衡後雖然是一個零利潤的結局，但這個結局是有效率的，至少它不會破壞社會經濟效率。第二是若企業之間不存在任何價格戰，那麼敵對博弈將會產生什麼後果呢？這時，每個企業可能有兩種考慮，它們首先可能考慮採用正常價格的策略，其次則是採用高價壟斷策略。採用正常價格的結果是企業獲利。如果每個企業都能在各自的領域內形成壟斷，那麼博弈雙方的共同利潤便會最大化。這時，它們通常會進行壟斷經營，抬高產品價格。由這兩種考慮，我們可以得出一個基本準則，即企業應該把戰略建立在假設對手按照其最優策略行動的基礎之上，或者假設自身處於利潤最低的條件下，再製定應對策略。

實際上，企業之間的完全競爭所能達到的均衡是一種非合作博弈均衡，即納什均衡。在這種穩定狀態下，企業要銷售產品，就會按照其他企業的定價來定價，消費者要購買產品也會參照各企業的定價來決定是否購買。企業的目標是實現利潤最大化，消費者的目標是爭取產品效用最大化。由於這是一種零和博弈，所以兩者的利潤之和是零。此時，企業所制定的產品價格就等於邊際成本。企業之間處於完全競爭的狀態時，非合作行為能保障社會的經濟效率。如果企業進行合作並採用壟斷價格，那麼就可能影響社會經濟效率。正是由於這個原因，世界貿易組織和各國政府才會反對企業壟斷。

發展經濟和環境汙染是一對矛盾，一般來說，發展經濟勢必會造成環境汙染。這種矛盾便造就了汙染博弈。發展市場經濟會帶來汙染問題，如果政府不加以管理，企業就會為了利潤而犧牲環境。為了追求利潤最大化，企業不會增加環保裝置，為了生產產品而產生的汙染物便難以處理，這將直接造成環境汙染。若所有企業都堅持實施不顧環境汙染，只為追求利潤最大化的策略，就會步入納什均衡狀態。假設在這種狀態中，一個企業願意從利他的角度出發，購買環保裝置，增加治理環境汙染的成本，那麼其總體生產成本也會水漲船高，成本一高，企業就會提高產品價格，導致產品失去市場競爭力，這樣一來企業很難維持經營，甚至有可能破產。要打破這一魔咒，政府就要加強防汙染管理，使企業在追求利潤的同時也要兼顧環境保護。當所有企業都願意在環境保護的基礎上追求利潤時，社會的整體效率就會提高，這又會反過來彌補企業在環保方面的投入，最後，不僅社會環境會變得更好，經濟也能又好又快地發展。

除了價格戰博弈論、汙染博弈論，現實中還有一種博弈論值得人們深思，這就是貿易戰博弈論。一個國家在國際貿易方面往往有兩個選項：一是保持貿易自由；二是實行貿易保護。貿易的自由和壁壘之間也能形成一個納什均衡，這個均衡的代價是高昂的，它會使貿易雙方採取不合作策略，陷入永無休止的貿易戰當中。貿易戰一旦打響，必定會使雙方的利益都受到損害，所以這是一個雙輸的策略。例如，a國為了自身利益，採取進口貿易限制策略，提高關稅，使出口國b的利益受到損害。b國為了防止利益受損，以同樣提高關稅的方式進行反擊，最終兩國利益都受損。相反，如果a國和b國能夠達成合作，形成一種合作性均衡，兩國都遵循互惠互利原則，減少或免除各自的關稅，這樣一來，雙方都能從自由貿易中獲利，與此同時，全球貿易的總收益也會不斷增高。

博弈論是現代社會一個熱門的研究課題，它不僅存在於運籌學中，也存在於經濟學中。近些年，它在學術界的地位越來越重要，許多諾貝爾經濟學獎都與對博弈論的研究相關。事實上，博弈論並不是高高在上的學術話題，它所涉及的應用領並不狹隘。在我們的學習、工作和生活之中，隨處可見博弈論的身影，比如我們在學習時要與老師、同學博弈，在工作時要與上級、下屬、客戶、競爭對手博弈，在生活中要與家人、朋友博弈。博弈就在我們的身邊，用博弈的方式去思考問題將會給我們帶來不一樣的思想體驗。從某種程度上來說，博弈論意味著一種全新的思想或一種全新的理解分析的方法。

博弈論的重要性不言而喻，它能左右你的生活，實現你的價值。若你想成為一個對社會有價值的人，你要學習博弈論；若你想在商場上叱吒風雲、獲得成功，你要學習博弈論；若你想贏得生活，成為可被人信賴的人，你也要學習博弈論。總之，博弈論已成為當今社會不得不瞭解、不可不學習的重要理論之一。

如何找到一個最優策略

博弈理論中存在一些對人的基本假定，比如它假定參與博弈的人必須是理性的，而理性就意味著他在博弈中是從自己的利益出發的，或者說他是自私的。理性的人在博弈過程中會將自身利益最大化作為目標，博弈論的研究也是建立在理性人之間的博弈之上的。約翰·納什利用他創造的囚徒困境博弈故事清楚地說明了納什平衡的存在，即在非合作博弈中存在一個均衡解，這個解可使博弈雙方的利益都獲得保障。

每場博弈中都會涉及三大要素：參與者、策略、得失。在囚徒困境中，兩個囚徒是博弈的參與者，他們選擇的策略都是承認殺人事實，結果兩人都贏得了中間宣判結果。而如果一名囚徒承認殺人事實，另一名囚徒不承認殺人事實，其結果是承認者獲得減刑，否認者獲得死刑。最後兩個理性的囚徒在經過慎重考慮之後，都選擇承認殺人事實，這樣一來他們都獲得了穩妥的保命結果。除了囚徒困境，我們還能在自私基因、智豬博弈等理論中找到這種均衡解。

導讀（第1頁，共2頁）