編輯時間	歷史版本	內(nèi)容長度	圖片數(shù)	目錄數(shù)	修改原因
2023-02-22 10:48	最新歷史版本	32061	4	6	修正錯誤

博弈論

博弈論也叫對策論（游戲理論），不僅是現(xiàn)代數(shù)學(xué)的一個新分支，也是運(yùn)籌學(xué)的一個重要課題。

博弈論

博弈論主要研究公式化激勵結(jié)構(gòu)之間的相互作用，是一種研究帶有斗爭或競爭性質(zhì)的現(xiàn)象的數(shù)學(xué)理論和方法。博弈論考慮了博弈中個體的預(yù)測行為和實(shí)際行為，研究了它們的優(yōu)化策略。生物學(xué)家用博弈論來理解和預(yù)測進(jìn)化的一些結(jié)果。

博弈論已經(jīng)成為經(jīng)濟(jì)學(xué)的標(biāo)準(zhǔn)分析工具之一。在金融學(xué)、證券學(xué)、生物學(xué)、經(jīng)濟(jì)學(xué)、國際關(guān)系、計(jì)算機(jī)科學(xué)、政治學(xué)、軍事戰(zhàn)略和許多其他學(xué)科被廣泛使用。

基本定義

《博弈圣經(jīng)》博弈論的定義：我們認(rèn)為動物對自然的沉迷s運(yùn)動作為決策者預(yù)期空間中的三維平衡文學(xué)理論，被稱為博弈論。

基本概念包括局里的人、行動、信息、策略、收益、均衡和結(jié)果等。其中局中人、策略和收入是最基本的要素。局中人、動作和結(jié)果統(tǒng)稱為游戲規(guī)則。

理論歷史

發(fā)展過程

博弈論是兩個人互相利用在一場平等的游戲中改變他們的對抗策略以達(dá)到獲勝的目的。博弈論的思想自古就有中國《孫子兵法》等s古著作不僅是軍事著作，也是最早的博弈論著作。博弈論最初關(guān)注的是國際象棋、橋牌、在賭博中，人們 s對游戲局勢的把握只停留在經(jīng)驗(yàn)上，沒有理論上的發(fā)展。

博弈論考慮了博弈中個體的預(yù)測行為和實(shí)際行為，研究了它們的優(yōu)化策略。

現(xiàn)代對博弈論的研究始于策梅洛（Zermelo），波萊爾（Borel）及馮·諾依曼（馮諾伊曼）

1928年，馮·諾依曼證明了博弈論的基本原理，從而宣告了博弈論的正式誕生。1944年，馮·諾依曼和摩根斯坦合著的劃時代巨著《博弈論與經(jīng)濟(jì)行為》，將二人博弈擴(kuò)展到N人博弈結(jié)構(gòu)，并將博弈論系統(tǒng)地應(yīng)用到經(jīng)濟(jì)領(lǐng)域，從而奠定了這門學(xué)科的基礎(chǔ)和理論體系。

從1950年到1951年，約翰·福布斯·納什（約翰福布斯）利用不動點(diǎn)定理證明了平衡點(diǎn)的存在性，為博弈論的推廣打下了堅(jiān)實(shí)的基礎(chǔ)。納什 ■開創(chuàng)性論文《n人博弈的均衡點(diǎn)》（1950）,《非合作博弈》（1951）等等，給出了納什均衡的概念和均衡的存在定理。此外，萊因哈德·澤爾騰、約翰·哈薩尼美國的研究也促進(jìn)了博弈論的發(fā)展。今天，博弈論已經(jīng)發(fā)展成為一門相對完善的學(xué)科。

諾貝爾獎

自1994年諾貝爾經(jīng)濟(jì)學(xué)獎授予三位博弈論專家以來，已經(jīng)有七位諾貝爾經(jīng)濟(jì)學(xué)獎與博弈論的研究有關(guān)，分別是：

約翰·海薩尼

1994年，它被授予加州大學(xué)伯克利分校的約翰·海薩尼（J.哈爾薩尼）普林斯頓大學(xué)的約翰·納什（J.Nash）和波恩大學(xué)的賴因哈德·澤爾滕（萊因哈德很少見）為了表彰這三位數(shù)學(xué)家對非合作博弈均衡分析理論的開創(chuàng)性貢獻(xiàn)，對博弈論和經(jīng)濟(jì)學(xué)產(chǎn)生了重大影響。

1996年，它被授予英國劍橋大學(xué)的詹姆斯·莫里斯（詹姆斯 A. 米爾利）和美國哥倫比亞大學(xué)的威廉·維克瑞（威廉維克瑞）前者在信息經(jīng)濟(jì)學(xué)理論領(lǐng)域，特別是在非對稱信息下的經(jīng)濟(jì)激勵理論方面做出了巨大貢獻(xiàn)，后者在信息經(jīng)濟(jì)學(xué)方面做出了巨大貢獻(xiàn)、激勵理論、博弈論等方面都有很大的貢獻(xiàn)。

2001年，它被授予加州大學(xué)伯克利分校的喬治·阿克爾洛夫（喬治 A. Akerlof ）美國斯坦福大學(xué)的邁克爾·斯賓塞（A.邁克爾）和美國哥倫比亞大學(xué)的約瑟夫·斯蒂格利茨（約瑟夫 E.斯蒂格利茨）他們的研究為不對稱信息市場的一般理論奠定了基礎(chǔ)，他們的理論很快得到應(yīng)用從傳統(tǒng)的農(nóng)業(yè)市場到現(xiàn)代的金融市場，它們的貢獻(xiàn)來自于現(xiàn)代信息經(jīng)濟(jì)學(xué)的核心。

2005年，它被授予馬里蘭大學(xué)的托馬斯·克羅姆比·謝林(謝林)和耶路撒冷希伯來大學(xué)的羅伯特·約翰·奧曼(羅伯特）兩者的研究通過博弈論分析促進(jìn)了對沖突與合作的理解。

2007年，它被授予明尼蘇達(dá)大學(xué)的Leonid·赫維茨（Leonid Hurwicz）美國普林斯頓大學(xué)的埃里克·馬斯金(Eric S. 馬斯金）以及美國芝加哥大學(xué)的羅杰·邁爾森(羅杰 B. 邁爾森）這三者的研究為機(jī)制設(shè)計(jì)理論奠定了基礎(chǔ)。

2012年，它被授予美國經(jīng)濟(jì)學(xué)家歐文·羅斯（艾爾文東號. 羅斯）與羅伊德·沙普利（勞埃德 S.沙普利街號）他們創(chuàng)建“穩(wěn)定分配”的理論，并進(jìn)行“市場設(shè)計(jì)”的實(shí)踐。2]

作為一門工具學(xué)科，能如此廣泛地應(yīng)用于經(jīng)濟(jì)學(xué)，并得到學(xué)術(shù)界的關(guān)注，實(shí)屬罕見。

2014年，授予法國經(jīng)濟(jì)學(xué)家梯若爾。他在產(chǎn)業(yè)組織和共謀理論中采用了博弈論的思想，從而使理論和問題得以解決。監(jiān)管理論也有創(chuàng)新。

博弈要素

1.局中人：在一場比賽或游戲中，每一個擁有決策權(quán)的參與者都成了玩家。只有兩個玩家的博弈現(xiàn)象叫做“兩人博弈”，兩個以上玩家的游戲稱為“多人博弈”

2.策略：在一個游戲中，游戲中的每一個人都有一個切實(shí)可行的完整的行動計(jì)劃，即該計(jì)劃不是某一階段的行動計(jì)劃，而是指導(dǎo)整個行動的計(jì)劃，而一個玩家自始至終計(jì)劃的一個可行的行動計(jì)劃，在這個游戲中稱為該玩家的一個策略。如果每個人在一個博弈中都有有限數(shù)量的策略，那就叫“有限博弈”，否則稱為“無限博弈”

3.得失：一局結(jié)束的結(jié)果叫做得失。一局結(jié)束時每個局中人的得失不僅與局中人自己選擇的策略有關(guān)，還與整體局中人選擇的一套政策有關(guān)。所以，在游戲結(jié)束時，每個人都 s“得失”是全局的人定的一套政策的作用，通常叫做支付（payoff）函數(shù)。

4.對于游戲參與者來說，有一個游戲結(jié)果。

5.博弈涉及到均衡：均衡就是均衡在經(jīng)濟(jì)學(xué)中，均衡意味著相關(guān)量處于一個穩(wěn)定的值。在供求關(guān)系中，如果一個商品市場處于某個價格，在這個價格上想買這個商品的人都可以買，想賣的人都可以賣這個時候，我們說這種商品的供求達(dá)到了平衡。所謂納什均衡就是一個穩(wěn)定的博弈結(jié)果。

博弈論研究的假設(shè)：

決策者是理性的，最大化自己的利益；

完全理性是常識；

假設(shè)每個參與者都對環(huán)境和其他參與者的行為形成正確的信念和期望。

博弈類型

游戲的分類根據(jù)不同的基準(zhǔn)有不同的分類。

一般來說，游戲可以分為合作游戲和非合作游戲。合作博弈與非合作博弈的區(qū)別在于互動雙方之間是否存在有約束力的協(xié)議如果有，就是合作博弈，如果沒有，就是非合作博弈。

從行為的時間順序來看，博弈論又進(jìn)一步分為靜態(tài)博弈、動態(tài)博弈兩類：靜態(tài)博弈是指在博弈中，參與者同時選擇或不同時選擇，但后一個參與者不選擇我不知道第一個演員采取了什么具體行動；動態(tài)博弈是指在博弈中，參與者的行動是有順序的，后面的行動者可以觀察到第一個行動者選擇的行動。通俗的理解：囚徒困境'就是同時做決策，屬于靜態(tài)博弈；棋牌游戲的決策或行動具有優(yōu)先權(quán)，屬于動態(tài)博弈

根據(jù)參與者的說法對其他參與者的理解，它分為完全信息博弈和不完全信息博弈。完全博弈是指在博弈過程中每個玩家對其他玩家的特征、策略空間和收益函數(shù)具有準(zhǔn)確的信息。不完全信息博弈是指如果一個參與者具有其他參與者的特征，、策略空間和收益函數(shù)的信息不夠準(zhǔn)確、或者不針對所有參與者、策略空間和收益函數(shù)都有精確信息，這種情況下玩的博弈是不完全信息博弈。

經(jīng)濟(jì)學(xué)家講的博弈論一般是指非合作博弈由于合作博弈比非合作博弈更復(fù)雜，其理論成熟度遠(yuǎn)不如非合作博弈。非合作博弈分為：完全信息靜態(tài)博弈，完全信息動態(tài)博弈，不完全信息靜態(tài)博弈，不完全信息動態(tài)博弈。與上述四個博弈相對應(yīng)的均衡概念是：納什均衡(納什平衡）子博弈精煉納什均衡（子游戲完美納什街號平衡）貝葉斯納什均衡(貝葉斯納什街號均衡）精煉貝葉斯均衡(完美的平衡）

博弈論有很多分類，比如：博弈的次數(shù)或持續(xù)時間可分為有限博弈和無限博弈；在表現(xiàn)形式上，也可以分為一般類型（戰(zhàn)略型）或者展開型；根據(jù)博弈邏輯基礎(chǔ)的不同，可以分為傳統(tǒng)博弈和進(jìn)化博弈。

納什均衡

納什均衡(納什平衡)在一個策略組合中，所有的參與者都面臨著這樣的情況當(dāng)其他人的策略無效時，他的策略是最佳的他們不會改變策略。換句話說，如果他此時改變策略，他的支付就會減少。在納什均衡點(diǎn)上，每個理性的參與者都不會有單獨(dú)改變策略的沖動。證明納什均衡點(diǎn)存在的前提是“博弈均衡偶”概念的提出

所謂“均衡偶”就是在兩人零和博弈中，當(dāng)局中的人A采用了他的最優(yōu)策略A*，參與人B也采用其最優(yōu)策略B*如果玩家還是拿b*而參與人A采取了另一個策略A，那么參與人A不會比他采取原來的策略A付出更多*的支付。這個結(jié)果對于玩家b也是成立的。

這樣，“均衡偶”的明確定義為：一對策略a*屬于策略集A)和策略b*屬于策略集B）稱之為平衡對對于任何策略A，(屬于策略集A)和策略b（屬于策略集B），總有：

rect/rectrect/rectrect/復(fù)制矩形圖像失敗您可以插入圖像來添加查看操作路徑/path對于非零和博弈，也有以下定義：一對策略a*屬于策略集A）和策略b*屬于策略集B）它被稱為非零和博弈的均衡對，對于任何策略A(屬于策略集A）和策略b（屬于策略集B），總有：對局中人A的rect/rectrect/rectrect/復(fù)制矩形圖像失敗您可以插入圖像來添加查看操作路徑/path對局中人B的rect/rectrect/rectrect/復(fù)制矩形圖像失敗您可以插入圖像來添加查看操作路徑/path有了上面的定義，納什定理馬上就可以得到了：

任何有限純策略的二人對策至少有一個均衡對。這個均衡對叫做納什均衡點(diǎn)。

納什定理的嚴(yán)格證明需要不動點(diǎn)理論，不動點(diǎn)理論是研究經(jīng)濟(jì)均衡的主要工具。一般來說，找到平衡點(diǎn)的存在性就相當(dāng)于找到了博弈的不動點(diǎn)。

納什均衡點(diǎn)的概念提供了一個非常重要的分析手段，使得博弈論研究能夠在一個博弈結(jié)構(gòu)中找到更有意義的結(jié)果。

然而，納什均衡點(diǎn)的定義僅限于任何不滿足以下條件的參與者t不想單方面改變自己的策略，忽略了其他玩家改變策略的可能性所以很多時候納什均衡點(diǎn)的結(jié)論是沒有說服力的，研究者形象地稱之為“天真可愛的納什均衡點(diǎn)”

塞爾頓（R·Selten)從多重均衡中剔除一些按照一定規(guī)則不合理的均衡點(diǎn)，從而形成兩個均衡的精煉概念：子博弈完美均衡和顫抖手完美均衡。

案例一

囚徒困境

在博弈論中，塔克給出了一個著名的優(yōu)勢戰(zhàn)略均衡的例子“囚徒困境”囚犯'進(jìn)退兩難）博弈模型。這個模型以一種特殊的方式告訴我們一個警察和一個小偷的故事。假設(shè)有兩個小偷，甲和乙，他們共同犯罪、警察抓到我闖入一所房子。警察把這兩個人放在兩個不同的房間里審問對于每個嫌疑人，警方給出的政策是：如果兩個嫌疑人都供認(rèn)了自己的罪行，交出了贓物，那么證據(jù)確鑿，兩人都被定罪，判處有期徒刑8年；如果只有一個犯罪嫌疑人坦白，另一個人不坦白而否認(rèn)，則視為妨害公務(wù)（因?yàn)橛凶C據(jù)表明他有罪）額外的兩年徒刑，坦白立功者減刑8年，立即釋放。如果他們都否認(rèn)，警察可以由于證據(jù)不足，我們不能判定他們犯有盜竊罪，但他們每個人都可以因非法侵入罪被判處一年監(jiān)禁。下表顯示了這個博弈的收益矩陣。

首先，雖然他不t不知道B選什么，他知道不管B選什么，他都選“坦白”總是最優(yōu)的。很明顯，根據(jù)對稱性，B也會選擇“坦白”結(jié)果兩人都被判有期徒刑八年。然而，如果他們都選擇“抵賴”，每人只判了一年。在表2.在2的四個行動選項(xiàng)中，（抵賴、抵賴）它是帕累托最優(yōu)的，因?yàn)槿魏纹x這個行動選擇組合的其他行動選擇組合至少會使一個人情況變得更糟。但是，“坦白”是任何犯罪嫌疑人的主導(dǎo)策略，而且（坦白，坦白）它是一個占優(yōu)的戰(zhàn)略均衡，即納什均衡。不難看出，納什均衡和帕累托在這里是有沖突的。

從數(shù)學(xué)的角度來說，這個理論是合理的，即所有的選擇都是坦誠的。但在這種多維信息共同作用的社會學(xué)領(lǐng)域，顯然是不合適的。就像中國古代稱官員之間的賄賂一樣“陋規(guī)”這是因?yàn)樯鐣贫仁`了人們的行為和強(qiáng)迫人們改變的決定。比如從心理學(xué)角度來說，選擇表白的成本會更大，一方 s的表白會讓對方心虛，所以事后的報復(fù)也不會輕易在身邊的知情人中展開“出賣”這個角色會讓他付出更多。

但8到10年增加的比例會被稀釋，人的尊嚴(yán)會讓人產(chǎn)生報復(fù)心理，稍有斷裂“行規(guī)”我們正處于大數(shù)據(jù)時代要處理一件事更接近事實(shí)，就要盡可能多的掌握相關(guān)信息，進(jìn)行合理的加權(quán)分析人的動機(jī)和的移動圖像是復(fù)雜的，所以囚犯 s困境只能作為簡化模型的參考，具體決策需要具體分析。

案例二

智豬博弈

一、經(jīng)濟(jì)學(xué)中的“智豬博弈”Pigs’payoffs）這個例子講的是：

假設(shè)豬圈里有一頭大豬、一頭小豬。豬圈的一頭有一個豬槽（兩豬均在食槽端）在另一端，有一個控制豬食供應(yīng)的按鈕當(dāng)你按下按鈕時，10個單位的豬食將進(jìn)入食槽，但在前往食槽的途中，將有兩個單位的豬食的物理消耗如果大豬先到達(dá)低谷，那么大豬與食物的收益比為9 1；同時行動（去按按鈕），收益比例為7 3；仔豬先到低谷，收益比6∶4。那么，在兩頭豬都明智的前提下，最后的結(jié)果是小豬選擇等待。

智豬博弈'由納什在1950年提出。其實(shí)小豬選擇等待，讓大豬按控制鍵，自己選擇“坐船”或稱為搭便車)的原因很簡單：在大豬選擇行動的前提下，如果小豬選擇等待，小豬可以獲得四個單位的凈收入，而如果小豬行動，只能獲得大豬留下的一個單位的凈收入，所以等待比行動好；在大豬選擇等待的前提下，如果小豬行動，小豬的收益將無法覆蓋成本，凈收益為-1單位，如果大豬也選擇等待，那么小豬的收益為零，成本為零總之，等待勝于行動。

用博弈論中的報酬矩陣可以更清晰地描述小豬的選擇：

大豬/小豬

行動

等待

行動

5，1

4，4

等待

9，-1

0，0

從矩陣中可以看出，當(dāng)大豬選擇行動時，如果小豬行動，它的收益是1，而如果小豬等待，它的收益是4，所以小豬選擇等待；當(dāng)大豬選擇等待時，如果小豬行動，它的收益是-1，而如果豬等，收益為0，所以豬也選擇等。綜合來看，無論大豬選擇行動還是等待，小豬的選擇都會是等待，即等待是小豬的優(yōu)勢策略。

在小型企業(yè)的管理中，學(xué)習(xí)如何“搭便車”是一個精明職業(yè)經(jīng)理人最基本的素質(zhì)。在某些時候，等待，讓其他大企業(yè)先開拓市場，是明智的選擇。在這個時候，你可以做一些事情，如果你不不要做某事！

聰明的管理者善于利用各種有利條件為自己服務(wù)。搭便車”其實(shí)，職業(yè)經(jīng)理人面對每一筆開銷，都是另一種選擇關(guān)注和研究它，可以為企業(yè)節(jié)省很多不必要的開支，使企業(yè)的管理和發(fā)展再上一個新臺階。這種現(xiàn)象在經(jīng)濟(jì)生活中很常見，但小企業(yè)的管理者很少熟悉。

在智能豬游戲中，雖然豬 s“撿現(xiàn)成”這種行為在道德上是令人厭惡的，但不是游戲策略的主要目的是最大化一個人通過使用策略來維護(hù)自己的利益？

案例三

美女的硬幣

一個陌生的美女來找你聊天，要求和你玩一個游戲。美女提議：讓每個都顯示硬幣的一面，正面或負(fù)面。如果我們都是頭，那我給你3元，如果我們都是尾，我給你1元，剩下的你給我2元。聽起來是個不錯的提議。如果我是男的，我無論如何都會玩，但是經(jīng)濟(jì)上的考慮就是另一回事了這個游戲真的足夠公平嗎？

紳士/美女

女正面

女反面

正面

3，－3

2，+2

反面

2，+2

1，－1

假設(shè)我們頭的概率是X，尾的概率是利益最大化當(dāng)對手正面或反面時，我們應(yīng)該有相等的回報，否則對手總是可以改變正面和反面的概率來減少我們的總收入，所以這里列出的等式是

一般來說，這個等式意味著當(dāng)你的對手總是積極的時候，你得到的好處和當(dāng)你的對手總是消極的時候，你得到的好處是一樣的，也是最大的。解方程，也就是說平均每八次呈現(xiàn)三頭五尾是我們的最佳策略。而你把它代入收益表達(dá)式就可以得到每次的預(yù)期收益，計(jì)算結(jié)果是。

同樣，讓 s假設(shè)美女從前面出來的概率是y，反過來的概率是列方程的解也等于y，美女每次的期望收益是。這告訴我們，當(dāng)雙方都采取最優(yōu)策略時，一般的美女每次都是贏家。事實(shí)上，只要美麗需要(這個方案，不管你再采用什么方案，都能不要改變現(xiàn)狀。如果所有的頭都出了，每次的期望收益就是如果所有的尾都出了，那么每次的期望收益也是。而任何策略無非是上述兩種策略的線性組合，所以期望仍然是。但是當(dāng)你也采取最優(yōu)策略的時候，至少可以保證你損失最小。否則你肯定會被美女采取的策略盯上，從而失去更多。看起來這個博弈模型沒什么用，但實(shí)際上可能涉及到金融市場定價中最重要的模型：定價權(quán)重模型了。

總的來說“博弈論”其本質(zhì)是以游戲的形式展現(xiàn)日常生活中的競爭矛盾，用數(shù)學(xué)和邏輯的方法分析事物的運(yùn)行規(guī)律。既然有游戲的參與者，就一定有游戲規(guī)則的制定者。深刻理解競爭行為的本質(zhì)，有助于我們分析和掌握競爭中事物之間的關(guān)系，也更便于我們制定和調(diào)整規(guī)則，使其最終按照我們預(yù)期的目的運(yùn)行。

社會應(yīng)用

《孫子兵法》是中國乃至世界上最早的經(jīng)典博弈論書籍近年來，由于博弈論在世界范圍內(nèi)的普及，出現(xiàn)了很多收集整理博弈論知識的書籍，比如《博弈論的詭計(jì)》、03010等。中國經(jīng)緯智庫是最早研究新博弈論的民間智庫之一由宋雪峰主任領(lǐng)導(dǎo)的《最神奇的博弈論定律》《多腿凳定律》《定量無窮大》在社會和經(jīng)濟(jì)發(fā)展的各個方面都被引用。

博弈論”結(jié)合傳統(tǒng)咨詢工具，可以幫助企業(yè)解決戰(zhàn)略定位、股權(quán)分配、股權(quán)融資、價值塑造、商業(yè)模式等疑難雜癥的新視角。

博弈論