頂[0] 分享評論[0] 編輯

囚徒困境

囚徒困境是美國蘭德公司的美林公司在1950年首先解決了這個難題·弗勒德（Merrill Lynch flood）和梅爾文·德雷希爾（Melvin Deresjo）提出假說理論，后來由艾伯特·塔克（ aluminum strip excavator）命名的理論。其主要理念是：基于對彼此的不信任和自身利益的最大化，博弈雙方往往會選擇不利的選擇，從而導致利益最小化。

其情節為：被抓后，共同犯罪的兩個人AB處于信息不對稱狀態，有三種情況：雙方均供認不諱，被判處有期徒刑8年、一方認罪一方否認，認罪的被釋放，否認的被判10年有期徒刑、雙方均否認被判有期徒刑一年。對于集體來說，最優解是“都不坦白”但出于自身利益的考慮，往往會選擇坦誠，導致雙方利益最小化。

囚徒困境兩難博弈在生活中隨處可見，在政治學中也有廣泛的應用、經濟學、社會學、商業、在正義領域，體現在軍備競賽上、征地問題、公益訴訟問題、關稅戰、市場價格戰、訴訟、勇敢的困境等，每個困境都有一個從納什均衡到帕累托最優解的解，可能需要很多次博弈才能慢慢接近最優解。通過學習基礎理論，重復囚犯的兩難博弈是擴展的、太空囚犯兩難游戲、不對稱囚犯的困境博弈，每個模型都有助于雙方更理性地合作。類似于囚徒的兩難博弈模型，有雪堆博弈和公共物品博弈囚犯的困境反映了集體理性和個人理性之間的沖突理性人個人的理性行為可能導致集體的非理性，理性的人會為了自己的最大利益而行動為了實現集體最優解，個體需要克制對自身利益的追求。在現實生活中，人與人之間應該相互信任，建立合作關系。

理論內涵編輯本段

假設兩個犯人共同犯罪，被抓入獄后都想盡快釋放，警察就把他們分開關押審問，并告知：如果一個人坦白而另一個人不坦白t，坦白的一方將因立功立即釋放，不坦白的一方將被判10年監禁；如果兩人都坦白，因為證據確鑿，每人判 83356；如果兩人都否認，因證據不足，各人被關押 13356年后釋放。在這套規則下，基于理性人的考慮，兩個囚犯群體的帕累托最優解是“都不坦白”但最后兩人都坦白了，各被判八年。博弈論為囚徒困境提供的納什均衡解s的困境是雙方都坦白，但利益沒有最大化。

典型的2*2囚犯的兩難博弈模型有四種結果：合作，作品），（合作，背叛），（背叛，合作），（背叛，背叛）當雙方選擇合作時，收益最高；當一方選擇背叛時，選擇背叛的一方會獲得更高的收益，但當雙方都選擇背叛時，各自都會獲得收益，但對于集體來說，收益會減少（與選擇合作的好處相比，）個體理性帶來集體非理性。囚犯的困境表明，兩個個體在爭奪利益時，都是以大局為重，愿意合作的、合作共贏，或者重視個人利益，往往會背叛對方、互相欺騙，游戲的結果是雙方同時背叛，因為人類有自私的天性。

理論應用編輯本段

政治學

軍備競賽

為囚犯在國家博弈中，美蘇爭霸就是一個典型的例子在冷戰背景下，擺在兩國面前的有兩種選擇：裁軍還是擴張，有四種情況：當雙方都選擇擴軍時，雙方相互對抗，付出更多成本進一步擴軍，加劇了戰爭風險；當一方選擇擴軍時，實力不對等的一方受到的戰爭威脅更大；雙方都解除武裝，就不需要支付額外費用，也沒有戰爭風險，但兩國都不會選擇這個選項。雖然雙方裁軍是普拉提的最優解，但從國家角度來說，擴軍永遠比裁軍更有利。

政府評價

在政府績效評估中，政府有兩種選擇：主動組織、被動接受；公眾有兩種選擇：主動參與、被動參與。會出現四種結果：政府積極組織，公眾積極參與；政府主動組織，公眾被動參與；政府被動組織，公眾主動參與；政府被動組織，公眾被動參與。這不同于傳統的囚犯的困境模型這種情況下，雙方都主動，利益最大化，雙方都不主動，就意味著成本降低、手續簡化了，但不利于社會的長遠發展。

經濟學

關稅戰

美國和中國的關稅戰是2*2囚犯的困境重復博弈，雙方的最優解是（合作，合作）但由于美國數次背叛，態度多變，中國在博弈中慢慢走向對立的一方，最終演變成（對抗，對抗）即雙方都選擇不合作，損害了雙方的利益。游戲在反復進行面對中國想合作而美國選擇對抗的態度，只有不斷反擊美國的背叛，美國才會吃虧在隨后的博弈中，美國會改變對華戰略，從而從背叛走向合作。

征地

政府希望征用土地來促進城市建設，農民希望得到補償來彌補收入減少的損失。理想結果是：農民可以從政府設定的補償中受益；現實情況是：一些農民要價過高或采取激進措施反對征地，政府只能強制征收或重新談判，導致雙方利益受損。一方的選擇原本是希望給自己帶來更多的利益，結果卻是利益更少。

商業

價格戰

商業競爭對手降價搶占市場份額，最終導致整個行業利潤下降。假設商家1價格不變，商家2降價，消費者會被商家2吸引，商家2會獲得更多利潤；如果商家1降價，商家2會更降價，否則商家1會搶占商家2的客戶。因為我不不知道對方會不會降價，有些人會選擇降價來吸引游客最后的結果就是每個商家都選擇降價，陷入低價競爭的惡性循環。以快遞行業為例，以價換量的價格混戰導致行業發展陷入困境。

A、b是兩家公司，他們會理性選擇廣告策略會有四種情況：甲做廣告，乙做廣告；甲做廣告，乙不做廣告不打廣告；一個沒有 t做廣告，B做廣告；甲不打廣告，乙不打廣告。如果A不 t做廣告，B不做廣告t打廣告，兩家公司都會有利潤，而且利潤是對等的；如果A做廣告而B不做t打廣告，那么A利潤高，B利潤低，反之亦然；然后B也會跟風做廣告最終兩家公司的利潤都會因為廣告費用太高而減少。這里的最優解是兩家公司都不做廣告，但能提高整體市場收入。

領導決策

領導決策過程中有兩個決策者a和 B，有四種可能：較低級別的A執行，較低級別的B執行；下層A執行，下層B不執行；下級不執行a，下級執行B；下屬A不執行，下屬B不執行。對于A，無論B執行與否，最優解都是執行這樣才能獲得領導的賞識，對B也是如此，所以最優解是執行AB但如果把AB看成一個整體，領導決策的執行可能會受到贊賞批評，出錯的可能性更高。對于集體來說，沒有一個會把被批評的可能性降到最低。然而，在現實生活中，A和B為了提升自己的職位，將對方視為競爭對手，互不信任，選擇在不告知對方的情況下執行決策雖然有多做多錯的風險，但領導還是可以利用的“囚徒困境”使其決定得到實施。

司法

訴訟

作為公共物品的提供者，環境公益訴訟就是一個典型“集體行動”環境損害會對社會產生負外部性，但當環境損害的影響在個人之間平均分擔時，對當事人的影響很小。有訴訟資格的原告費用自理、風險自擔、在收益分成的前提下，為了個人利益，不會選擇訴訟，而是等著別人提起訴訟，坐享其成但是對于集體來說，結果是沒有人提起訴訟，因為這個活動帶來的私人利益小于社會利益，導致囚徒的困境雖然訴訟對原告有利，但大家都選擇不提起訴訟。

司法執行

法院與被背信人之間是一種關系“靜態博弈”兩者之間有四種結局：被執行人履行判決時，法院采取相關執行措施；被執行人不履行判決的，法院應當采取相關強制執行措施；被執行人履行判決的，法院不采取相關執行措施；被執行人履行判決的，法院不采取相關執行措施。不同于普通的囚犯s困境博弈，雙方都沒有合作，沒有獲得最大利益，反而擴大了損失這是因為采取強制執行措施是法院的義務“非正常合作”最終雙方利益受損、結局二法院受損、結局三雙方獲利、第四種結果是被執行人受損。

審訊

在現實中，偵察機關在審訊過程中可以依賴它“囚徒困境”靠策略得到坦白是很罕見的，因為雙方都可以不要達到絕對的理性在更理性的情況下，雙方可能會選擇不同時坦白，因為這樣可能會逃避懲罰。在囚徒美國困境，博弈雙方都追求個人利益最大化的目標，但中國 s“坦白”制度帶來的預期收益與實際損失不成比例，導致不會陷入選擇的困境。現實的法律規則是：假設罪名可能判十年，如果兩人都否認，會因證據不足被判無罪；如果兩人都坦白，各判八年；如果其中一個坦白了，、一人否認，從輕處罰六年，從重處罰十年。刑期相差不大，犯罪者更可能選擇否認。在這種情況下，有三種解決方案：一種是幫助嫌疑人分析利弊，做出理性選擇，也就是坦白；二是制造信息不對稱，防止合謀，讓對方做出更有利的選擇，也就是告白；三是找到利益的平衡點，也就是表白坦白對個人來說不是最優解，但對集體來說是最有利的。一般來說，一些犯罪情節輕微的共同犯罪比較容易通過“囚徒困境”策略找到突破口。

社會

見義勇為困境

一老太太在公交站臺摔倒，路人扶起她，被敲詐法院判賠，背離了社會主流價值，打擊了大眾的傳統道德觀念。

理論影響編輯本段

博弈論研究者提出各種假設，研究人類的行為動機，并不斷補充、完善博弈論體系，成效顯著。學者道斯從合作與非合作行為動機的角度，認為部分參與者擔心只有單方面選擇合作才能獲得博弈的最低收益；有學者如Bacharach認為原因是人具有集體理性，追求利益最大化而不是個人利益，而Andreoni 認為是利他主義和聲譽促進了合作。互利共贏理論的本質是追求利益最大化。

基于囚犯 Selten和Stoecker 研究發現，只要對立的玩家愿意合作，并且看好對方他們可以改變策略，在一些競爭中取得成功；利伯曼等學者研究了聲譽和虛擬名字對玩家選擇和合作的影響；Cox et al研究證實，文化差異對合作或非合作行為有很大影響。Boone 和Witteloustuijn討論具有行為博弈或經濟博弈知識的參與者更有可能選擇合作行為。Sabater-Grande 和Georgentzis 討論了風險偏好類型的影響，指出風險厭惡者傾向于選擇背叛。孟祖輝認為，名參與者對人的信任也會影響他們的行為決策。馬本江和邱研究如何擺脫囚犯得出的結論是博弈雙方在理性條件下增加了博弈的約束規則。

基于空間博弈模型，Perc 研究了空間囚徒困境中的隨機收入變化s困境博弈模型可以促進合作；諾瓦克和梅將空間網絡結構與囚徒 s困境博弈模型，指出個體之間的空間結構可以促進合作，并發現最佳的模仿策略可以促進合作的形成，提高整體合作水平。

基于不對稱博弈模型，紐曼-Watts 研究了囚犯不對稱收入分配機制下的s困境博弈模型在某些情況下，窮人會被富人剝削，富人會更富在某些情況下，窮人會被富人救濟，財富會被重新分配。

詞條內容僅供參考，如果您需要解決具體問題
（尤其在法律、醫學等領域），建議您咨詢相關領域專業人士。

如果您認為本詞條還有待完善，請編輯

囚徒困境

理論內涵編輯本段

理論應用編輯本段

政治學

經濟學

商業

司法

社會

理論影響編輯本段

附件列表

標簽

同義詞

囚徒困境

理論內涵 編輯本段

理論應用 編輯本段

政治學

經濟學

商業

司法

社會

理論影響 編輯本段

附件列表

標簽

同義詞

理論內涵編輯本段

理論應用編輯本段

理論影響編輯本段