囚徒困境
囚徒困境是美國蘭德公司的美林公司在1950年首先解決了這個難題·弗勒德(Merrill Lynch flood)和梅爾文·德雷希爾(Melvin Deresjo)提出假說理論,后來由艾伯特·塔克( aluminum strip excavator)命名的理論。其主要理念是:基于對彼此的不信任和自身利益的最大化,博弈雙方往往會選擇不利的選擇,從而導致利益最小化。
其情節為:被抓后,共同犯罪的兩個人AB處于信息不對稱狀態,有三種情況:雙方均供認不諱,被判處有期徒刑8年、一方認罪一方否認,認罪的被釋放,否認的被判10年有期徒刑、雙方均否認被判有期徒刑一年。對于集體來說,最優解是“都不坦白”但出于自身利益的考慮,往往會選擇坦誠,導致雙方利益最小化。
囚徒困境兩難博弈在生活中隨處可見,在政治學中也有廣泛的應用、經濟學、社會學、商業、在正義領域, 體現在軍備競賽上、征地問題、公益訴訟問題、關稅戰、市場價格戰、訴訟、勇敢的困境等,每個困境都有一個從納什均衡到帕累托最優解的解,可能需要很多次博弈才能慢慢接近最優解。通過學習基礎理論,重復囚犯 的兩難博弈是擴展的、太空囚犯 兩難游戲、不對稱囚犯 的困境博弈,每個模型都有助于雙方更理性地合作。類似于囚徒 的兩難博弈模型,有雪堆博弈和公共物品博弈囚犯 的困境反映了集體理性和個人理性之間的沖突理性人 個人的理性行為可能導致集體的非理性,理性的人會為了自己的最大利益而行動為了實現集體最優解,個體需要克制對自身利益的追求。在現實生活中,人與人之間應該相互信任,建立合作關系。

理論內涵 編輯本段
假設兩個犯人共同犯罪,被抓入獄后都想盡快釋放,警察就把他們分開關押審問,并告知:如果一個人坦白而另一個人不坦白t,坦白的一方將因立功立即釋放,不坦白的一方將被判10年 監禁;如果兩人都坦白,因為證據確鑿,每人判 83356;如果兩人都否認,因證據不足,各人被關押 13356年后釋放。在這套規則下,基于理性人的考慮,兩個囚犯群體的帕累托最優解是“都不坦白”但最后兩人都坦白了,各被判八年。博弈論為囚徒困境提供的納什均衡解s的困境是雙方都坦白,但利益沒有最大化。
典型的2*2囚犯 的兩難博弈模型有四種結果:合作, 作品),(合作,背叛),(背叛,合作),(背叛,背叛)當雙方選擇合作時,收益最高;當一方選擇背叛時,選擇背叛的一方會獲得更高的收益,但當雙方都選擇背叛時,各自都會獲得收益,但對于集體來說,收益會減少(與選擇合作的好處相比,)個體理性帶來集體非理性。囚犯 的困境表明,兩個個體在爭奪利益時,都是以大局為重,愿意合作的、合作共贏,或者重視個人利益,往往會背叛對方、互相欺騙,游戲的結果是雙方同時背叛,因為人類有自私的天性。

理論應用 編輯本段
政治學
軍備競賽
為囚犯 在國家博弈中,美蘇爭霸就是一個典型的例子在冷戰背景下,擺在兩國面前的有兩種選擇:裁軍還是擴張,有四種情況:當雙方都選擇擴軍時,雙方相互對抗,付出更多成本進一步擴軍,加劇了戰爭風險;當一方選擇擴軍時,實力不對等的一方受到的戰爭威脅更大;雙方都解除武裝,就不需要支付額外費用,也沒有戰爭風險,但兩國都不會選擇這個選項。雖然雙方裁軍是普拉提的最優解,但從國家角度來說,擴軍永遠比裁軍更有利。
政府評價
在政府績效評估中,政府有兩種選擇:主動組織、被動接受;公眾有兩種選擇:主動參與、被動參與。會出現四種結果:政府積極組織,公眾積極參與;政府主動組織,公眾被動參與;政府被動組織,公眾主動參與;政府被動組織,公眾被動參與。這不同于傳統的囚犯 的困境模型這種情況下,雙方都主動,利益最大化,雙方都不主動,就意味著成本降低、手續簡化了,但不利于社會的長遠發展。
經濟學
關稅戰
美國和中國的關稅戰是2*2囚犯 的困境重復博弈,雙方的最優解是(合作,合作)但由于美國數次背叛,態度多變,中國在博弈中慢慢走向對立的一方,最終演變成(對抗,對抗)即雙方都選擇不合作,損害了雙方的利益。游戲在反復進行面對中國想合作而美國選擇對抗的態度,只有不斷反擊美國的背叛,美國才會吃虧在隨后的博弈中,美國會改變對華戰略,從而從背叛走向合作。

征地
政府希望征用土地來促進城市建設,農民希望得到補償來彌補收入減少的損失。理想結果是:農民可以從政府設定的補償中受益;現實情況是:一些農民要價過高或采取激進措施反對征地,政府只能強制征收或重新談判,導致雙方利益受損。一方的選擇原本是希望給自己帶來更多的利益,結果卻是利益更少。
商業
價格戰
商業競爭對手降價搶占市場份額,最終導致整個行業利潤下降。假設商家1價格不變,商家2降價,消費者會被商家2吸引,商家2會獲得更多利潤;如果商家1降價,商家2會更降價,否則商家1會搶占商家2的客戶。因為我不不知道對方會不會降價,有些人會選擇降價來吸引游客最后的結果就是每個商家都選擇降價,陷入低價競爭的惡性循環。以快遞行業為例,以價換量的價格混戰導致行業發展陷入困境。
廣告
A、b是兩家公司,他們會理性選擇廣告策略會有四種情況:甲做廣告,乙做廣告;甲做廣告,乙不做廣告不打廣告;一個沒有 t做廣告,B做廣告;甲不打廣告,乙不打廣告。如果A不 t做廣告,B不做廣告t打廣告,兩家公司都會有利潤,而且利潤是對等的;如果A做廣告而B不做t打廣告,那么A利潤高,B利潤低,反之亦然;然后B也會跟風做廣告最終兩家公司的利潤都會因為廣告費用太高而減少。這里的最優解是兩家公司都不做廣告,但能提高整體市場收入。
領導決策
領導決策過程中有兩個決策者a和 B,有四種可能:較低級別的A執行,較低級別的B執行;下層A執行,下層B不執行;下級不執行a,下級執行B;下屬A不執行,下屬B不執行。對于A,無論B執行與否,最優解都是執行這樣才能獲得領導的賞識,對B也是如此,所以最優解是執行AB但如果把AB看成一個整體,領導決策的執行可能會受到贊賞批評,出錯的可能性更高。對于集體來說,沒有一個會把被批評的可能性降到最低。然而,在現實生活中,A和B為了提升自己的職位,將對方視為競爭對手,互不信任,選擇在不告知對方的情況下執行決策雖然有多做多錯的風險,但領導還是可以利用的“囚徒困境”使其決定得到實施。
司法
訴訟
作為公共物品的提供者,環境公益訴訟就是一個典型“集體行動”環境損害會對社會產生負外部性,但當環境損害的影響在個人之間平均分擔時,對當事人的影響很小。有訴訟資格的原告費用自理、風險自擔、在收益分成的前提下,為了個人利益,不會選擇訴訟,而是等著別人提起訴訟,坐享其成但是對于集體來說,結果是沒有人提起訴訟,因為這個活動帶來的私人利益小于社會利益,導致囚徒 的困境雖然訴訟對原告有利,但大家都選擇不提起訴訟。

司法執行
法院與被背信人之間是一種關系“靜態博弈”兩者之間有四種結局:被執行人履行判決時,法院采取相關執行措施;被執行人不履行判決的,法院應當采取相關強制執行措施;被執行人履行判決的,法院不采取相關執行措施;被執行人履行判決的,法院不采取相關執行措施。不同于普通的囚犯s困境博弈,雙方都沒有合作,沒有獲得最大利益,反而擴大了損失這是因為采取強制執行措施是法院的義務“非正常合作”最終雙方利益受損、結局二法院受損、結局三雙方獲利、第四種結果是被執行人受損。
審訊
在現實中,偵察機關在審訊過程中可以依賴它“囚徒困境”靠策略得到坦白是很罕見的,因為雙方都可以 不要達到絕對的理性在更理性的情況下,雙方可能會選擇不同時坦白,因為這樣可能會逃避懲罰。在囚徒 美國困境,博弈雙方都追求個人利益最大化的目標,但中國 s“坦白”制度帶來的預期收益與實際損失不成比例,導致不會陷入選擇的困境。現實的法律規則是:假設罪名可能判十年,如果兩人都否認,會因證據不足被判無罪; 如果兩人都坦白,各判八年;如果其中一個坦白了,、一人否認,從輕處罰六年,從重處罰十年。刑期相差不大,犯罪者更可能選擇否認。在這種情況下,有三種解決方案:一種是幫助嫌疑人分析利弊,做出理性選擇,也就是坦白;二是制造信息不對稱,防止合謀,讓對方做出更有利的選擇,也就是告白;三是找到利益的平衡點,也就是表白坦白對個人來說不是最優解,但對集體來說是最有利的。一般來說,一些犯罪情節輕微的共同犯罪比較容易通過“囚徒困境”策略找到突破口。
社會
見義勇為困境
一老太太在公交站臺摔倒,路人扶起她,被敲詐法院判賠,背離了社會主流價值,打擊了大眾的傳統道德觀念。
理論影響 編輯本段
博弈論研究者提出各種假設,研究人類的行為動機,并不斷補充、完善博弈論體系,成效顯著。學者道斯從合作與非合作行為動機的角度,認為部分參與者擔心只有單方面選擇合作才能獲得博弈的最低收益;有學者如Bacharach認為原因是人具有集體理性,追求利益最大化而不是個人利益,而Andreoni 認為是利他主義和聲譽促進了合作。互利共贏理論的本質是追求利益最大化。
基于囚犯 Selten和Stoecker 研究發現,只要對立的玩家愿意合作,并且看好對方 他們可以改變策略,在一些競爭中取得成功;利伯曼等學者研究了聲譽和虛擬名字對玩家選擇和合作的影響;Cox et al研究證實,文化差異對合作或非合作行為有很大影響。Boone 和Witteloustuijn討論 具有行為博弈或經濟博弈知識的參與者更有可能選擇合作行為。Sabater-Grande 和Georgentzis 討論了風險偏好類型的影響,指出風險厭惡者傾向于選擇背叛。孟祖輝認為, 名參與者 對人的信任也會影響他們的行為決策。馬本江和邱研究如何擺脫囚犯 得出的結論是博弈雙方在理性條件下增加了博弈的約束規則。
基于空間博弈模型,Perc 研究了空間囚徒困境中的隨機收入變化s困境博弈模型可以促進合作;諾瓦克和梅將空間網絡結構與囚徒 s困境博弈模型,指出個體之間的空間結構可以促進合作,并發現最佳的模仿策略可以促進合作的形成,提高整體合作水平。
基于不對稱博弈模型,紐曼-Watts 研究了囚犯 不對稱收入分配機制下的s困境博弈模型在某些情況下,窮人會被富人剝削,富人會更富在某些情況下,窮人會被富人救濟,財富會被重新分配。
附件列表
詞條內容僅供參考,如果您需要解決具體問題
(尤其在法律、醫學等領域),建議您咨詢相關領域專業人士。