為什麼在囚徒困境中雙方的利己行為得到的是雙輸,在市場經濟中每個人利己行為的結果是共贏?
01-25
市場經濟中也不都是雙贏,但確實一般情況下還是可以有效運行的而非總是雙輸。這是因為囚徒困境是在許多假設條件下的一個模型,而現實經濟中情況要複雜的多。我們可以考慮針對每一個假設條件進行分析。前面已經有許多人各自說了一部分,我做一個不完善的小總結。1.有限次重複博弈。囚徒困境中是一個一次博弈,屬於有限次博弈的情況,在這種情況下由於「一鎚子買賣」的問題導致了囚徒各自選擇了對個人最有利但對整體最不利的選擇。但現實經濟中很多市場行為不是有限次而是無限次的,在無限次重複博弈中由於大家都要考慮到還有後面的合作問題,不能因為這一次的短暫個人利益導致長期的合作利益受損,所以會選擇對整體最大化但不一定是個人利益最大化的選擇。這裡要注意的是這裡的無限次重複博弈並不一定是指真的需要無限次重複下去(這對現實經濟中來說也不可能),只要是博弈次數不定就可以了,因為只要雙方不確定這一次是否是最後一次,他們就不得不考慮未來合作的可能,在實際效果上有限不定次的博弈與無限次重複博弈是一樣的。在市場經濟中,沒有人能預知未來,正所謂今天你對我愛理不理,明天我讓你高看不起,經濟主體並不能確定是不是將來再也沒有碰上這一次的夥伴的機會,所以他們並不一定會像囚徒困境中的「一鎚子買賣」那樣得到雙輸的結果。2.信息不對稱。囚徒困境中雙方都只能知道自己的選擇而無法知道對方的選擇,所以他們會做出雙輸的抉擇。而在市場經濟中雖然不能做到完全信息,但人們總會有各種各樣的方法來盡量收集信息以減少信息不對稱造成的損失。3.支付矩陣的影響。為什麼在囚徒困境問題中,雙方在做出個人利益最優的選擇下卻在整體上是雙輸的結果呢,這很大程度上是因為支付矩陣的問題。所謂支付矩陣通俗地說就是雙方在各種情況下所能獲得的回報的矩陣。要說明支付矩陣的影響單純地靠文字難以說明,所以我在這裡會拿出一個簡單例子分析。
假如警察抓到兩個囚徒,並規定,如果雙方都不坦白,因為證據不足,但出於震懾罪犯,雙方都判1年;如果都坦白,那就都判8年;如果一個坦白一個不坦白,那麼坦白的作為獎勵無罪釋放,不坦白作為不合作警方的處罰要重判15年。於是可以得到一個博弈矩陣



現在我們假設警察改變了處罰的規則,如果雙方都坦白,那麼由於沒有證據,只能將兩人都無罪釋放。其他兩種情況的處罰不變。於是支付矩陣變成如下圖所示。

主要原因有兩點:1、囚徒困境是單次博弈,參與者不會與對方有後續合作。而市場經濟下,雙方通常會有更多次的合作。選擇背叛意味著失去了後續合作的機會。(因此信譽好的企業,合作者更多,合作機會也更大)2、囚徒困境的支付矩陣和市場經濟不同。因為市場監管的存在,對背叛行為會施加外部的懲罰,因此「背叛、背叛」不再是納什均衡,背叛不再是理性的選擇。(因此監管力度大的市場,違約的可能性更小)
我感覺是因為,囚徒困境的決策是單次的,並相互沒有溝通;市場經濟的決策是多次的,並可以根據市場反饋修正自己行為。當囚徒困境可以進行多次,應該也會是共贏。但我不能肯定。
微觀經濟學有解釋的,是因為在市場經濟中,大家能充分的了解信息,儘管還是存在信息不完全,但是囚徒困境中,他們是不能交流的,也就是失去了了解信息這個渠道,所以做出的選擇只能是自身效用最大
因為博弈論和國富論不兼容?
市場經濟不一定是零和遊戲,正和的時候更容易出現多贏局面。
菜鳥也來答一個 靜態博弈和動態博弈導致的不同的結果吧。 囚徒困境中雙方不能溝通,市場經濟中人們通過不斷溝通取得共贏。
總結下來我認為有兩點吧:信息的通暢性和博弈的重複性。如果這兩點都不存在,那麼也會陷入囚徒困境,比如寡頭的一次博弈就是這樣。
prisoner dilemma是蠻經典的問題,在於如何定義payoff entry的值吧
每個人都想賣出股票,結果大量拋盤導致一字跌停誰也跑不了。還是知乎的老話,不問是不是就問為什麼的都是耍流氓。
市場經濟中個體追逐利益最大化的行為並不一定會導致雙贏,實際上這跟是不是市場經濟沒有什麼關係。囚徒困境是理性個體追逐個人利益最大化導致的,多次的囚徒困境重複後,會達到帕累托最優的均衡,即在不傷害某一個個體利益的前提下,無法再提高其他個體的利益。
囚徒困境在市場經濟中也非常常見,只不過可能由於多次重複而最終達到了比較理想的均衡狀態。
以上。因為情報的獲得量吧。囚徒困境每個人只有揭發和不揭發兩種選擇,兩人的選擇如圖(A為囚徒,○為揭發,X為不揭發。)

推薦閱讀:
※為什麼任何一個國家不能無限制的印刷錢幣?
※瑞銀信信用卡套現不是違法的嗎?
※經濟學究竟是一種思維,還是像物理學一樣的科學?
※「流動性陷阱」是什麼原因造成的?與「資產荒」之間有因果關係嗎?
