為何權力關系中的零和博弈不是必然的:
基于領導人戰略行動的分析
作者:James H. Read,圣本尼迪克與圣約翰大學學院政治科學教授,研究方向為國內政治、政治思想史與政治權力;Ian Shapiro,耶魯大學政治科學教授,當代西方著名民主理論家,研究方向為民主、公正與社會探究方法。
來源:Read, J. H., & Shapiro, I. (2014). Transforming power relationships: Leadership, risk, and hope. American Political Science Review, 108(1), 40-53.
導讀
長期群體間沖突通常體現為囚徒困境——相比戰爭,兩個群體均更偏好和平,但是雙方的互不信任以及對相對收益的重視導致共贏難以實現。而本文認為,雙方領導人愿意承擔預期風險是使零和博弈獲得正和結果的必要條件。具體而言,領導人需要首先將雙方權力關系視作潛在正和,其次提高對手的談判地位,而后表現出對未來的積極預期并愿為此承擔高額個人風險。南非民主轉型時期,曼德拉與德克勒克表現出愿意承擔風險的領導風格,使雙方戰略困境得以解除,而此案例也向我們揭示了權力關系的變和(variable-sum)性質。此外,本文對北愛爾蘭問題及巴以沖突的分析也可體現這一領導風格的重要性。
引言
政治共同體之間的長期沖突往往可以用霍布斯的“自然狀態”與博弈論中的囚徒困境來描述,而無論是全知全能的主權者統治(all-powerful sovereign)、群體的相互分離(partition)還是民主選舉(democratic franchise)都不是解決沖突的關鍵。若要找尋真正的解決方案,就需首先打破“沖突在本質上是零和”的假定。這一假定之所以產生,是因為人們理所當然地認為敵對團體間的矛盾與價值觀念是不可調和的,卻忽略了沖突事件本身及其相關領導人的行動可以重塑人們對于沖突的偏好與信念。而本文作者突出了政治領導人的作用,指出領導人愿意承擔風險的行動(risk-embracing acts)是使零和沖突最終得到正和結果的必要條件,這種行動在本文中也被稱為“戰略上充滿希望的行動”(strategically hopeful action)。
下文將首先對阿克塞爾羅德(Robert Axelrod)、謝林(Thomas Schelling)與約瑟夫·科洛墨(Josep Colomer)的沖突與合作模型進行回顧,其次對“戰略上充滿希望的行動”進行闡述。而后,本文將對南非民主轉型進行案例分析,旨在解釋曼德拉與德克勒克的領導人行動如何使民主轉型成為可能。第四部分將北愛爾蘭問題與巴以沖突中的領導人行動作為反例進行分析。最后,本文將通過正反案例的分析,揭示作者想要表達的權力關系的變和性質。
有關沖突與合作模型的經典論述
1. 阿克塞爾羅德的“無限期囚徒困境重復博弈模型”
阿克塞爾羅德提出的“無限期囚徒困境重復博弈模型”可作為本文討論的起點。
傳統的囚徒困境認為,在合作情況下雙方絕大部分成員都能獲利,但由于互不信任,任意一方都沒有充分理由合作,因而無法實現潛在的互惠互利。這一情境適用于單輪博弈以及風險較高或回合數提前知曉的重復博弈。
然而,實際沖突的時長往往是不確定的,這就導致各方在策略上擁有更多可能。如果A知道要與B進行無限期地重復交流,那么A的利益偏好更傾向于合作并希望B能夠采取互惠(reciprocate)策略以合作為回應。而對于B而言,它的利益偏好也傾向于互惠,這是因為如果它采取欺騙策略,A會在下一輪博弈中采取相同策略進行報復。這就是“以牙還牙”(tit for tat,TFT)策略的精髓,即一方第一輪采取合作并在之后模仿對方上一輪的策略。阿克塞爾羅德通過對重復博弈的計算機模擬得出在一系列策略選項中,“以牙還牙”策略能提供最高的平均收益。然而該策略的缺點在于,模擬結果顯示在一對博弈關系中,采取“以牙還牙”策略一方的收益在每一輪博弈中都不會超過另一方,且“以牙還牙”方的收益總是低于以欺騙回應合作的對手。
在之后的研究中,阿克塞爾羅德專門研究了博弈中恢復合作的策略。這些策略包括“慷慨的以牙還牙”(generous TFT)與“懊悔的以牙還牙”(contrite TFT),其中前者指一方偶爾采取以合作回應對方欺騙的策略,后者指一方在對方采取欺騙回應己方上一輪的欺騙時,己方為“表達歉意”以合作作為回應的策略。上述恢復性策略的使用率在10%左右時是有效的,超過這一比例就容易被對方利用。
值得注意的是,阿克塞爾羅德模型并非基于理性主義通常理解的行動體追求效用最大化及偏好固定的假定。他認為,在現實的囚徒困境重復博弈情境中,彼此可持續合作的特殊經歷會改變雙方博弈的報酬(payoff)結構,即合作收益得到提高。因此,合作成功的過往經歷本身就能使雙方傾向于將博弈視為變和(variable-sum)而非零和的。而反過來,合作失敗會導致雙方產生“強烈的復仇心理”并加強將博弈視為零和的趨勢。
本文對該模型的批判主要基于兩點。
第一,現實中“戰略上充滿希望”的領導人的任務往往并非如阿克塞爾羅德所言的恢復合作,因為合作很可能在之前從未發生過。確切而言,他們所面臨的任務是構筑群體間的第一次合作并塑造持久的民眾支持。此外,他們需說服各自國內的強硬派采取談判方式解決問題或直接使后者邊緣化,否則連戰略博弈本身的性質都將難以確定,因為對強硬派而言,長期群體間沖突屬于零和沖突而非囚徒困境。
第二,阿克塞爾羅德的模型沒有考慮領導人的角色,而是以整個群體作為行動體來分析的,因而忽略了領導人在博弈中的不同作用。作為個體的領導人相比群體更樂意于開創新的、試驗性的合作策略。當然,領導人需獨自承擔政治行動失敗后被拋棄的風險,甚至存在被激進派暗殺的風險。因此,相較于群體間博弈的無限期重復性,領導人可能只有一次達成群體間合作的機會,而在單輪博弈中他們更可能選擇非合作策略以保證自己在國內的政治生命。由此可見,“戰略上充滿希望”的領導推進合作的過程必然是困難重重。
2. 謝林的變和模型
謝林模型中的變和含義不加贅述,而本文對其理論的主要批評在于兩點。
第一,謝林認為沖突的變和性質是預先給定的,而沒有考慮領導人在博弈中的言行對沖突性質的改變。然而,正是博弈中對沖突事實的不斷再造,合作才得以具有演化的可能性。
第二,謝林認為雙方偏好是各自獨立形成的,然而在某些情形下,雙方偏好會相互依賴,且會隨著博弈的進行而改變。
3. 科洛墨有關民主轉型的戰略博弈模型
科洛墨則更為細致地對民主轉型中的戰略博弈進行考察。他首先定義了六種戰略行為體聯盟,分別為激進民主反對派(radical democratic opposition)、溫和民主反對派(moderate democratic opposition)、激進的溫和派(radical soft-liners,主要改革推動者)、溫和的溫和派(moderate soft-liners,較不情愿的改革者)、溫和強硬派(moderate hard-liners)與激進強硬派(radical hard-liners)。在此基礎上,他試圖去解釋政府與民主反對派之間的沖突為何有時能夠達成較為穩定的妥協,而有時卻會觸發正面沖突,并主要論證以下幾個觀點:
第一,他與謝林一樣以變和為先決條件。
第二,不同于阿克塞爾羅德的是,他認為現實中的重要轉型更類似于單輪囚徒困境博弈,因為行為體在政權更迭時反復互動的機會很渺茫。
第三,在單輪囚徒困境中,他將產生合作歸因于行為體的遠見(foresight),而將雙輸結果歸因于短視的決定。這種遠見體現在領導人能夠準確預判對方反應,而不是如經典囚徒困境中的領導人只能同一時間進行盲選。
第四,他假定行為體的行動是靈活伸縮的。例如,如果反對派提出的折中方案遭到強硬派的反對,前者可以選擇恢復動員與抗議運動向后者施壓。
然而,本文對科洛墨的模型也有三點批評:
第一,他的遠見概念忽略了絕大部分人在大部分時間內的認知都是有限且僵化的。
第二,他低估了在頻繁變化且異常復雜的環境中行為體擁有遠見的困難性。
第三,他的模型并沒有突出個體領導相對于群體在轉型過程中所承擔的特殊風險,即領導人需擔負起在長期沖突與不信任的前提下表達合作意向并取得初步成果過程中的風險。科洛墨忽略了群體雙輸風險的降低有時是以領導人先行風險的提升為代價的。
領導人“戰略上充滿希望的行動”
“戰略上充滿希望的行動”指在面對無法衡量的復雜情形時一種特定的風險評估(calculated risk-taking)行動,旨在用更完善的重新分配結果取代破壞性的現狀。在政治與制度頻繁變化的時期,任何領導人都不可能預見甚至掌控大量涌現的事件。然而,講求技巧的領導人能夠估計對手面對未曾預料的開端時的可能反應,并通過行動提升該情境建設性的可能。
為了達成以上目標,“戰略上充滿希望的”領導人必須要滿足以下幾點:
第一,領導人對沖突的判斷必須首先是潛在正和的。對于權力變和性質的理解需要超越表面的政治得失,將整個群體的集體權力(collective power)考慮在內,而這種集體權力會隨領導人在合作嘗試上的成敗而改變。此外,他要說服對方也持有潛在正和的觀念。領導人不僅要解決信任問題,還要說服雙方的懷疑論者相信存在使雙方均獲利的潛在結果,即相信該戰略博弈是囚徒困境而非純粹的沖突。
第二,領導人必須知道如何克服群體在談判中一些立場互不相容的預設前提,而這些前提往往使囚徒困境惡化。各方都意圖確保己方的談判前提,因為他們認為放棄前提就相當于投降,因此沒有動機談判。對此,領導人必須在某種程度上避免順從于支持他的選民所設定的前提,同時也不能屈就于對手的前提,而當對手拒絕與之呼應時,領導人需要承擔失敗風險。
第三,領導人需要在政體轉型等動蕩時期利用相互依賴偏好(interdependent preferences)的機制發揮自身最大影響。具體而言,在國內制度或國際局勢發生快速轉變導致博弈結果難以預測時,博弈一方的目標將會更為依賴于對方發出的信號。在此情境下,領導人擁有走出第一步的機會——無論如何危險艱難,只要這第一步能得到對方的建設性回應,就有望改變對方的偏好和認知,產生對彼此的善意,并有助于后續雙方進一步做出突破性決策。
第四,領導人必須認識到,為了具備確保達成己方選民能夠接受的方案的權力,他們需要維持或加強對方談判領導人的權力。己方領導人必須抵住削弱或分化對手的誘惑,否則對手將無力說服他們的選民支持雙方達成的協議。
第五,與通過解決集體行動問題換取個人利益的、理性選擇式的一般領導人不同,“戰略上充滿希望的”領導人愿意搭上自身政治生命以解決之前所有嘗試都失敗的長期群體間沖突,而他們的志向純粹在于希望成為問題解決者而名垂青史。
“戰略上充滿希望的”領導人案例:
南非民主轉型時期的曼德拉與德克勒克
1. 曼德拉開啟與政府的秘密非正式會談
1985年,曼德拉決定在未經非洲人國民大會(African National Congress,下文簡稱非國大)執行委員會允許的情況下展開與國民黨(National Party)政府代表的秘密會談。彼時,雙方都對彼此之間的談判設定了諸多前提。非國大認為談判只能在政府撤銷對其與其他反種族隔離團體的法律禁令、釋放所有政治犯并允許政治抗議公開化的前提下進行談判,而國民黨認為必須在非國大永久放棄暴力并解散武裝后才能考慮談判。
在這種情況下,曼德拉基于以下幾點戰略觀察決定展開行動:
第一,他認為這場沖突是潛在正和的,屬于典型的囚徒困境。盡管雙方大都將其視為零和博弈,實際上他們卻都能夠從政治解決中獲得收益,否則均會在不斷升級的種族主義戰爭中損失慘重。盡管合作能獲得收益,雙方卻都認為擺出和談姿態是一種示弱或背叛的表現,因而若當前趨勢不變,雙方只會因不合作而雙輸。
第二,他認為,自己作為領導人為了解決這一困境必須先行一步,希望以此使雙方認知到正和的可能性并采取行動。然而,他明白這一行動有風險,因為一旦行動開始他就無法控制整個進程,且他的行動可能會使國民黨認為非國大軟弱從而在談判中變本加厲。
第三,他認為通過先行行動能夠將沖突風險內化到自己身上,從而減輕其他活動家的風險。由于他意識到自己的倡議可能會牽連到非國大,在事態脫離正軌時,他將強調自己是以個人名義與政府進行交涉,他的非國大同事可以通過宣布摒棄這位“無關緊要的老者”的倡議而減少政黨受到的破壞。
于是,當曼德拉依此開始行動后,盡管非國大內部對此意見分裂,但絕大部分同事還是以謹慎的態度愿意準許曼德拉繼續他的行動。他的行動得到了之前未曾預見的認可,也成為了南非從種族主義轉向種族包容的民主政體的關鍵一步。
2. 德克勒克推進新憲法談判的個人行動
德克勒克在1992年做的決定同樣十分關鍵且充滿風險。不同于曼德拉的秘密行動,德克勒克的冒險是公開的。1989年上臺后,德克勒克宣布開啟廢除種族歧視的改革,然而直到1992年,改革仍然嚴重受阻。
改革矛盾不僅出現在與對方的關系上,還出現在與己方支持者的關系上。
在與對方的關系上,政府與非國大有關新憲法方案的談判由于雙方不可逾越的鴻溝而失敗。具體而言,政府堅持保持包括白種人在內所有少數群體永久的、憲法賦予的否決權,而非國大力求完全多數統治(full majority rule)。因此,非國大并不信任政府能夠領導改革,沒有解散武裝而反而加強了群眾運動。另外,德克勒克和曼德拉的私人關系也比較糟糕,雙方互不信任。
在與己方支持者的關系上,德克勒克與支持其上臺的白人選民的關系惡化。在1991至1992年的遞補選舉中,反對改革的保守黨已經開始撬動德克勒克所在的國民黨的票倉,白人選民開始收回原先對國民黨改革議程的支持。通常情況下,德克勒克需要穩固其政治基礎并挽救國民黨的執政地位,盡管這意味者他要縮減或推遲現有的廢除種族隔離的計劃。
然而他面對改革矛盾沒有止步。1992年2月20日,德克勒克突然發起全民公決,詢問白人選民是否支持繼續1990年由總統宣布的、旨在通過談判達成新憲法的改革。此舉出乎了公眾與國民黨內部領導層的意料,為此他表明若全民公決失敗將會辭職。結果,通過他在三月全民公決期間的積極活動,最終獲得了68.7%的選票支持。塵埃落定后,德克勒克對他發起全民公決的行動做出了解釋——盡管人們對之前在遞補選舉中表達了對改革的不滿,但他預期當民眾直接面對是否繼續改革這一牽涉國家未來的問題時,他們仍會以大局為重表示支持。
然而,盡管全民公決的結果使德克勒克具備繼續推進改革的權威,若他仍然無法與非國大達成白人選民能夠接受的協議,他依然會被推出政治舞臺。此時,他基本化解了與其己方選民的矛盾,但與非國大的談判矛盾內容沒有改變。德克勒克意識到,若要完成新憲法的談判,他必須與曼德拉和非國大支持者進行合作,盡管之前國民黨與非國大之間的沖突已綿延幾十年。幸運的是,曼德拉也認識到談判中雙方領導人是相互依賴的,彼此都需要對方合作才能獲得成功。在這里,德克勒克與曼德拉已然將談判視為變和而非零和博弈,他們相信,談判失敗對所有人都不利,因為這意味著鎮壓、暴力與戰爭將持續下去。
最后,經過艱難的談判過程,國民黨做出了讓步,接受了未來國家由黑人群體進行多數統治,因而于1994年達成共識。雙方的領導人成功阻止南非民主轉型演變為流血沖突。
綜上,無論是曼德拉還是德克勒克,他們的政治雄心都激勵著他們在決定性時刻寧愿承擔職業甚至生命的風險,不顧其同僚的意見在分裂陣營中率先采取合作行動。
反例:北愛爾蘭的聯合派與共和派;以色列人與巴勒斯坦人
與南非民主轉型案例相對的是領導人們在北愛爾蘭問題與巴以沖突上的退縮。
就北愛爾蘭問題而言,盡管1998年《貝爾法斯特協議》的成功簽署是聯合派與共和派兩方領導人共同承擔風險的結果,但后續雙方的領導人缺乏勇氣且拖拉的行動使這一協議的執行充滿缺陷。例如,1998年聯合派領袖特林布爾面對即將舉行的有關是否通過協議的全民公投,竟在宣傳造勢時采取觀望態度;再如,共和派領袖亞當斯并沒有在協議達成后的前幾年及時說服愛爾蘭共和軍解除武裝。
巴以沖突的情況則更為嚴重。雙方在和解上屢次失敗的經歷,使雙方更為堅信沖突是源于某種根深蒂固的對立,而非屢次偶然選擇與領導失敗的結果。例如,20世紀90年代拉賓與阿拉法特有望達成和解,且雙方都獲得了客觀的群眾支持。1995年拉賓被一名反對和平進程的右翼分子所暗殺后,當民眾的怒火使以色列激進右派處于守勢且轉向更為強烈地支持兩國方案時,繼任者西蒙·佩雷斯原可以抓住這次機會進行政治冒險,提前舉行大選,贏得民眾對繼續和平進程的合法支持。然而,佩雷斯選擇迎合右派,允許對哈馬斯領導人的暗殺,加強對約旦河西岸與假設地帶的封鎖,并轟炸黎巴嫩的難民營,使以色列遭到巴勒斯坦激進派的反擊。他的行動使他疏遠了原本支持談判的民眾,從而葬送了機會。
變革:權力關系的變和性質
通過南非民主轉型的案例,作者想要糾正以往對權力及權力關系的理解偏誤。傳統的權力關系是零和的,即一方權力的增長阻礙了另一方的權力效果。然而,在曼德拉和德克勒克的博弈中,他們通過互動共同創造了新憲法賦予他們的、停止相互暴力的非零和的權力,因而從這一視角出發克服了囚徒困境。
此外,作者指出權力的零和和變和性可交織于同一博弈中,同一博弈的不同側面可以體現不同性質的權力。例如,從爭奪民主政體下敵對政黨競爭固定席位的角度出發,權力關系是零和的、競爭的,但從雙方互動中共同維持民主系統的權力來看,權力關系是變和的、合作的。
綜上,我們從以上分析中可以得出權力的零和假設是一個“自我實現的預言”——如果一方僅從權力的零和性出發采取行動,那么他就可以把整個博弈本身改造為純粹的零和博弈(因為對方也會以同樣方法視之作為回應)。因此,領導人在囚徒困境中對行動策略的選擇本質上而言是一種倫理選擇。
詞匯積累
囚徒困境
Prisoner’s dilemma
以牙還牙
Tit-for-tat
變和
Variable-sum
相互依賴偏好
Interdependent preferences
風險評估
Calculated risk-taking
譯者:阮辰陽,復旦大學國際關系與公共事務學院國際政治系本科生,研究興趣為國際安全與國際發展。
歡迎讀者批判性閱讀,如有疏漏請在留言區補充并給予新的解釋。我們將認真對待每位讀者的批評建議并將其顯示在留言區內,方便他者閱讀學習。
審校 | 王芷汀 趙怡雯
排版 | 殷晨浠 彭凌懿
文章評譯內容為公益分享,服務于學術科研教學工作,不代表國政學人觀點。