本文無意涉及所有西方法學政治學領域內的新動向,僅按照作者的興趣,從一個比較合理的關于制度理論的一般框架所具有的邏輯要素來組織有關的材料。 制度可以說是各種政治法律理論的核心對象。人類社會作為一種高度復雜的組織結構,在長期的進化過程中發展出一系列制度,用以規范調整人與自然以及人與人之間的關系。政治法律學說反映了人們對此的思考。我們所稱的新制度理論,特指二十世紀一批西方法學家,政治學家,經濟學家和哲學家用統一的方法(主要是經濟學,特別是博弈論)對制度問題的探索。 與西方政治法律思想史上的其它階段不同,當代制度理論發展的一大特征是,各種學說之間的交流和融合。由于使用共同的語言和方法,使得圍繞著制度問題的對話和討論能夠得到清晰的表述,對問題的回答和答案之間的分歧也非常顯明。這與傳統上不同學者或不同學派往往使用不同的概念和方法體系,理論之間不能互相翻譯和溝通相比,其好處是顯而易見的:第一,合乎“奧卡姆剃刀”(如無必要,勿設實體)和馬赫的思維經濟原則;第二,正象萊布尼茨所強調的,可以消除理論上不必要的爭論或者使爭論還原到不同理論前提。 而最近二三十年,社會科學,尤其是法學,政治學和經濟學的這種統一性的表現就在于,它們已經把基礎牢固地建立在博弈論(Game theory)上。博弈論,作為研究“在相互作用相互影響的環境中人們是如何行動”的工具,使得原來學科之間的界限變得模糊,學科的結合越來越緊密。原則上,我們所面對的世界是一個整體世界,所謂的法,道德,經濟,政治等概念只不過是我們用以描述世界的符號,所謂法學,政治學,經濟學等學科的劃分只不過是出于方便的考慮或者歸咎于我們對整體的無知而不得已的選擇。并且,法學是因對象而劃分的學科,它自己本身幾乎沒有特殊的研究方法。易言之,它的大部分研究方法都是從其它學科借鑒來的(當然,這絲毫無損于其論題的崇高)。至于選擇經濟學作為基礎工具,主要原因是歷史性的,因為博弈論這門數學分支的發展歷史中數理經濟學家們是起了關鍵作用的。今天經博弈論改造過的微觀經濟學已經被發展為關于人類行為選擇的學問。另外,微觀經濟學的核心,本質上就是研究制度問題的。 當然,今天的理論都是在繼承傳統的基礎上發展起來的,新制度理論深深植根于西方政治法律思想的傳統中。古希臘古羅馬甚至更早年代思想家提出的永恒性的制度問題,如正義,平等,效率等,依然是新制度理論家們思考的焦點;古典自然法學派及其社會契約論思想,邊沁的功利主義,實證主義等等也都被吸收進新制度理論的框架里;在方法上,數學工具是畢達哥拉斯和柏拉圖時代就強調的,霍布斯和斯賓諾莎等自然法學家也非常重視,馬克思在給拉法格的信中也指出其重要性,這在新制度理論中得到了系統的運用。 所謂社會科學,無非是從不同的方面來研究人們的社會行為,即研究如下四類問題:第一,人類社會是如何存在運行的,特別的,在一種制度環境中人們是如何行為的;第二,人類社會應該追求什么樣的目標;第三,為了實現這些目標,人類社會可以采取什么樣的制度安排;第四,隨著知識和技術的進步,制度是如何發展演進的。 博弈論(Game theory)、社會選擇(Social choice)理論、機制設計(Mechanism design)理論和制度變遷(institutional transformation)理論正是現代社會科學家們研究這幾類問題的的標準工具。它們之間存在著密切的內在聯系。博弈論是研究人們的行為是如何相互影響的,人們是如何在相互作用(interaction)之中作出自己的行為選擇和行為決策的。社會選擇理論所探討的是,對于每一種社會經濟環境,我們能否以及如何確定一個滿足某些價值規范的社會目標集合。如果回答是肯定的,并且接受人們是按照博弈論所刻畫的方式行為的,那么,機制設計理論則探究能否以及如何提供一個博弈框架(game form),使得在這個框架下的博弈均衡解是在社會選擇目標集合里,也就是說,社會選擇函數是可執行的(implementable),或者退而求其次,這種均衡解是無限接近于社會選擇目標集合的,也就是說可以近似地執行的。而制度變遷理論試圖說明,一個社會中的人們是如何從人與自然,人與人的博弈中學習和進化的,是如何運用其知識進行制度建構以規范其生活的,這個過程所體現的特征是什么,以及(特殊地)那些進行制度變革和創新的社會,對一個更基本的制度設計問題所應采取的態度和對策,等等。 在這四類問題上都有嚴格而系統的研究,薈萃了眾多理論成果。如馮諾意曼開創,納什(John Nash),豪爾紹尼(John Harsanyi),澤爾滕(Reinhard Selton)作出經典貢獻的博弈論;阿羅(Kenneth Arrow)關于社會選擇理論的著名的不可能性定理,森(Amartya Sen)的帕累托自由不可能性定理,以及豪爾紹尼的功利主義的社會福利函數和羅爾斯的正義論;赫爾維茨(Leonid Hurwicz)和馬斯金(Eric S. Maskin)的機制設計理論,格羅夫斯(Theodore Groves)等人關于公共物品提供的研究;布坎南(Buchanan,James)研究政治學的公共選擇理論及其憲法經濟學;賓莫爾(Ken Binmore)用博弈論對社會契約論的新研究;科斯(Ronald Coase)的交易成本理論;哈耶克(F. A. Hayek)關于制度演進的理論;諾斯(Douglas North)關于政治法律制度與經濟發展之間關系的制度變遷研究;等等。 但是,需要說明的是,新制度理論的大廈是集體的貢獻,許多開創者的價值是在后來者的勞動成果的輝映下才顯示出來的。
博弈論:關于人類行為的實證理論現在在社會科學尤其是數理經濟學中,關于人類行為的一般觀點,占主導地位的是“理性人”假設以及由此派生出來的博弈論。按照阿羅的說法,“理性(rationality)是關于選擇的。在任何給定的場景下,總有一個備選對象的機會集合,選擇必須從中作出。理性的主要意思就是,從不同的備選對象集合作出的選擇之間應該滿足的一致性(consistency)條件”。而每一次選擇都可以理解為,決策者對自己的各種可能的選擇所導致的各種結果都有一個偏好排序(preference ordering),這種偏好排序體現了決策者的效用(utility),在數學上可以表達為決策者最大化他的效用函數。原則上講,結果的任何要素都可以進入決策者的效用函數。“我們的經濟學主體可以是純粹的利己主義者,純粹的利他主義者,純粹的苦行僧,純粹的伊璧鳩魯主義者,或者是更有可能的,混合著這些動機的人”(Robbins,1935,pp95)。根據數學上的單調性我們可以區分利己主義(egoism),利他主義(altruism)和妒嫉(envy)型的效用函數。迄今為止,絕大多數經濟學理論都以利己主義為基礎。“經濟學的第一原理就是每個人都只受自我利益驅動”(Edgeworth,1881,p16)。利己主義在霍布斯的名著《利維坦》中關于自然狀態的描述中有著非常鮮明的刻畫。包括霍氏在內的所有自然法學家強調的核心,“自然律是理性所發現的誡條或一般法則。這種誡條或一般法則禁止人們去做損毀自己的生命或剝奪保全自己的手段的事情,并禁止人們不去做自己認為最有利于生命保全的事情”。無獨有偶,諾貝爾經濟學獎得主布坎南的主要貢獻也是在于把理性人假設引入政治學領域,開創了公共選擇理論。更進一步,由于人們經常面對的是具有風險和不確定性的局面,著名數學家馮諾意曼和經濟學家摩根斯頓在《博弈論和經濟行為》一書中建立了馮諾意曼-摩根斯頓型預期效用函數,它成為最正統的效用函數。 博弈論(Game theory)可以說是最近幾十年社會科學研究方法的最重要進展。1994年諾貝爾經濟學獎授予普林斯頓大學數學家約翰,納什(John Nash),匈牙利裔美籍經濟學家斯坦福大學的豪爾紹尼(Harsanyi,J.),德國經濟學家澤爾滕(Selten, R.),他們三人對博弈論的發展作出了決定性的貢獻。作為著力于研究“理性人的互動行為”(Aumann,1985,p35)的一門學科,博弈論幾乎可以被運用于經濟學和其它社會科學的各個領域。奧曼在權威的《帕爾格雷夫大辭典》中的《博弈論》條中對這門學科的歷史,它在八十年代中葉以前的發展成果作了精到的介紹。繼博弈論的開創者馮諾依曼和經濟學家摩根斯頓的巨著《競賽論和經濟行為》之后,九十年代的幾本教科書性質的專著(Fudenberg & Tirole, 1991; Myerson, 1991; Osborne & Rubinstein,1994),加上奧曼和哈特主編的百科全書式的《博弈論及其應用手冊》(Aumann & Hart, 1992, 1994),對博弈論作了全面系統甚至可以說是包羅萬象的處理。 博弈論首先是一門數學,眾多數學家開創了這門學科。二十世紀初的策梅羅(Zermelo),波雷爾(Borel)等人提出了一些零散的成果,甚至現代數理經濟學的鼻祖,十九世紀法國人古諾(Cournot)關于寡頭壟斷的分析里也已經有了后來納什提出的成為整個博弈論的核心概念的納什均衡的雛形。博弈論是循著從零和博弈到非零和博弈、從完全信息博弈到非完全信息博弈、從靜態博弈到動態博弈的路子發展的。博弈論早期的重大貢獻是著名數學家約翰馮諾意曼關于二人零和(zero-sum)博弈的最大最小定理。1950年納什完成其博士論文,并于次年據之修改發表了已經成為經典的《非合作博弈》(Nash, 1951),開創了非合作博弈的新局面,納什證明了任何策略型博弈都存在納什均衡,納什均衡成為最基本最重要的博弈解概念。后來大家發現納什均衡要求完全信息,而現實中更多的不完全信息博弈依然無法處理。豪爾紹尼(Harsanyi, 1967-8)提供了一個方案(Harsanyi doctrine),把不完全信息博弈轉化為貝葉斯博弈,并定義了貝葉斯博弈的納什均衡解,即貝葉斯-納什均衡。當代博弈解的研究幾乎都是圍繞納什均衡的加強與減弱進行的。 博弈論研究“理性人的互動行為”(Aumann,1985,p35),這意味著兩個前提:其一,博弈的結果是由所有人的行動共同決定的;其二,既然每個人都是理性的,會運用他所掌握的所有知識和信息選擇效用最大化的行為,那么他選擇行動時必須考慮別人同樣是理性的。博弈論的近期發展表明,它本質上依賴于兩個東西,即在它的模型內,博弈者的知識和技術。博弈者的技術決定了博弈的物理框架,即每個博弈者的策略集合,建立在策略組合上的支付函數等(在數學上,存在著無窮多種可能的博弈結構,而在社會科學意義上,選擇什么樣的博弈結構來解釋現實中的現象,正是博弈論學者需要著力的);而博弈是如何進行的,即什么樣的博弈解是合理的,則由博弈者的知識決定。所謂納什均衡,就是這樣一個策略組合,在其他人不改變策略的情況下,每一個人都不可能通過改變策略提高自己的所得(至于更弱和更強的博弈解,限于篇幅和本文的簡介目的,此處不做深入探討,有興趣的讀者可以參考有關文獻。)。下面我們以著名的“囚徒困境”(Prisoners‘ dilemma)來說明什么是納什均衡。作為博弈論中的一個著名例子,它受到的廣泛注意是無出其右的。并且我們從中可以看出個人理性和社會理性是如何發生沖突的。霍布斯認為,所謂自然狀態,就是“一切人反對一切人的戰爭狀態”,這在囚徒困境中可以得到部分說明。 囚徒困境假設:甲乙二人因偷竊被抓,檢察官向他們指出如圖所示的各種情況下的徒刑年數(右邊為相應的純效用結果)。我們可以看到,在這里,每個囚徒都有兩種戰略:坦白和抵賴。納什均衡就是兩個人都選擇坦白(這甚至是占優策略均衡,即每個人的策略對別人的任何策略總是最佳應對)。換句話說,不論對方如何選擇,個人最優選擇是坦白。因為假設乙抵賴,如果甲不坦白,二人各判2年,如果甲坦白,甲被釋放,乙判10年,所以坦白比不坦白要好;反之,假設乙坦白的情況下,如果甲抵賴,甲判10年,乙被釋放,如果甲亦坦白,則二人各判5年,所以坦白還是比不坦白要好。所以不論于甲于乙,坦白總比抵賴要好,最終結果是兩人都選擇坦白,各判5年。其實。如果兩個人都抵賴,各判2年,當然比都坦白各判5年要好,但這個帕累托改進辦不到。至于如何在不同的博弈結構里“走出”囚徒困境,大抵要依賴于多次博弈和某種非完全理性,比如“一報還一報”(所謂“己所不欲,勿施于人”)策略,此處也不多講了。
關于納什均衡作為博弈解用以描述人類行為的合理性,至少在納什那里有兩個解釋。其一,“在所討論的博弈中,對理性地進行博弈的可預期的行為的一個合理預測是什么?通過運用一些原則,如一個合理的預測應該是唯一的,參與人應能充分推理和利用知識,并且對于每一個參與人,關于其他參與人行動的知識將不會導致他的行動偏離這個合理的預期。這樣我們就得到上面我們定義的解的概念。 在這種解釋下,我們需要假定參與人交接整個博弈的結構,從而能各自推導出這個預期。這是一個理性和理想化要求很強的解釋”。博弈論里普遍知識方面的研究就是涉及它的。其二,“大眾行為”的解釋。“在經濟或國際政治的一些場合,利益集團不自覺地被卷入到一個非合作的博弈之中,這種不自覺使得這個場合變成了一個非合作博弈。 在這種解釋下, 假定參與人對整個博弈的結構有完全的知識或者有能力進行復雜的推理不是必需的。但是我們假定參與人能對他們的各種純策略的相對益處積累經驗性的信息。我們假定存在一定的參與人群并且這些參與人的“中間分子”運用純策略有一個穩定的平均頻率”(Nash,1951,Appendix,23,21)。現在很活躍的進化博弈理論可以認為是這個方向上的深化。
社會選擇理論社會選擇理論研究一個社會的價值規范問題,其核心在于個人和社會之間的關系,正如1998年諾貝爾經濟學獎得主森所說“它處理如何把個人利益,判斷和福利的集合轉化為社會福利,社會判斷和社會選擇的加總形式”(Sen, 1987, 382)。 所謂社會選擇,在數學上表達為一個建立在所有個人的偏好上的函數(或對應),該函數的性質代表了一定的價值規范,比如公民主權、全體性、匿名性、目標中性,帕累托最優性,無獨裁性等。社會選擇最重要的問題是,這些價值規范之間是否是邏輯上協調的。在這個意義上,社會選擇領域籠罩在兩個不可能性定理的巨大身影之下,即阿羅的不可能性定理和森的帕累托自由不可能性定理。 眾所周知,多數原則是現代社會廣泛接受的決策方法。洛克認為“根據自然和理性的法則,大多數具有全體的權力,因而大多數的行為被認為是全體的行為,也當然有決定權了”。但很多在自然法學家那里是想當然正確的東西在社會選擇理論中是需要證明的。 正面成果是梅(Robert May)在1952年證明的,即一個社會福利函數是多數投票型的,當且僅當它滿足匿名性,目標中性和正反映性。匿名性保證不會出現某一個人的意愿受到特別重視,也就是一人一票沒有特權;目標中性指在合法的和技術可行的范圍內,所有社會目標都受到同樣待遇;正反應性表明,如果原來社會喜歡甲勝過乙,現在有至少一個原來喜歡乙的人轉而喜歡甲,那么社會還應喜歡甲。這三條都是直覺上很合理的標準,而多數投票是唯一滿足它們的。 但是,早在十八世紀法國思想家孔多賽就提出了著名的“投票悖論”:假設甲乙丙三人,面對ABC三個備選方案,有如圖的偏好排序。由于甲乙都認為B好于C,根據少數服從多數原則,社會也應認為B好于C;同樣乙丙都認為C好于A,社會也應認為C好于A。所以社會認為B好于A。但是,甲丙都認為A好于B,所以出現矛盾。投票悖論反映了直觀上良好的民主機制潛在的不協調。1972年諾貝爾經濟學獎的獲得者肯尼思.阿羅,在他的《社會選擇與個人價值》(1951)中,證明了著名的阿羅不可能性定理,把這個投票悖論形式化了。在該書中,他運用數學工具把孔多塞的觀念嚴格化和一般化了。阿羅證明,不存在同時滿足如下四個基本公理的社會選擇函數:1)個人偏好的無限制性,即對一個社會可能存在的所有狀態,任何邏輯上可能的個人偏好都不應當先驗地被排除;2)弱帕累托原則,3)非相關目標獨立性,即關于一對社會目標的社會偏好序不受其它目標偏好序變化的影響;4),社會偏好的非獨裁性。 甲乙丙 a b c b c a c a b 帕累托最優是經濟學家和其他社會科學家用來衡量社會效率最常用、最普遍、甚至是唯一的指標,它指的是這樣一種狀態,即大家都好得不能再好,沒有一個人可以在不損害他人福利的前提下使自己的福利得以改善,而個人自由原則又是人類不懈的追求,二者都是人們直覺上能夠完全接受的標準。但是,森的研究表明,這兩個如此誘人的標準卻是矛盾的和無法同時成立的。與阿羅定理不同的是,森的定理非常簡單,它建立在三個基本前提假定之上:1),個人偏好的無限制性;2)帕累托原則;3),最小自由原則,即社會應當賦予至少兩個人各自在至少一對社會狀態之間有選擇權,如果他認為甲比乙好,社會不應干涉而應認同。用森的話說就是,如果你想趴著睡而不想躺著睡,社會應當認可。但是,森證明,對于二人以上的社會,不存在同時滿足上述三個條件的社會選擇函數(Sen, 1970)。因為,帕累托最優與最小自由原則結合在一起,會出現與阿羅不可能性定理所揭示的孔多塞投票悖論類似的循環性結果。 定理的意義可以用經丹尼斯 繆勒(Danis Muller)修正過的例子(森是它的原始作者)揭示出來。假設一個二人社會由好色的張三與拘謹的李四組成,他們面對著那本有名的《查特萊夫人的情人》。好色的張三希望由李四來讀這本書,但相比誰也不讀它而言,他寧肯自己來讀它;而拘謹的李四則希望最好大家都不讀這本書,但相對張三讀來說,還不如他自己來讀。如此則有下面的矩陣:
如果我們賦予李四選擇橫行的策略的權利,張三選擇縱列的權利。那么,對李四來說,(c,d)好于(a,b);對張三來說,(b,d)好于(a,c)。顯然李四選擇不讀,張三選擇讀,這個結果d帕累托劣于a。正如繆勒所指出的,上述矩陣類似于博弈論中著名的囚徒困境。 我們面臨的是與古希臘神話里那個推石上山的希緒索斯同樣的困境。正如俗話說的好,你不能既要馬兒跑,又要馬兒不吃草。森和阿羅的定理表明,我們并不是總能達到十全十美的境界(我們沒法魚與熊掌兼得)。這只是問題的一面,另一面是我們現實里能達到什么樣的境界,我們是怎么饒開這些“不可能困境”而避免落入悖論的呢?或者說,如果這些尷尬是避免不了的,那么我們在現實中是如何區分民主與非民主,自由與非自由社會的呢? 這兩個定理都是建立在序數偏好上的,一個直覺上很誘人的思路是,如果利用基數偏好提供的更多的信息是否能夠走出這些困境,這意味著放棄阿羅的不相關選擇目標的獨立性條件。森后期的研究很大一部分集中在這個方面,即如何測度效用,以建立能讓人們接受的社會選擇規則。鑒于森的重大貢獻,他獲得了1998年諾貝爾經濟學獎。 基數偏好意味著人際間的效用比較。豪爾紹尼和羅爾斯(有些文獻認為羅爾斯的理論不必需要技術偏好)據此得到了他們的著名結果。社會選擇理論研究的很大一部分是圍繞著這兩個結果展開的。 豪爾紹尼(Harsanyi, 1955)的可加總的社會福利函數,可以看作是邊沁的功利主義主張“最大多數人的最大幸福”的形式化。盧梭曾寫道:“公意只考慮到公共的利益,而眾意則考慮到個人的利益;眾意是個別意志的總合。但是,在眾意里去掉其正負相抵消的部分,則減余的部分是公意”。后來以邊沁為代表的功利主義者也主張最大多數人的功利的最大化。豪爾紹尼(John Harsanyi,1955)建立了一個可加總的社會福利函數,才真正使我們看清楚了什么前提下我們可以接受這種功利主義的觀念,最主要的是我們假設每個人都是預期效用最大化行為者,并且假設“一個人有相同的可能性被置于社會的任何具體成員的位置上”(Harsanyi, 1953,435)。他的定理指出,社會福利函數可以表達為,賦予每個人的效用一定權重,根據這些權重進行加總(如果在考慮到平等原則,就是個人效用的簡單加總)。定理的前提中包含了社會福利函數和個人效用函數一樣都是基數的,并且滿足馮諾依曼-摩根斯頓公理或等價的前提。 與豪爾紹尼不同的是,羅爾斯正義論不是建立在嚴格數學論證的基礎上,甚至包含某些不協調。但無論如何,這是一項重要的貢獻。原來人們對公平的理解通常是平均分配(所有社會資源和產品在每個人之間的平均分配)和無妒嫉型分配(即沒有人會妒嫉他人的處境),羅爾斯提出了另一個很有吸引力的標準。他認為正義應該滿足如下兩個原則:其一,每個人都有關于平等的基本自由的最廣泛配置(與所有人的類似自由配置相容)的平等權利;其二,社會和經濟的不平等要符合兩個條件,a)他們應使社會中處境最糟糕的成員相對的預期效用最大(最大最小公平原則)b)并且附以在機會的公正平等條件下職位和地位向所有人開放(Rawls, 1972,p55)。這些原則之間滿足詞典式排序。在這些原則中,真正引起爭議的是最大最小原則。羅爾斯曾羅列了接受這個原則的幾點理由:很可信的正常的風險回避(給定初始地位的特殊細節);要求的信息不多;作為一個公共原則較為適宜;承擔義務的張力較弱(Rawls, 1974)。與豪爾紹尼類似,假設所有人處在一個“無知之幕”后面的前提起著重要作用。執行這個原則會導向一種極端的“分配正義”,普拉特證明存在一個不可能性結果:羅爾斯型的正義論會使一個人具有獨裁性,由他來決定誰是處境最糟糕的人(Plott, 1976)。哈耶克也指出:“分配正義原則,除非整個社會都被組織得與其一致,否則就不能執行。這將產生一個在所有重要方面都是自由社會反面的社會,在這種社會里,權威決定了個人要做什么和如何去做”(Hayek, 1960, p100)。 由于森后期的研究與豪爾紹尼和羅爾斯遵循的是同一個思路,我們有必要適當討論一下個人自由原則。在森看來,個人自由意味著,對于社會中的每一個人都至少在某一選擇上有被社會認同的自由,其本意在于給每個人以一定的個人空間,使得他在這個空間內作出的選擇能夠得到社會的認可。但是,森對自由的定義和刻畫存在著一些問題,如果用博弈論的實證語言來描述社會、制度和權利的話,那么,一個社會的存在狀態就是個人決策與環境共同作用的結果。這樣,自由實際上已經被賦予在博弈框架內,個人的策略范圍就是他的自由的界限。或者說,在技術賦予的可能范圍內,制度通過對博弈結果的影響限制了博弈者的合理策略集合。基本自由體現在個人對備選策略的選擇權上,所以我們總是存在著最小的自由。至于個人自由選擇是否總是能夠導致帕累托最優,從囚徒困境給我們的啟發看,在一般意義上大部分博弈的結果是非帕累托最優的(杜比有一個定理證明了這點)。結合豪爾紹尼和羅爾斯的貢獻(僅僅在社會選擇意義上,他們的研究都是無可非議的),我們可以提出這樣一個問題:能否有一個全知全能而又不懷私心的裁判或中央計劃者,或者一個所謂民主的集中的決策程序,通過它確立一個社會目標,這個目標滿足帕累托最優以及更廣泛的其他社會選擇規則,并且進一步找到一種構造式的可操作可控制的直接實現目標的方法。特殊地說,是否有這樣一種可能,既然自由和帕累托最優如魚和熊掌不可兼得,那么,通過一個限制或代替個人自由的集中決策程序,就可以直接實現帕累托最優(這實際上是一個機制設計問題,后面要討論)。 最后,我們引用森對社會選擇理論的總結性評述:“社會選擇理論在過去幾十年受到極大關注的理由之一是和它處理的領域的重要性聯系在一起的(在廣泛意義上這個領域刻畫了理論的特征)。另一個原因在于,它在把含蓄的思想明確化,保持這些思想含義的一致性和明晰性方面碩果累累。作為一種方法論學科,社會選擇理論在澄清早先是模糊的問題上卓有成效。盡管不顧一切地堅持明晰性也有一些限制(有時用于社會選擇理論的公理結構的狹窄性確實被視為一種局限),但在分析涉及集體加總的經濟,社會和政治問題時,社會選擇理論與其它方法論傳統相比無疑很有創造性。要對本文所述及的眾多文獻作出判斷,看看它們在澄清含混解釋模糊方面的成就即可。也許所謂成功是令人喜憂參半的,但這乃是意料之中的”(Sen, 1987, 389)。
機制設計理論與制度安排社會選擇理論是一種抽象的規范理論,從元理論的角度來看,研究者可以假設他作為一個客觀的觀察者,了解所有人的偏好,從而能夠確定那些帕累托最優點以及其它一些合理的社會選擇目標。但是,在機制設計理論中,機制設計者沒有也不可能了解所有信息,問題在于,在信息不完全(不具備可觀察性(observable),可測度性(measurable)或可確認性(verifiable))的情況下,如何設計出有效的制度。哈耶克認為:“社會理論的整個任務,乃在于這樣一種努力,解釋整個經濟活動的秩序是如何實現的:這個過程運用了大量的知識,但這些知識并不是集中在任何單個人腦中的知識,而僅僅是作為不計其數的不同的個人的分立的知識而存在的。”(Hayek,1967)。假如能夠了解和掌握全部信息,那么,機制設計就只是一個簡單的優化計算問題,象計劃經濟那樣的直接控制和強制命令就是最好的制度。這樣也就不存在什么機制設計問題。 機制設計理論的思想淵源可以追溯到30年代關于社會主義的大論戰。米塞斯指出,“自由主義和社會主義,兩者都獻身于全人類的善,它們之間的區別不在于它們的目標,而在于它們用以達到最終目標的手段[Mises, 1985]”。論戰的另一方主將之一蘭格的學生,美國數理經濟學家利奧.赫維茲(他引入了至關重要的激勵相容(incentive compatibility)概念)在六七十年代創立了機制設計理論,嘗試對這些問題作出回答。 機制設計需要解決兩個問題:一是信息成本問題,即所設計的機制需要較少的關于消費者、生產者以及其他經濟活動參與者的信息和信息(運行)成本。任何一個經濟機制的設計和執行都需要信息傳遞,而信息傳遞是需要花費成本的,因此,對于制度設計者來說,自然是信息空間的維數越小越好。喬丹(Jordan,1982)證明,對于新古典經濟環境類,不存在其他經濟機制(包括市場社會主義)既能導致資源有效配置,又比競爭市場機制使用了更少的信息,后者是唯一的信息空間最小且有效的經濟機制。這就部分證明了哈耶克在30年代大論戰中作出的判斷。 二是機制的激勵問題或積極性問題,即在所設計的機制下,使得各個參與者在追求個人利益的同時能夠達到設計者所設定的目標。在不同的博弈行為假設下,機制設計理論會有不同的結果。首先受到關注的是占優策略(dominant strategy)。所謂占優策略,就是一種以不變應萬變的策略,不管別人采取什么策略,我的策略總是致勝之道。問題在于,講真話不滿足激勵相容約束,在別人都講真話的時候,必然會有一個人,他可以通過說謊而得到好處。如薩繆爾森在討論公共物品的提供問題時指出:“對每個人來說這是符合自我利益的,發出錯誤的信號,在一個給定的集體消費行為中假裝只有比真實所得更小的好處”(Samulson,1954,pp 388-9)。 那么,什么時候或者說在什么樣的機制下人們愿意講真話呢?只有當社會選擇的規則只照顧一個人的利益的時候,這個人才有動力講真話,這時,其他人講假話沒有什么好處,講真話也沒有什么壞處,講講真話也無所謂,所以能被占優策略均衡所執行的社會選擇規則只能是獨裁性的。這就是吉巴德-薩特斯維特的操縱定理。通過虛假顯示自己的偏好可以操縱最后結果以使自己得利。我們再通過投票問題說明這個定理(如圖是甲乙丙三人的真實偏好)。 甲乙丙 a b c b c b c a a 對于丙來說,如果他真實地顯示偏好,那么顯而易見只能是他比較不喜歡的b當選,因為兩兩比較,則b好于a并且b好于c。如果他顯示自己的偏好是c好于a好于b,那么兩兩比較,則c好于a,a又好于b,最終是他喜歡的c當選。 赫維茲的“真實顯示偏好”不可能性定理(Hurwitz, 1972)是一個類似結論。在個人經濟環境中,在參與性約束條件下(即導致的配置應是個人理性的),不存在一個有效的分散化的經濟機制(包括市場競爭機制),能夠導致帕累托最優配置,并使人們有動力去顯示自己的真實信息,也就是說,真實顯示偏好和資源的帕累托最優配置是不可能同時達到的。因為,如果一個人愿意講真話,那就意味著講真話是他的占優策略。因此,在機制設計中,要想得到能夠產生帕累托最優配置的機制,很多時候必須必須放棄占優均衡假設,即放棄每個人都講真話辦真事的假定。 至于在納什均衡行為假設下以及其它博弈解概念下的機制設計問題,在這篇綜述里就不涉及了,有興趣的讀者可以參考許多原始文獻,筆者的博士論文里面也會有詳細的介紹。我們想強調的是,任何制度安排和機制設計,都不得不考慮激勵問題。我們要實現某一個目標,首先要使這個目標是在技術可行性(feasible)范圍內;其次,我們要使它滿足個人理性,即參與性,如果一個人不參與你提供的博弈,因為他有更好的選擇,那么你的機制設計就是虛設的;第三,它要滿足激勵相容約束,要使個人自利行為自愿實現制度的目標。孟德斯鳩在《論法的精神》里有一個絕妙的例子。中國通常對搶劫罪的處罰是徒刑,而俄國的處罰則是死刑,結果導致的是,在俄國因搶劫而殺人的案子非常多,因為只有死人才不會指控一個人犯搶劫罪。所以不適當的立法往往與立法的美好愿望南轅北轍。 我們有必要在此提一下著名的科斯定理。雖然科斯指出“在零交易費用的情況下,資源配置不受法律規定影響的觀點也表明:在正交易費用的情況下,法律在決定資源如何利用方面起著極為重要的作用”(科斯,1994,322),但是即使是零交易費用情況下,并非一定能實現帕累托最優。聯系前述森的例子,吉巴德(Gibbard) 和凱萊(Kelley)等人基于一個強烈的契約自由的自由主義傳統,主張人們的可讓渡的權利(alienable right)即 放棄權利的權利(right to give up right)。在這個故事里,李四可以向張三保證他會看這本書以換取張三的不讀它,這樣通過自愿的權利轉移實現了帕累托改善。但問題是這個棄權方法也只是在包括此例的一部分問題中有效,在很大一類情形下就沒有合適的社會選擇結果了。并且它的能否執行是成問題的,因為,在缺少信息透明度(如沒有有效的“法庭”來確認)的情況下顯然兩個人都有動力違背這個契約。顯然,交易費用尚未成為一個可測度的概念,而外在的“法庭確認”以及廣義的“制度運行成本"(阿羅)應屬交易費用之列。 現在我們回到前面提出的問題,結合機制設計理論的其他成果,我們可以更好地理解它了。完全集中決策體制確立的社會目標即使是合意的,也是難以企及的,在執行中會遇到來自信息和激勵兩個方面無法解決的困難。“如果有一些全知全能的人,如果我們不僅知道那些影響我們獲得現在想要東西的因素,而且知道我們將來的欲望和需要,那么自由就沒有什么地盤了。為了給不可預見和不可確知的事物留有空間自由是不可缺的。所有自由的制度都是對這個基本的無知的事實的適應,以處置機會和可能性而不是確定性。”(Hayek, 1960, p29) 現在我們簡要考慮一下更深層的保證制度得以執行的制度問題,即應該提供足夠的激勵,使制度執行者在追求自我利益的過程中也實現我們(作為制度設計者)希望的社會整體利益。從機制設計的角度可以把問題具體化為這樣一個激勵問題,即,人類社會如何選出制度執行者,以及如果他們是自利的,容易利用自己的執行權力損害社會利益時,如何設計一套制度監督約束他們。用委托代理(principle-agent)理論的框架來表述,那就是:我們不具有某種特殊的知識,只好委托一些人代理某些事情。我們憑什么知識篩選識別出宣稱自己擁有這種知識的代理人呢?我們又憑什么制度使這些代理人不會利用自己的特殊知識作出損害我們的事情呢?。 既然我們不能改變人們追求自我利益的本性,我們就不能寄希望于我們會幸運地遇到利他主義者這樣一種小概率事件。我們的制度必須從這樣一種假設出發:如果我們的代理人是個利己主義者,我們如何在他追求自我利益的同時不致損害我們的利益,進而讓他的追求個人成功和個人福利的行為最大程度地為社會服務。于是,途徑也就很明了:一是我們要盡量保持信息的通暢,使得言論和新聞出版自由成為對執行權力的監督;二是從委托-代理理論可以得到的啟示是,我們不僅可以利用事后罷免的“威脅”激勵制度執行者在實現自我利益的同時,為委托人的利益服務,而且可以設計一個“代理人市場”,讓代理人之間的競爭而不是“聯盟”產生自動的激勵,這可以認為是西方多黨競爭,三權分立理論的一個說明。孟德斯鳩也早就說過:“從事物的性質來說,要防止濫用權力,就必須以權力制約權力”。所以,良好的制度必須賦予人民挑選制度執行者的權力,而在后者不具備才能或假公濟私的時候還有罷免他的權力。道理很簡單,人民可能不是很具備制度知識,但他們具備鑒別制度執行者行為后果是否對他們有利的知識,并且他們至少具有學習能力,會以“干中學”的方式不斷充實他們的制度知識。 機制設計理論的著眼點不僅是要指出種種不可能性的困境,更重要的是要提供具體環境下走出困境的途徑。人類創造了很多能夠誘導人們顯示并測度他們的效用的技術和制度,如拍賣和招標投標制度;也有很多理論對各種經濟環境設計出了相應的激勵機制,如克拉克-格羅夫斯-萊德亞德機制;很多局部的效用測度和比較也是可行的。人們有充分的理由否定完全的集中決策,也會明智地讓個人決策受到某種集體意志的約束而避免完全的無政府狀態。人類社會的現實選擇本來就是理性設計和個人自由發揮的結合,二者之間的界限和結合方式是隨著知識的積累和技術的進步而不斷發展變化的,而不同的界限和結合又直接影響著人們能夠得到什么樣的知識和技術。這是一個問題不斷產生又不斷得到解決的復雜過程。而這也使我們自然進入了制度變遷的領域。
進化經濟學與制度變遷理論當我們討論機制設計的時候,是假設邏輯上有無窮多種機制可供選擇,一個社會技術上也能夠隨心所欲地選擇制度。但經驗上一個社會可選擇的制度是非常有限的。進化經濟學與制度變遷理論試圖對社會的制度選擇作出更細致的刻畫,以解釋歷史上那些特殊制度的產生與發展。 制度變遷理論的基本分析框架是建立在制度、知識(技術)、信息、博弈上的。如果我們以知識籠統地概括知識、技術和信息(知識和技術的區別類似于理論和應用,我們不作嚴格區分,而從信號中提取信息則是由知識和技術決定的),那么人類社會的組織運作方式自本能經由習慣向制度的演化過程中,知識與知識進步扮演了一個關鍵角色。作為自然進化過程中的產物,人類總是在與外界(自然、社會和他人)進行著博弈,他的博弈工具實際上就是他的知識。制度也不過是一種特殊的知識和技術而已。一方面,制度和人的知識與技術一道決定著游戲的玩法(策略),知識與技術決定了所有可能的玩法,信息篩選掉了不必要的玩法,而制度告訴你不能采用的玩法;另一方面,制度還是一個被玩的對象。在決定一個游戲規則的游戲中,有的社會只讓一個人玩,有的是一小群人來玩,有的是所有人來玩(原則上,博弈論的觀點認為是每個人都參加的,只不過更基本的玩法(制度)決定了誰有資格玩或者說誰說話的份量更重);有的社會是以投票的方式來玩,有的是以鈔票發言,有的甚至是用刺刀和機槍來表決的。而所有這些行為,在行為者本人看來,都是在他更基本的技術和信息范圍內的最佳選擇,否則他就不會這么作。 政治法律制度的產生發展,反映了人們的制度知識以及關于“制度的制度”的知識的變遷。為了在競爭的個人實現自我價值的同時使社會的共同利益得到實現,避免“囚徒困境”所揭示的個人理性和集體理性的沖突,人們從經驗中認識到社會需要制度和制度的執行者,用以規范個人行為或提供公共產品,由此出現了社會的公共管理部門或曰公共權力部門;當然人類社會之復雜性也會使得公共權力部門及其人員有可能或因其自利行為,或因其知識之不足,而損害社會的整體利益,由此引申出如何規范約束公共權力部門的問題,于是憲政知識與憲政制度被人們所追尋、設計并得以建立、發展。 人類政治法律制度作為一種知識的高度凝聚,探討人類社會整體應該實現的價值目標(社會選擇),解釋并預測社會個體和團體,尤其是公共權力部門是如何活動的或可能如何活動(博弈理論),指出為了實現社會目標應該采取什么行動即制定什么樣的相應制度(機制設計)。進一步說,憲政制度作為政治運作的一種知識和技術的表現,還取決于那些更深層的習慣和傳統(包括人們基本的生活方式、思維方式及宗教與道德等)。因為人們是生活在傳統和習慣賦予他們的經驗中的。當然,現實中的任何社會,其制度知識都是不完備的,因而其發展表現為一個動態演進的復雜過程。 由于人們的生活方式和對自然、社會、人生的思維方式的區別,每種社會的具體制度選擇也各有差異,并且這種差異會由于人們對其已有經驗和知識的依賴而得到強化,使得不同社會的結構形態和實際運作千姿百態。那些穩定下來的制度以及相關的知識,給生活在制度下的人們以足夠的信息,使他會預期到自己的行為選擇的后果,不會輕易選擇制度所不允許的行動方式,更難得主動去改變現行制度(因此我們在古今中外會發現許多低效率的制度竟然有著持久的生命力)。制度和制度調整下的行為就這樣形成一個自增強的穩定的“雞生蛋、蛋生雞”的循環機制,即所謂的路徑依賴(path-dependent)和鎖定(lock-in)效應(Arthur, 1990)。也就是說,最初的選擇決定了后來的整個過程。特別地,對于一個變革社會而言,這種路徑依賴和鎖定效應,大大增加了學習其他文明成果、推動社會制度變革的難度和變革過程中的波折。那些微小的變革努力在這種封閉社會中,只會被消弭于無形。社會結構和制度的突變和躍遷,只能取決于其內部的強烈震動或外部的巨大沖擊。但是我們必須區分那種僅僅是表現為利益再分配形式的突變,即便它是如何的轟轟烈烈。我們未必完全贊同“個人擁有現狀不可侵犯的權利作為基本的公理(Buchanan,1962,371-384)”,但我們也可常見,如果沒有輔之以人們觀念和知識上的變革準備,那些想畢其功于一役的大變動要么是不可行的,要么徒增社會震蕩而后又被傳統和習慣所拉回。。 強調傳統文化和習慣的力量并不是否認發生制度變革的可能性。 這里有必要討論一下哈耶克“合作秩序的擴展”的概念。哈耶克把西方社會與市場經濟相關聯的一整套制度的發展過程理解為“人類合作的擴展秩序”(Hayek, 1988)。粗看起來,非西方社會欲學習西方的自由市場和多元民主制度都表現為發展中的不連續,是一種原來秩序的中止,哈氏的邏輯是很難解釋清楚這種學習的可行性的(這并不意味著兩者一定是沖突的)。一個社會的制度與知識是分層次的。 我們的知識和制度都是長期進化的產物,生存使我們知道如何運用知識實現某個目標,進化要求我們能夠判斷并決定(這種判斷據以作出的知識是一種元知識)哪些知識是應該丟棄的,哪些是該堅持的,哪些是該學習的。也就是說,我們的知識區分為基本的與派生的,前者是相比較更穩定的,后者附麗于其上但有相對的獨立性(否則應該是同一層次的),在現實里最基本的知識是那些直覺性、本能性的東西,是歷史賦予我們且經過時間考驗而得以保持的穩定知識,就象最基本的制度是自然規律一樣[哈耶克認為,“自發社會秩序立基于下述兩種規則:第一種是先天的,遺傳繼承的關于人的行為的普遍規則,它們形成于人種的生物進化的過程;第二種是習得的,文化傳承的關于人的行為的規則。”第一種構成所有社會科學不言而喻的前提(Hayek, 1973)。改變那些派生的知識或制度是簡單的,而改變相當深層的更基本的東西困難則要大得多,那需要更多的時間和學習。一種新思想理論的引入,或者說一種新觀念的被接受是一個長期的過程,足夠長的時間會使它們最終能夠跳出傳統和習慣的束縛。 另外,強調過去歷史的決定作用也并不意味著,否認社會個體的能動性和變革過程中的偶然性。制度對個體的約束是有限的,這種約束建立在個體對他人行為的預期和對違反制度行為的風險的判斷上。在已有技術和知識準備的前提下,個體主動的奮爭和偶然的試探行為有可能生長發育到主導全局的結果。路徑依賴本身就說明,偶然性在事物發展的臨界點上往往會起著關鍵性作用,甚至影響了不同的歷史進程。只不過這個過程是復雜的,其路徑不會那么簡單明了。 從機制設計理論我們知道,評價一個制度的效率時往往從激勵和信息兩個方面來衡量。前者要求制度應能使個人在追逐自我利益的同時,有動力實現制度設計者所希望達到的對整個社會有利的目標,而后者則要求制度運作所需知識的復雜度不會超出社會整體知識水平之上。所以,僅僅知道什么制度是好制度無助于在實踐中實現這種制度,僅僅知道一個事物的存在與把它具體構造出來所需要的知識的復雜度是不一樣的。那些穩定制度背后都有一段漫長的歷史,維護制度的“制度”或知識正是從歷史中經過反復試錯學習到的。制度的存在性和穩定性是依賴于那些基礎性知識的存在性的,博弈論圍繞囚徒困境的研究尤其表明,合作制度能夠抵擋住非合作行為的誘惑而創生并鞏固下來,是建立在關于他人能夠合作的知識和信念上的。 對于一個致力于制度創新的過渡社會來講,這就要求制度變革的發起者,全面把握傳統思想和現實力量對個人和各種組織行為的作用,從社會知識結構最深層里尋找新制度的生長點,在個人自利性、對策性行為導致的紛繁復雜的可能性中找到真正有效的實現途徑。 參考文獻 Kenneth Arrow, 1951,1963, Social choice and individual value, Weiley press cooperation. Arthur, W. Brian, 1988,“Self-reinforcing Mechanisms in Economics”, in Philip W. Anderson, Kenneth J. Arrow , and David Pines (ed.)The Economy as an Evolving Complex System", Reading, MA.. Addison-Wesley. Robert Aumann, ed., Handbook of game theory and applications, North Holland Press, 1994. Robert Aumann, What is game theory trying to accomplish?in Kenneth J. Arrow and Seppo Honkapohja (ed.),1985, Frontiers of economics, Basil Blackwell Ltd.. Robert Aumann, Game theory, in John Eatwell, Murray Milgate & Peter Newman(eds.): The New Palgrave: A Dictionary of Economics, vol. 2, The Macmillan Press Limited, 1987. Ken Binmore: Playing fair: Game theory and the social contract (volume I), MIT, 1994. Black, D., 1958, The theory of committees and elections. Cambridge: Cambridge university press. Buchanan,James, M. (1959), Positive economics, welfare economics, and political economics. Journal of law and economics 2 (October): 124-138. Buchanan,J.,M., Stubblebine, W. Craig (1962). Externality, Economic 29 (November): 371-384. 布坎南,《自由、市場與國家》,北京經濟學院出版社 Ronald Coase: The problem of social cost, Journal of law and economics 3(1), 1-44, October, 1960. Edgeworth,F. Y. (1881), Mathematics psychics, London: Kegan Paul. Fudenberg and Tirole, Game theory, MIT Press,1991. Allan Gibbard: Manipulation of voting schemes: A general result. Econometric 41: 587-602, 1973. John Harsanyi: Cardinal utility in welfare economics and in the theory of risk taking, JPE 61, 434-435, 1953. John Harsanyi: Cardinal welfare, individualistic ethics, and interpersonal comparisons of utility, JPE63, 309-321, 1955. John Harsanyi: Games of incomplete information played by Bayesian players, Management Science 14, 159-182, 320-329, 486-502, 1967-1968. F. A. Hayek, The constitution of liberty, London: Routledge & Kegan Paul, 1960. Hayek, Studies in Philosophy, Politics, and Economics, Routledge and Paul. 1967. P92. F. A. Hayek, "Law, legislation and liberty: rules and order(I)", The University of Chicago P ress,1973. Hayek, The Fatal Conceit, University of Chicago Press, 1988. 霍奇遜《現代制度主義經濟學宣言》中譯本,北京大學出版社,1993年。 Hurwicz: On informational decentralized systems. In Decision and organization, ed. R. Radner and C. B. McGuire, 297-336. Amsterdam: North-Holland Publishing Co. 1972. Leonid Hurwicz,“Incentive aspects of decentralization”,in Kenneth J. Arrow and Michael D. Intriligator(eds.)“Handbook of mathematical economics”(vol.3),North-Holland Publishing Company,1986. Laffont, ed., Aggregation and revelation of preferences, North Holland Press, 1979 羅納德,科斯:論生產的制度結構,上海三聯書店1994年。 Ludwig von Mises, Liberalism in the classical tradition, 3rd ed., San Francisco, CA. Cobden press, 1985 丹尼斯·繆勒《公共選擇》,商務印書館,1991年。 John F. Nash: Non-cooperative games, Annals of Mathematics 54(2), 286-95, September 1951. Appendix: Motivation and Interpretation, from doctoral thesis, Princeton University. 道格拉斯· C·諾斯《制度、制度變遷與經濟績效》中譯本,上海三聯書店出版,1994年。 Charles R. Plott: Rawls‘stheory of justice: an impossibility result, in Hans W. Gottinger & Werner Leinfeurer (ed.s): Decision theory and social ethics issues in social choice, D. Reidel publishing company, 1976. John Rawls: Justice as fairness, Philosophical Review LXVII, 164-194, 1958. John Rawls: A theory of justice, Harvard University Press, Cambridge, MA, 1971. John Rawls: Concepts of distributional equity: some reasons for the maximin criterion, American Economic Review LXIV(2), 141-146, 1974. Charles K. Rowley(ed.): Social choice theory, vol. I , II, III, Edward Elgar Publishing Limited, 1993. Robbins, E. S. (1935), An essay on the scope and nature of economics science, 2nd ed., London: Macmillan. Samuelson, 1954, The pure theory of public expenditure, Review of economics and statistics 36, pp387-9. Amartya Sen: Impossibility of a Paretian liberal, JPE 78, 152-157, 1970. Amartya Sen: Social choice, in John Eatwell, Murray Milgate & Peter Newman(eds.): The New Palgrave: A Dictionary of Economics, vol. 4, The Macmillan Press Limited, 1987. 田國強,1995,《經濟機制設計理論與信息經濟學》,載《經濟學與中國經濟改革》,北京大學中國經濟研究中心編,上海人民出版社。 |