博弈論及其應用范文
時間:2023-08-17 18:12:51
導語:如何才能寫好一篇博弈論及其應用,這就需要搜集整理更多的資料和文獻,歡迎閱讀由公務員之家整理的十篇范文,供你借鑒。
篇1
內容摘要:本文在梳理經典博弈論理論體系及其應用領域的基礎上,對其發展趨勢進行了展望。分析顯示:經典博弈理論按其發展的脈絡來劃分,主要包括靜態博弈、動態博弈、完全信息博弈和不對稱信息博弈等幾大理論體系;其應用領域主要涉及管理學中的激勵問題,信息經濟學中的信息甄別、信號傳遞和社會學中“合作與沖突”這一古老而又永恒的主題;其發展方向表現為揚棄“理性假設”條件下的行為博弈。
關鍵詞:納什均衡 信息經濟學 激勵理論 行為博弈
經典博弈理論體系
博弈論又稱對策論,英文名稱是Game Theory,是研究一些個人,一些團隊或組織面對特定的環境條件,在一定的規則制約下,依靠所擁有的信息,同時或先后,一次或多次,從各自允許選擇的策略進行選擇并加以行動,并從中各自取得相應結果或支付的過程的理論。博弈論的主要研究目的是研究博弈各方的行為特征,即各決策主體行為發生直接的相互作用時的決策特征;以及何種情況下采取哪種策略,會達到什么樣的結果即決策主體決策后的均衡問題。
博弈思想可以追溯到我國古代“田忌賽馬”的故事,但一般認為,1944年馮•諾依曼和奧斯卡•摩根斯坦恩合著的《博弈論和經濟行為》形成了現代博弈論的基本分析框架,標志著系統的博弈論初步形成。上世紀50年代,數學天才納什明確提出“納什均衡”這一概念,使經濟學中的均衡問題發生了質變(從“瓦爾拉斯均衡”突破到“納什均衡”)。“納什均衡”的提出抓住了問題研究的關鍵,為博弈論的應用和發展奠定了堅實基礎。“納什均衡”描述的是行動雙方的均衡問題,即“如果一個博弈存在一個戰略組合,任何參與人要改變這一戰略組合都可能導致降低自身的效用水平(或只能保持原有的效用水平),因而任何參與人都沒有積極性去改變這一戰略組合,這一戰略組合稱為該博弈的納什均衡。
“納什均衡”實現了合作博弈向非合作博弈的轉化,但納什均衡是“基于一個時期的模式”而非“動態模式”,納什均衡沒有考慮自己的選擇行為如何影響博弈對手的戰略,且允許不可置信威脅戰略的存在,經常遇到一個博弈中存在多個納什均衡,難于預見哪個均衡會發生等問題。為了彌補納什均衡的上述缺陷,澤爾騰發展了動態的博弈。澤爾騰動態博弈模型思想集中體現在他1965年發表的著名論文《一個具有需求慣性的寡頭博弈模型》一文之中,在該文中澤爾騰對“子博弈精練納什均衡”給出了正式的定義。其基本思想是:“在擴展型博弈中的任一決策點,現行局中人利用其先行優勢及后行者必然做出理性的反應這一事實,來進行選擇以達到最優的納什均衡,有限完美信息動態博弈求解可采取倒推歸納法”。澤爾滕定義“子博弈精煉納什均衡”的中心意義是將納什均衡中包含的不可置信威脅戰略剔出出去,使均衡戰略不再包含不可置信的威脅戰略。它要求參與人的決策在任何時點上都是最優的,決策者要隨機應變,向前看而不是固守舊略。由于剔出了不可置信的威脅戰略,在多數情況下,精煉納什均衡也縮小了納什均衡的個數,這也是子博弈精煉納什均衡的優點所在。
納什均衡嚴格依賴于現實博弈環境難于滿足的“完全信息”假設,即“所有博弈參與人均知道博弈的結構、博弈的規則和支付函數”,針對納什均衡中“完全信息”假設的缺點,哈薩尼建立了不完全信息博弈模型,拓展了納什分析的應用范圍。哈薩尼的不完全信息博弈是在納什均衡的基礎上吸收了貝葉斯研究成果,以貝葉斯定理為出發點,對納什均衡作了廣泛拓展。哈薩尼在其論文《貝葉斯參與人完成的不完全信息博弈》中提出了不完全信息博弈模型,還證明如何把不完全信息博弈模型轉化為完全但非完美信息博弈模型,使得博弈模型易于處理,為信息經濟學的發展奠定了理論基礎。哈薩尼提出的“貝葉斯-納什均衡”是指在靜態不完全信息博弈中,參與人同時行動,沒有機會觀察到別人的選擇;由于每個參與人按照貝葉斯原則僅知道其他參與人類型的概率分布而不知道其真實類型,且不可能準確地知道其他參與人實際上會選擇什么戰略;但是能準確地預測到其他參與人的選擇是如何依賴于其各自的類型;因此參與人決策的目標就是在給定自己的類型和別人的類型依從戰略的情況下,最大化自己的期望效用。即“給定自己類型和別人類型的概率分布的情況下,每個參與人的期望效用達到了最大化,也就是說沒有人有積極性去選擇其他戰略組合”。而應用于不完全信息動態博弈的均衡的概念是“精煉貝葉斯均衡”,這個概念是完全信息動態博弈的精煉納什均衡和不完全信息靜態博弈的貝葉斯均衡的結合,澤爾騰、克瑞普斯和威爾遜及弗登伯格和泰勒等學者為此做出了重要貢獻。精煉貝葉斯納什均衡的要點在于當事人要根據所觀察到的他人的行為按照貝葉斯原則來修正自己有關后者類型的主觀概率,并由此選擇自己的行動。也就是說精煉貝葉斯納什均衡是一個數學上的“不動點”。即滿足:給定每個關于其他參與人類型的主觀概率的情況下,參與人的戰略選擇是最優的;每個參與人有關其他參與人類型的主觀概率均是按照貝葉斯法則從所觀察到的行動中獲得的。不完全信息博弈運用現代隨機分析方法解決信息不完全或不對稱下的決策問題,由此發展起來的不完全信息動態博弈模型使博弈論的理論研究與實際應用更加緊密。
博弈論的主要應用
就博弈論發展而衍生的信息經濟學而言,除哈薩尼所做的開創性工作之外,維克里和莫里斯也對不對稱信息條件下的激勵理論做出了重要性貢獻。維克里上世紀40年代關于個人所得稅稅制問題的思考:“收入均等化并不能解決理想稅賦結構難題”,因為這一方案沒有給個人努力工作提供激勵,因而不會產生社會效率最大化。莫里斯通過設計遞減稅率回答了維克里的稅制難題,并致力于信息不對稱條件下隱藏行動理論方面的研究。莫里斯上世紀70年代的系列研究成果奠定了委托-理論模型框架,并確立了激勵相融契約必需滿足的兩個約束前提。其一是參與約束:委托人所選的效用函數必須使人因接受合約而獲得的效用不小于因拒絕合約而獲得的效用;其二是激勵相融約束:合約締結后人在所選行動上的邊際收益等于邊際成本。
1970年,著名經濟學家阿克洛夫在《經濟學季刊》上刊發了具有劃時代意義論文《檸檬市場:質量不確定性和市場機制》,該文研究了一種商品市場,其中出售者對商品質量的了解比購買者要多,并以二手車市場為例進行說明。由于文章闡述了一個簡單而又深奧的普遍化思想,并因得到應用廣泛而產生重大影響。阿克洛夫在該文中對具有逆向選擇這一信息問題的市場進行開創性分析,指出信息不對稱問題可能導致該市場崩潰,或者只有劣等產品充斥其中。“檸檬論文”解釋了信息不對稱導致的市場低效率,同時該文的另一個獨到見解是經濟主體有強烈的激勵去抵消信息不對稱問題對市場效率的不利影響。
繼阿克洛夫之后,斯彭斯著重研究如何改善信息不對稱以提高市場效率問題,即信號傳遞模型。信號傳遞模型描述的是信息富有的一方如何可靠地將信息傳遞給信息缺乏的一方,以減少雙方之間信息不對稱、促進交易的達成、提高市場效率。斯彭斯以勞動力市場為例,研究得出只有當信息富有者的傳遞路徑產生的費用絕對高于其它傳遞途徑產生的費用時,該信息富有者的信息傳遞才具有效率。該模型很好地解釋了商標、廣告、教育文憑等信息傳遞問題。為減少信息不對稱,提高市場效率,提供操作上的理論依據。
在斯彭斯之后,運用博弈論來研究信息不對稱市場的另一位集大成者乃諾貝爾經濟學獎得主,信息經濟學的集大成者斯蒂格利茨。斯蒂格利茨在1974年之后發表的一系列論文中,構建了以不完全信息和不完備市場為前提的新模型,描述了信息不對稱條件下市場運行機制的變化。他通過對保險市場、農業土地租賃市場、信貸市場和勞動力市場的考察,證明了信息不完全和信息不對稱的普遍性,說明在這樣的市場中,傳統的價格機制實現帕累托效率的有效性值得懷疑,從而對以徹底的私有化和市場化為導向的改革模式(即“華盛頓共識”)提出了質疑。其中,1981年斯蒂格利茨和溫斯合作發表的文章《信息不對稱市場的信貸配給》堪稱當代信貸文獻的典范,該文詳細論述了信貸過程中不同階段銀行面臨的各種風險。該文創立的逆向選擇模型與道德風險模型對分析金融問題具有劃時代意義。
繼博弈論在經濟學領域取得巨大成功之后,以以色列博弈論專家奧曼與美國國防經濟學者謝林為代表的博弈論推崇者則努力運用博弈論來解決“合作與沖突”這一古老而又永恒的社會問題,使博弈論由經濟領域拓展到社會領域。奧曼與謝林分別從數學和經濟學的角度重塑了關于人類交互作用的博弈分析范式。謝林從非合作博弈的角度加深了人們對社會交互作用機理的理解,而奧曼則發現一些長期的社會交互作用可以運用正式的非合作博弈理論來進行深入分析。
博弈論發展趨勢
博弈論以決策者之間的相互影響為主要決策因變量導致經濟學從“瓦爾拉斯均衡”突破到“納什均衡”的質變,經典博弈論從靜態博弈到動態博弈,信息完全到信息不對稱博弈均是在放松理論假設的前提下使博弈理論分析與經濟社會現實更加接近,以增強其實用性和對經濟社會現象的解釋能力。經典博弈理論作為經典經濟學的分析工具,其共同秉承的“理性人”假設、不可觀測的效用函數假設和主觀概率假設是經典博弈論的主要局限,上述假設的存在使經典博弈被戲稱為“研究‘天才’決策的理論”,現實經濟社會中也出現過很多經典博弈理論無法解釋的異象。隨著行為經濟學的興起并得到社會的認同,基于理性人假設的經典博弈理論自然而然遭受到行為學派的挑戰,考慮參與者“有限理性”、“情感”、“環境”、“經驗”、“制度文化”等現實因素的行為博弈論成為近年來博弈論的發展方向。
與經典博弈理論比較,行為博弈論的最大特點是考慮了人類的非理性因素,其研究目的是研究博弈參與人實際做出了什么行動,可以說行為博弈論是實驗經濟學與行為經濟學的一個分支。行為博弈論近年來在“囚徒困境”模型重釋、投資博弈模型、可置信威懾的議價博弈模型、大陸分水嶺協調博弈模型及選美比賽博弈模型等方面取得了重要進展,很好地解釋了經典博弈論無法解釋的一些現象。但行為博弈同樣面臨“有限理性”中“有限”度的量化,“經驗”因素中參與者的“學習”問題以及“學習”如何及何時影響博弈均衡結果等問題。上述問題的存在形成了行為博弈未來的主要研究方向:一是學習過程中的自利行為和利他行為怎樣導致社會偏好的變化;二是在重復博弈中,隨機最優反應函數的地位如何,參與者關于博弈對手和環境的信息信念如何變化;三是組織、團隊乃至企業的博弈行為將在何等程度上與個體博弈存在差異,引發該差異的機制是什么,社會認知空間的變化對博弈行為有何影響等等。
結論
值得一提的是經濟領域的至高榮譽諾貝爾經濟學獎特別偏愛博弈論領域的集大成者。瑞典皇家科學院諾貝爾獎委員會分別于1994年、1996年、2001年和2005年將諾貝爾經濟學獎授予經典博弈論的杰出貢獻者納什、澤爾騰與哈薩尼,博弈理論的實踐人、激勵理論創立者維克里和莫里斯,博弈論衍生的信息經濟學的奠基人及集大成者阿克羅夫、斯彭斯與斯蒂格利茨,博弈論應用領域的拓展者以色列數學家奧曼和美國國防經濟專家謝林;以表彰他們在博弈論領域的卓越貢獻。博弈論領域的多次獲獎彰顯博弈論對現代經濟理論特別是市場交易理論的突出貢獻。
參考文獻:
1.張維迎.博弈論與信息經濟學[M].上海人民出版社,2004
2.斯蒂格利茨,沃因,韋坎德.契約經濟學.經濟科學出版社,1999
3.John Chahes Harsanyi. Games with Incomplete Information Played by Bayesian Players Parts I, II and III. Management Science, 1967
4.John von Neumann and Oskar Morgenstern. The Theory of Games and Economic Behavior. Princeton: Princeton Universty Press.1944
篇2
關鍵詞 波紋管;水輪機;排水管
中圖分類號[TM622] 文獻標識碼A 文章編號 1674-6708(2013)102-0164-02
0 引言
黑河龍首二級(西流水)水電站位于甘肅省張掖市肅南裕固族自治縣境內、黑河大峽谷西流水至榆木溝河段,是黑河流域規劃的第七座水電站。該電站是一座壓力隧洞引水式電站,裝機容量157MW,壩高146.5m,設計庫容8620萬m3,設計年發電量為5.28億Kwh,工程總投資9.1億元。該工程于2002年6月30日正式開工建設,2004年8月17日,首臺機組投產發電,同年9月28日全部機組投入運行。電站由甘肅電投河西水電開發公司負責開發和運營,大壩工程由中水十五局承建,中水十五局承擔機組安裝,甘肅隴豐電力建筑安裝公司承擔廠房工程建設,北京安能監理公司擔任工程監理。
電站大壩型式為混凝土面板堆石壩,最大壩高146.5m,樞紐由攔河大壩、岸邊式發電系統、引水隧洞以及發電廠房等組成。水庫正常蓄水位1920.0m,庫容8620m3,河道右岸布置排沙洞和表孔溢洪道,左岸布置全長1760m的壓力引水隧洞,具有日調節功能,廠房位于大壩下游左岸約3km處,型式為岸邊地面廠房。電站安裝3臺45MW和1臺22MW混流式水輪發電機組,年設計發電量5.28億千瓦時。電站通過兩回110kV線路并入張掖市黑河110kV開關站。電站主要承擔發電任務,在張掖電網中承擔調峰任務。
電站四臺水輪發電機組由GE亞洲水電設備有限公司制造。電站機組投運后,由于頂蓋排水系統根部焊接因疲勞損傷經常出現裂縫的問題,嚴重影響電站的安全穩定運行。為此業主單位多次組織專業技術人員對電站機組頂蓋排水系統出現裂縫原因進行分析尋求解決辦法,最后選擇抗疲勞強度較好的波紋管對原來的排水管路進行改造。本文對電站機組頂蓋排水改造后的效果情況進行了分析和總結。
1 機組主要技術參數
1)發電機主要技術參數:發電機型號為SF-J45-16/4400;局長額定容量為52.941MVA;額定功率為45MW;機組額定電壓和電流分別為10.5kV和2911A額定轉速375r/min;額定功率因數0.85;
2)水輪機主要技術參數:水輪機型號為HL(L237100)-LJ-220 ;最大水頭150m;額定功率和額定水頭為46.88MW、164.36m;引用額定流量33.29m3/s;額定轉速375r/min;最小水頭:137.70m;飛逸轉速665r/min;額定點吸出高度為-2.2m。
2 運行特征與現象
龍首二級(西流水)水電站水輪機導水機構的頂蓋下側面與轉輪上冠間設有頂蓋排水機構,頂蓋排水機構將轉輪后的漏水通過排水管排出,以減輕轉輪的軸向水推力,以防止導葉關閉太快引起管內壓力上升過高造成破壞。該結構采用法蘭連接并置懸掛方式,而上部連接采用橡膠軟管,對該管因溫度及因機組運行產生的振動無法進行有效的保護。自電站機組投運后,機組運行過程中頂蓋部位排水管連接處出現焊縫開裂,造成水車室被淹,機組無法運行被迫停運。自電站機組投運后,因多次發生頂蓋排水開裂問題造成機組非計劃停機,對電站自身的安全穩定運行和電網安全造成了一定影響。
3 原因分析
水輪發電機組的振動原因非常復雜,主要有水力、機械、電氣等三大方面的原因。水輪發電機組的振動問題與一般動力機械的振動有一定差異,除了機器本身轉動或固定部分引起的振動外,尚需考慮發電機的電磁力以及作用于水輪機過流部件的流動壓力對系統及其部件振動的影響。水的能量是水輪發電機組振動的最根本的能量來源,直接或間接導致水輪發電機機組產生振動。從振動的發生的現象分析,部分原因是由水輪機本身的水力特性所導致的,部分原因則是由一些偶然因素作用所產生的。從結構上分析,水輪發電機組可以分為轉動部分和固定、支持兩大部分,任何一個組成部件存在機械缺陷都可能引起機組的振動,而這些缺陷在設計、制造、安裝等任何一個環節都可能產生。水輪發電機組作為旋轉設備,包括上機架、下機架、頂蓋、轉動部分這些振動部件,機組的振動只能通過設計、制造和安裝減小,但無法做到徹底消除。
由于電站機組在原制造和安裝期間,頂蓋和排水管之間的焊接采用鋼性連接,焊接完畢后未進行相應的熱處理,造成應力集中。因此,即便機組各部位振動數值均在行業規范允許的范圍以內,在運行過程中由于頂蓋振動和頂蓋排水管振動造成疲勞損傷,最終致使機組頂蓋排水連接在運行過程中出現焊縫開裂現象。
4 改造方案
4.1方案選擇
分析查明頂蓋排水管裂縫缺陷產生的原因后,決定對機組頂蓋排水管進行全面改造。為滿足現場使用條件,改造方案決定選擇波紋管位移補償器替換原來的剛性連接,選擇波紋管位移補償器的主要原因是它由制造、安裝和運行管理等多個環節組成,它的可靠性應根據頂蓋排水的環境、溫度、泥沙等多方面因素綜合考慮,即除了要考慮波紋管的工作效率外,還應考慮它的介質、工作溫度和外部環境,要綜合考慮使用的材料。為滿足上述要求,材料應當符合下列條件:
1)具有高彈性極限,抗拉強度和疲勞強度性能良好,以確保波紋管工作;
2)具有良好的可塑性,以滿足波紋管方便成型加工,具有足夠的硬度和強度;
3)具有良好的耐腐蝕性能,以滿足能在潮濕等惡劣環境中工作的要求;
4)具有良好的焊接性能,以滿足焊接工藝的要求。
4.2設備選擇
經過多方考察和論證,采用中國華電工程(集團)有限公司生產的DN80(小機)、DN100(大機)、PN1.6波紋管位移補償器取代橡膠軟管,從而對該管線段因溫度變化或因設備振動產生的管段位移有效吸收控制,每套波紋管位移補償器各增加三根限位拉桿,該拉桿的作用是當管路中的固定支架產生異常失效時,管路中的盲板力可由限位欄桿來承擔,不會導致短時間內把波紋管補償器破壞,起到保護補償器的作用。等管路修復后,該補償器仍能使用。該波紋管位移補償器能吸收軸向位移±5㎜(循環次數>105次);吸收橫向位移±4㎜(循環次數>3000次)。DN100(大機)波紋管位移補償器見圖1。
波紋管位移補償器制造技術要求為:1)按GB/T 1277-1999、DL5017-1933進行制造及驗收;2)紋管采用氬弧焊,焊接時兩端法蘭螺孔應對齊;3)進行2.4MPa,保壓10min,不得泄漏;4)部分噴吐銀粉漆。
4.3設備安裝
波紋管位移補償器在管線中是柔性元件,因此管線布置時應防止管線內介質壓力引起的盲板力、管線位移產生的摩擦力、管線重力和其它外力對波紋管位移補償器造成的損壞。在本電站中采用固定支架,即在頂蓋下支板上焊接固定架來支撐波紋補償器,另外在安裝時要波紋管和機組本身排水管、機坑予埋排水管中心線嚴格對正,以減少水阻力。
補償器安裝完成后,進行了限位螺桿調整,先拆除內側螺母,同時將外側雙螺母向外調一個位移量,然后鎖緊。運行中應定期檢查管線和波紋管位移補償器變形情況,檢查是否有阻礙或限制波紋管補償器正常位移的異物或卡澀等現象。安裝后由安裝單位自檢、監理單位終檢,最后由運行單位進行驗收。安裝示意圖見圖2。
波紋管位移補償器安裝過程中的注意事項:
1)波紋管位移補償器在安裝前首先應檢查其型號、規格及配管等,各參數必須設計一致;
2)安裝過程中應注意其內套筒的方向必須與介質流動方向一致;
3)嚴禁使用以波紋管補償器變形達到調整管道的安裝誤差的方法,防止影響補償器的正常功能、增加管道、支承構件的載荷及降低波紋管的使用壽命;
4)安裝過程中,嚴禁焊渣飛濺到波殼表面及波殼受到其它機械損傷;
5)應保證波紋管補償器所有的活動元件在各部位的正常動作;
6)安裝完畢后,應及時拆除波紋管補償器上安裝運輸所用的緊固件及輔助定位構件,并按照設計要求調整限位裝置,使管系具有充分的補償能力;
7)進行打壓試驗之前,必須加固裝有補償器的管路端部,使管路不發生移動或轉動。
篇3
關鍵詞: 囚徒困境 規則 主體間性 理性
一、關于理性人和囚徒困境的介紹
囚徒困境這個事例常常在有關博弈論的討論中出現,它最主要貢獻是突出反映了個體理性與群體理性的沖突,并且在目前學界的討論下,這一沖突似乎尚未能得到完美的解決。造成這一沖突的原因,并不是由于該博弈的前提――理性人假設出現了問題,而是基于囚徒困境中或者博弈論中理性人的假定在不同條件(規則)下的作用。正是由于沒有分清這一前提在不同背景知識下的運用,一方面保證了囚徒困境這個博弈能夠用邏輯的或者說是理性的方式解決(找到這個博弈的納什均衡點),另一方面也導致了事件的解決結果并不是那么的令人滿意(因為我們面臨的是不同的條件與知識背景)。“‘博弈參與人是理性的’是博弈論的公設,然而理性人的假定存在許多博弈困境。囚徒困境與公地悲劇反映的是個體理性與集體理性之間的沖突”(潘天群《博弈論中理性人的假設困境》,《經濟學家》2003.4,)。
起初,博弈論專家假定博弈中的參與人是理性的――具有使自己效用最大化的推理能力,然而,奧曼等人發現,這樣的假定是不夠的,我們必須假定,“一個博弈中的每個參與人都是理性的”是該博弈所有參與人組成的“群體”所知道的,即每個人都是理性的是群體中的“公共知識”(或翻譯成共同知識)。(潘天群《群體推理的邏輯與群體理性》,《東南大學學報(哲學社會科學版)》,2007年7月第9卷第4期)。
有關囚徒困境我們可以這樣表述。
假設有A、B二人,因為偷盜被警察抓捕歸案。為了防止兩人串供,因此將兩人分開審問。這時A、B二人均面對了兩種選擇,一是招認,二是不招認。例如,對于A來說,A面臨著招認與不招認的選擇。我們可以假設,如果A招認,B可以選擇招認,也可以選擇不招認。當A招認B不招認時,A當場釋放B判刑8年;當A招認B也招認時,各判刑5年。如果A不招認,B也可以選擇招認或者不招認。當A不招認B招認時,B當場釋放,A判刑8年;當A不招認B也不招認時,兩人各判刑1年。
同理,當審問B的時候,只需要參考上面的過程就可以很容易地得到答案。
我們可以簡單地列一個表,用來表示上述的過程:
以A為例,對該博弈進行分析。
由于參與博弈的雙方均為理性人,且為公共知識,那么A會有如下的思考:
當B招認時,A可以選擇招認或者不招認。
當B招認而A不招認的時候,B被當場釋放,A被判刑8年;當B招認A也招認時,B與A各判刑5年。判刑5年遠遠好于判刑8年,因此,當B招認時,基于理性人的假設要使自己的收益最大并且損失最小,A會毫不猶豫地選擇招認。
當B不招認時,A也可以選擇招認或者不招認。
當B不招認并且A也不招認時,兩人各判刑1年。當B不招認而A招認時,B被判刑8年,A被當場釋放。A基于理性人假設作出了以上的推理,顯而易見的是,當場釋放要好于判刑1年。為了使自己收益最大并且損失最小,A會毫不猶豫地選擇招認。
因此,不管B是否招認,A都會毫不猶豫地選擇招認。
同理,作為一個理性人,B也會按照A的思維模式那樣作出選擇,答案是――毫不猶豫地招認。
兩人均招認就是囚徒困境這個博弈的納什均衡點。很明顯也很抱歉,通過理性手段進行推理,想使自己的收益最大而損失最小,但是結果卻不是那么的令人滿意。在我們看來,兩者均不招認各判刑1年的損失要遠遠小于兩人各判刑5年,或者單就A或B一個人來說,當場釋放的收益要明顯地大于個人的判刑5年,因此,在某些人看來,理性的參與人在這個博弈中并不能使自己的收益最大損失最小,相反的,個人理性在這個囚徒困境的博弈中成為了獲得最大利益的障礙,在這樣的情況下,就出現了“兩難”決策。
二、“囚徒困境”博弈的潛在規則,以及阿克塞爾羅德的實驗及其規則變動
應該得出的一個認識就是,上文所提到的那個“囚徒困境”博弈屬于一次性的完全信息靜態博弈,它本身所具備的規則與阿克塞爾羅德所做的實驗有著顯著的區別――一次性的囚徒困境博弈與重復性的囚徒困境博弈的規則區別。為了便于分辨,我們依次將上文的兩個囚徒困境博弈分別簡稱為Game1與Game2。
G1應該具備以下的這些規則。
(1)對策者(謀求合作的雙方)沒有什么手段可以用來實施威脅或作出許諾。由于對策者不會許諾他們自己采取某種特定的策略,因此每個人都得考慮對方可能采取的所有策略。此外,每一個對策者都可以使用所有可能的策略。(2)沒有什么辦法能夠確定對方在某個特定的對局中將如何選擇,這就消除了使用元對策”分析的可能。“元對策”允許諸如“選擇與對方相同的策略”的選擇,同時也消除了通過觀察對方與第三者局而形成某種信譽的可能。因此對策者唯一可利用的信息(積累的知識)是他們相互作用的歷史。(3)不能消滅對方,也不能放棄對局,因此對策者在每次對局時只能選擇合作或背叛。(4)不能改變對方的收益值。這個收益值已經包括了每個對策者關于對方利益的考慮之中。(周海林《“合作”的條件與機理――從囚徒困境談談可持續發展的制度基礎》,《軟科學》2001年第15卷第3期)
我們可以試著列出一個表格,以更清晰地對幾個步驟中的規則的區別作出清晰的劃分。
博弈前(step1)博弈中(step2)博弈后(step3)
[?搖?搖?搖?搖?搖?搖一次博弈的完成?搖?搖?搖?搖]
對于G1的第一條規則,G2由于是重復多次的囚徒,將會出現一些不同的情況。阿克塞爾羅德所提出的例如寬容性和可激怒性就可以在step3之后體現出來。可激怒性可以簡單地看成是規則1中所說的實施威脅。當參與博弈的雙方A和B進行一次博弈時,A作出不合作的決定時(第一次博弈),B在step3得知了這個消息之后,也就是下一次博弈時(第二次博弈),可以選擇不合作,對A進行威脅,表示自己是可激怒的。這里的威脅,是分屬于兩次博弈的,而這在一次性博弈中明顯無法做到。寬容性也同樣如此,當A表示悔過(在第三次博弈選擇合作時),B可以立即在step3中得知,并在第四次博弈時原諒A,作出合作的選擇。當然,如果僅從理性人的角度出發,在有限次的囚徒困境博弈中,次次不合作才應該是這個博弈的納什均衡,但是在阿克塞爾羅德的試驗中,次次不合作這個策略的得分明顯低于某些策略,并且選擇這個策略的人并不是絕大多數,理論和現實有著明顯的差異。
對于G1的第二條規則,同樣也是如此。一次性的囚徒困境G1作為某個特定的對局(特地被警察隔離開而無法串供),博弈雙方都無法確定對方將采取何種策略,從而致使使用“元策略”的可能性變為0。G2作為多次重復的囚徒困境,由于能夠清楚地知道對方在每一輪的選擇(指已經選擇過的步驟),因此可以對接下的自我的選擇和他人的選擇做出推斷。甚至像“一報還一報”策略直接選擇與對方上一步策略相同的策略。還有的參與者對博弈對手的合作與不合作的次數進行概率計算,并由此作出自己的選擇,如道寧策略,這在G1中是無法出現的。阿克塞爾羅德甚至做了兩次重復多次的囚徒困境實驗,這樣對于G2的參與者來說,他們的選擇不僅僅可以基于與自己的博弈對手相互作用的歷史,更可以基于博弈對手與參與這次試驗的每一個人的相互作用的歷史。道德博弈中所說的個人信譽問題在這里凸顯出來。
總的看來,在step1中,作為囚徒困境的博弈參與者A可以了解到B以往的策略選擇以及信譽問題,并可在一定程度上影響到自身策略的選擇。例如貪婪的策略在面對比較仁慈的策略時,總是比較占優勢。并且在step2中,A與B可以看到對方是如何選擇,并進一步影響到step3之后,選擇寬容還是懲罰――合作還是不合作。
從step1到step3就顯示出主體交互性在博弈中的重要作用,因為G1中,G1(step1)到G1(step3),A與B做為博弈參與者并沒有真正的形成交互(雙方被隔離了),即主體間性。而在阿克塞爾羅德的試驗中G2(step1)到G2(step3)中,博弈的雙方A和B不但互有信息交流,而且在一定程度上影響到自我決策的選擇。
三、主體間性對囚徒困境的影響
主體間性從定義上來說是主體與主體之間的統一性,但在不同的領域中,主體間性的意義是有差異的。
在主體間性概念的形成歷史過程中,事實上涉及了三個領域,從而也形成了三種涵義不同的主體間性概念,這就是:社會學的主體間性、認識論的主體間性和本體論(存在論、解釋學)的主體間性。這里就不一一詳細敘述。
博弈論是交互的決策論。2005年諾貝爾經濟學獎的獲得者奧曼曾經給博弈論下過一個非常描述性的定義:博弈論是“交互的決策論”,其定義十分簡潔凝練。展開來說,博弈論是研究發生直接相互作用的行為者采取的決策以及這種決策的均衡問題。換言之,一個經濟主體(行為者)在決策時必須考慮到對方的反應,所以用“交互的決策論”來描述博弈論可謂言簡意賅。(張踐明《“囚徒困境”?理性悖論?交互認知論》,《湘潭大學學報(哲學社會科學版)》,2007年11月第34卷第6期)
而交互認知是主體間性的具體化例證。在重復囚徒困境這個博弈中,就充分地體現出交互認知的重要性。
如step1的中,博弈的雙方可以對彼此過去的決策選擇進行詳盡的考察,基于生存博弈的道德博弈也可因此而建立起來。雙方的私有信息(在這里可以簡單地看做自己和對方的博弈歷史選擇)是否可以交換,交換的方式與程度,均可在一定程度上影響到后來的決策。阿克塞爾羅德進行第二次重復囚徒困境博弈的一部分原因也在此――建立在雙方知己知彼的基礎上的合作應該如何產生,知己知彼是源于上一輪的博弈參與者參與博弈并決策的歷史。這樣就把雙方的私有信息公開化,變成了公共知識。
在step2中,G1博弈雙方從完全不知道對方做出什么決策發展到G2可以看到對方的決策,這又是一次交互的行為,由于是多次重復博弈,step2的交互致使博弈雙方A和B不僅僅看重眼前的利益,更會看中將來的利益,從而使合作有可能發生,當然其中也包括從不合作決策與報復性決策等。
在G2(step3)中,A或者B完全可以借由這個環節來告訴對方自己對于對方的選擇是滿意還是不滿意,并在以后的多次博弈中體會到對方的感受,對方同樣可以表達出來并由此形成第三次交互。
還是拿一報還一報策略進行說明。A使用策略未知,而B使用的是一報還一報策略。設在第200次博弈中(我們稱為N1、N2、N3……),A選擇不合作,B選擇合作,G2(N200(step3))中,B發現A不合作,并想表達自身的不滿,因此立即在G2(N201(step2))中選擇不合作以此來警告A。A在G2(N201(step3))中感受到了B的不滿,如果雙方進行了重復多次的博弈,A通過G2(N202(step1))回顧雙方合作的歷史發現,B對于犯錯的人具有寬容性,于是立即在G2(N202(step2))中選擇合作表示自己悔過,B在接下來的步驟中感受到A的悔意,在下一次的博弈中選擇合作表示自己知道并安慰A……從而形成了重復性的三次交互、信息交換。當然,以上的只是基于交互理論的假想,但是在阿克塞爾羅德的實驗中,我們不應該僅僅把雙方固有的策略選擇看作是電腦程序的自動化,而應該看作是在理性人基礎上的信息交互,從而修正自己的策略。
四、結語
可否像人工智能體Agert那樣在博弈中具備自主交互的學習參與博弈的理性能力,并由此改變自己的策略?
有關新型智能體Agent的設定,有這么幾條可以作為囚徒困境這個博弈的參考:
①能夠面向陌生狀態與不確定性,積極主動地進行認知與行動。②每個智能體都有自己不同的知識背景、心智品質、能力與個性,甚至具備諸如友善性、真誠性等人類特征。它的這些能力與特征都不是被設定為一成不變的,它可以隨著情況的變化而不斷地進行能動的自我更新。它不是在一個一步到位的、靜態的模式中模擬智能,而是在一系列過程性的、動態連續的進程中發展智能。
如果在多次重復的囚徒困境的理性人設定中附加如上的設定,是否可以使G2更加地清楚明白,更容易地走向合作?
當然,以上的附加只是基于多次重復囚徒困境的假設。面對G1的一次性的完全信息靜態博弈,我們只能持以悲觀的態度。
賓默說,理性參與人的獨立選擇行為又會產生非帕累托效率的結果,這并不存在任何自相矛盾的地方。囚徒困境的規則不利于實現理性合作,就像把一個人雙手反綁之后要他表演手技一樣。因此,不要希望在囚徒困境規則約束下理性參與人會成功地達成合作。
參考文獻:
[1]羅伯特?阿克塞爾羅德.合作的進化.合作的復雜性――基于參與者競爭與合作的模型.
[2]賓默.博弈論與社會契約.
[3]格若赫姆?羅鉑.博弈論導引及其應用.
[4]張踐明.“囚徒困境”?理性悖論?交互認識論.湘潭大學學報(哲學社會科學版),2007.11.
篇4
關鍵詞: 博弈實驗 教學軟件 實驗經濟學
一、引言
諾貝爾經濟學獎得主愛德華?哈斯丁?張伯倫(E.H.Chamberlin)教授1948年在哈佛大學博士生課堂上進行的描述市場需求和供應經濟關系的紙牌實驗正式拉開了實驗經濟學的序幕[1]。20世紀50年代,美國休斯敦大學約翰?福布斯?納什(John Forbes Nash Jr)利用不動點定理證明了均衡點的存在,并將博弈論引入議價行為模型,進行了純議價博弈實驗,1994年因為他在博弈論領域的卓越貢獻獲得了諾貝爾經濟學獎[2]。1952年,美爾文?爵爍和莫萊爾?弗萊爾(MelvinDresher and Merrill Flood)進行了著名的“囚徒困境”實驗。20世紀60年代,有著“實驗經濟學之父”之稱的弗農?洛馬克斯?史密斯(Vernon Lomax Smith)教授在亞利桑那大學十一個班級進行了長達六年的實驗驗證競爭均衡理論,1962年,以此實驗為基礎撰寫的論文《競爭市場行為的實驗研究》在《政治經濟學雜志》上的發表,標志了實驗經濟學的誕生。其也因為在實驗經濟學領域開創性的貢獻于2002年獲得了諾貝爾經濟學獎[3]。
近年來,博弈實驗及以其為代表之一的實驗經濟學以其實現方式的可復制性和實驗過程的可控制性受到越來越多經濟學家的青睞,該實驗還是研究不同經濟政策建議有效性的經濟、可行辦法之一。我國自上世紀80年代以來,不少學者已經逐漸意識到實驗經濟學的發展,目前正有組織地對其開展研究和應用工作。因此,以實驗經濟學為主要研究方法,進行研究性、設計性的本科生實驗教學已經成為經濟管理類實驗的發展趨勢。目前,國內諸多知名高校如中國人民大學、浙江大學、廈門大學等已經相繼建立了自己的經濟學實驗室,開始了在實驗經濟學領域的專業研究和教學應用[4]。
然而在博弈實驗的推廣過程中卻出現了教學效率低、教學工作量大、數據不易收集、多為驗證性實驗等諸多難點,極大影響了博弈實驗在高校別是在普通高校本科教學中的推廣。筆者所在的中國藥科大學醫藥經濟管理綜合實驗教學中心自行編寫了基于Browse/Server(簡稱B/S)結構的博弈實驗教學軟件。該軟件使用JSP(Java Server Pages)與My-SQL相結合,構建了功能強、使用簡便、管理方便、運行速度快、安全可靠性強的網頁數據庫。基于該數據庫,將Java和JDBC結合起來極大降低了程序編寫難度,提高了軟件在不同平臺運行的兼容性和穩定性[5]。
二、傳統博弈實驗模式在教學應用中的缺點
1.教學效率低。
國內實驗經濟學教學大多沿襲國外教學模式,嵌入于經濟學、管理學等理論課程中進行,用于加深對基礎理論知識的理解和掌握,多為演示型、驗證性實驗。實驗中沿襲國外常規教學手段使用紙質教學文件為實驗用具(見圖1),學生在格式化的紙質文件中記錄每輪博弈決策,每輪博弈后,將決策紙交予教師進行記錄、評判后再行發回進行下一輪博弈。每輪博弈均涉及決策、收決策紙、記錄、評判、發回決策紙、下輪決策的循環,因其極大地占用了課堂教學時間,在實際教學過程中的運用受到課時等諸多因素的限制,難以開展。
以本中心的實驗教學為例,在使用博弈軟件之前每次進行重復囚徒困境博弈模型的實驗教學時,60人的博弈實驗,需要4位實驗教師同時工作(2位教師計算和統計實驗結果,1位教師按時收集、發放博弈決策紙,1位教師維持教學現場秩序)才能保證博弈實驗的正常進行,1課時(45分鐘)只能進行7-10輪博弈,平均5-7分鐘完成一次博弈,實驗效率較低。而在7-10輪博弈輪數中絕大部分學生還未能體會均衡、零和等博弈的核心理念,實驗就已經匆匆結束。
2.教學難度大。
常見的用于本科教學的博弈實驗模型如囚徒困境博弈模型、選美實驗博弈模型、智豬博弈實驗模型、重復博弈實驗模型的課程化構建中多要求構建博弈方信息完全不對稱的實驗環境。但是由于多種原因如重復囚徒困境博弈實驗中相對規則的博弈對手配對、微信等現代化的信息溝通途徑甚至是同學間的手勢和眼神極易導致博弈對手間的信息溝通,從而極大地影響實驗的結果。有時甚至需要教師使用分割博弈對手所處實驗環境、強制信息溝通工具管制等方式保障實驗教學的正常進行,增加了實驗教學工作量,加大了實驗教學的難度。
3.教學計算量大、工作量大。
多數博弈實驗均需要一定的運算和統計工作,尤其是在賄賂博弈、領導者博弈等帶有研究性的博弈行為實驗中。在重復囚徒困境博弈實驗中每輪實驗都需要統計并標示博弈對手的博弈決策,計算本輪博弈雙方得分。雖然單個運算強度不大,但是由于參與實驗者眾多和往復博弈次數而導致運算量較大,且較為容易出現計算失誤。
4.教學數據收集困難,工作量大。
為了強化博弈實驗的教學效果,需要及時統計參與博弈學生的博弈決策及其產生的效果,作為學生優化決策的依據。在重復囚徒困境博弈實驗中需要歸納典型博弈思路,如一報還一報策略(TIT FOR TAT)、弗里德曼策略(FRIEDMAN)、道寧策略(DOWN ING)、喬斯策略(JOSS)等經典博弈策略的產生概率及其平均收益,用以引導學生的決策思路[6]。但是對紙質材料的收集和整理需要花費大量時間,在一個教學單元(如2課時)內,難以完成數據的收集和整理工作。
5.教學、科研效果分析困難,缺乏必要依據。
北京大學董智勇教授在《實驗經濟學》一書中寫道:實驗經濟學(Experiments with Economic Principles)是經濟學家在挑選的受試對象參與下,按照一定的實際規則并給以一定的物質報酬,以仿真方法創造與實際經濟相似的一種實驗室環境,不斷改變實驗參數,對得到的實驗數據分析整理加工,用以檢驗已有的經濟理論及其前提假設,或者發現新的理論,或者為一些決策提供理論分析。高校能夠提供大量可供選擇的高度理性受試對象,實驗課程能夠以分數等激勵手段代替的物質激勵極大地降低了實驗成本,因而成為實驗經濟學的重要實踐場所。以博弈實驗為代表的實驗經濟學更是成為優化決策體系、提升決策水平的重要方法,其是在賄賂模型等研究性博弈實驗模型中。這一切的實現不但需要基礎數據,而且需要強大的以博弈數據庫為基礎的數據挖掘工具。紙質實驗道具因其在收集速度上的缺陷顯然不能滿足要求[7]。
三、計算機網絡技術在博弈實驗教學應用中的優勢
1.提高實驗教學效率。
本中心采用博弈實驗軟件后,極大地提高了教學效率:在重復囚徒困境博弈實驗中,以每次實驗20輪計算,傳統紙質道具的博弈學實驗,至少需要90分鐘,使用計算機實驗教學軟件后,只需要20分鐘,在1個課時內就可以完成實驗,保證了教師講解時間,提高了學生的博弈水平。對比具體如下圖(圖2):
通過上圖,我們可以很直觀地發現,應用計算機的實驗方法具有明顯的技術優勢和顯著的進步性。
2.降低實驗教學難度。
博弈實驗中通過電腦自動分組等功能可以做到真正的“雙盲”實驗。在重復囚徒困境博弈實驗中,自制教學軟件能夠實現自動配對、隨機分組功能(見圖3),使學生在完全不知道博弈對手的情況下完成博弈實驗,真正做到了信息的完全不對稱。
3.免去實驗教學的信息收集、整理、運算工作。
采用了計算機的實驗方法后,在重復囚徒困境博弈實驗時,學生只需要單擊“合作”或“背叛”后即可看到(或等待后看到)博弈對手本輪決策,由電腦依據評分原則直接給出單輪分數并累計入學生總得分。學生決策提交后,收集、整理、運算、統計的工作都由電腦后成并展示在學生眼前,極大地降低了實驗教學過程中教師的工作量。
4.教學數據自動轉存,方便實驗效果深入挖掘。
使用教學軟件后,重復囚徒困境博弈實驗中的學生的操作將被自動保存,實驗結束后以EXCEL的形式導出。導出后的數據經過EXCEL的簡單加工可以進入SPSS等統計軟件深入挖掘掩藏于基礎實驗數據背后的經濟學現象和規律。
四、結語
為了滿足實際教學需要,越來越多的高校自行編輯博弈實驗教學軟件以推廣博弈實驗在經濟學、管理學等相關課程中的運用,提高教學效率,深化教學改革。筆者所在實驗中心的軟件化博弈教學實踐表明,博弈教學軟件的使用不但能夠極大提高教學效率,而且能夠降低教學難度,實現實驗數據的自動收集、主動分類及自動基礎分析等,這樣不但滿足了本科教學需要,而且為經濟博弈行為的科研提供了強大依據,具有較高的推廣意義和價值。
參考文獻:
[1]劉曉麗.博弈實驗對博弈論的方法論意義[J].學術探索,2013.
[2]杜麗群.經濟學的兩種研究范式:實驗經濟學與行為經濟學評析[J].經濟思想史評論,2007.
[3]鄧釗.經濟學實驗方法及在我國的應用前景分析[J].現代商貿工業,2010.
[4]方小教.經濟學實驗課程構建方法的改革路徑[J].淮北煤炭師范學院學報(哲學社會科學版),2008.
[5]謝玉誠,茅寧瑩,陳露,施皓韻.經濟學實驗教學方法改革[J].新西部,2013.
[6]周駿宇.艾克斯羅德重復博弈實驗及其應用[J].自然辯證法研究,2005.
篇5
關鍵詞:職業體育賽事;電視轉播權;聯盟博弈;利益分配
中圖分類號:G80-052 文獻標識碼:A 文章編號:1006-2076(2013)02-0016-04
作者簡介:張誠(1981- ),男,碩士,講師,研究方向學校體育。
作者單位:重慶科技學院,重慶 401331
電視轉播在職業體育賽事中的創收能力越來越影響著體育賽事的影響力,近20年來,職業賽事電視收視率節節攀高,電視轉播合約金額也不斷暴漲,巨額電視轉播收入成為職業體育賽事的重要基石[1]。與此同時電視轉播權所帶來的高額收益的分配矛盾也開始困擾著職業聯盟的發展,如何在這種利益分配的博弈中找到平衡,既能保證各個俱樂部在收益分配上的公平性又能促使聯盟的平衡發展,是擺在體育賽事職業聯盟面前的重要課題。我國學者王平遠曾在《大型體育賽事電視轉播權有效開發探討——基于福利經濟學和博弈論的視角》一文中,通過建立福利經濟學的經濟學模型,并對同一個模型利用Stahl的有限回合水平討價還價博弈模型以及Shaked和Sutton的無限回合討價還價博弈模型作了進一步分析。雖未對電視轉播費的分配進行分析研究,但采用博弈論的視角在電視轉播權的有效開發上的理論應用為電視轉播權的出售提出了一種新的研究方法。本研究擬通過采用聯盟博弈的方法,對職業體育賽事聯盟電視轉播費的分配進行研究,并對我國職業體育賽事的電視轉播權市場萎靡做進一步的分析。在收益分配方面,分別從合作博弈與非合作博弈的角度討論了聯盟的收益分配問題,使分配更為合理、公平。
1 電視轉播權出售的非合作博弈分析
1.1 完全信息靜態博弈分析
模型假設:假設1:某個職業聯賽中有三個俱樂部,分別為甲、乙、丙,其俱樂部的競技水平依次遞減,假設某媒體將對甲、乙和甲、丙兩場比賽進行轉播,根據競技體育的觀賞性和平衡性可知,甲、乙的比賽懸念較大,對觀眾的吸引力也更大,而甲、丙的比賽的激烈程度明顯不如甲、乙,觀賞性和對觀眾的吸引力也比甲、乙的比賽弱。現在就這兩場比賽電視轉播價格與媒體進行洽談。
假設2:這三個俱樂部不通過相互結盟的方式出售電視轉播權,顯然在乙、丙之間存在喪失轉播費風險的問題,在與媒體進行談判過程中乙、丙展開競價,力爭將自己的競技表演服務產品出售的同時獲得可觀的經濟收益。
假設3:在這次博弈中,乙、丙兩俱樂部之間不存在信息溝通和合作,且媒體在與乙、丙俱樂部的賽事組織者進行談判時分別被告知,如果一方以低價出售而另一方以正常價銷售則只對低價者進行轉播而放棄以正常價出售的賽事轉播權,其得益矩陣如圖1。
1.2 完全信息動態博弈分析
顯然,在現實生活中,職業體育聯盟中各體育俱樂部之間進行的并不是一場比賽,賽事電視轉播權的出售所產生的博弈問題將一直存在,正如我們所知,在多次重復博弈后,各個俱樂部都發現如果采取合作博弈的方式將有利于自身的利益的增加。如圖1所示,在賽事組織者理性假設下,(低價,低價)是最終的博弈均衡,但如果兩個俱樂部采取合作的方式與媒體談判,顯然(正常價,正常價)能夠達到兩者的最大效益,增加各個俱樂部的個體效益,從(低價,低價)到(正常價,正常價)是一個帕累托改進,但很明顯,在有限次的重復博弈中,(正常價,正常價)是不可能出現的,因為每個俱樂部都會認為其他的俱樂部將會在下一回合中選擇背叛而獲得超額的電視轉播費,這使我們洞察到各個俱樂部重復相互作用時的行為結構,要想維持共同想要的結果就必須要有一個團體規范來“懲罰”背叛者,并且這種懲罰威脅必須是可信的,這就需要賽事聯盟對每個俱樂部制定強制性的合作協議,保證合作博弈的重復進行,以保證聯盟福利的最大化,這不僅保證了聯盟和各個俱樂部利益的最大化,同時也增強了聯盟對整個賽事電視轉播權的議價能力,在實踐中,英格蘭足球超級聯賽、德甲、法甲以及NBA等許多職業聯盟都是采取統一議價的方式,實現俱樂部的合作博弈,從而最大程度地實現聯盟和各個俱樂部的經濟利益。
2 賽事電視轉播費的分配研究
通過以上分析,我們知道為了達到聯盟賽事轉播效益的最大化的最好方式是實行合作博弈,合作博弈使參與者能夠聯合達成一個具有約束力且可強制執行博弈類型,但合作博弈強調的是效率、公平、公正,顯然如果一個俱樂部在參與聯盟所帶來的收益還沒有單獨出售轉播權時的收益大,那么它就沒有參與聯盟的必要和動力,這就是合作博弈強調的效率性,正是由于合作博弈的效率性促使理性人采取合作的方式,也就是說因為有效率才能促使各個俱樂部之間形成聯盟以增加自身由于結盟而帶來的額外收益。聯盟收益分配的公平、公正則是維持聯盟存在的關鍵制度,如果某俱樂部在利益分配上感覺受到了不公正的待遇,那么它維持在這個聯盟的動力就將消失,由此及彼,已經形成的聯盟也將因此而面臨解散的威脅,因此聯盟電視轉播費如何分配是能否保持聯盟存在的關鍵,聯盟博弈的核心問題是各個俱樂部應以什么方式結盟以及如何分配結盟所帶來的收益。
2.1 聯盟利益分配的特殊性分析
由于職業體育聯盟在其發展過程中存在自身的特殊性,聯盟各個俱樂部之間存在著既競爭又合作的相互依存相互依賴的關系,比如聯盟內部的平衡機制。聯盟俱樂部競技能力強弱過于懸殊將使聯盟難以維持,因為強隊不斷的通過大投入和聯盟利益的超分配必然將在賽場上戰勝弱隊,這將使比賽初始即失去懸念,失去競技體育的魅力,從而挫傷了觀眾觀看比賽的積極性,降低收視率,進而在與媒體進行電視轉播權的議價中失去優勢,損害了聯盟的整體利益。同時在利益分配過程中,如果存在不公平、不公正時,又將會失去提高競技能力和觀賞性的動力,為避免聯盟中“馬太效應”的出現,通過以上分析筆者認為電視轉播費的分配應該分為三部分:對于電視轉播費的總利潤一部分用于平均分配,保證聯盟中各成員的平衡性和有效性,一部分應該根據各俱樂部的比賽成績進行分配,這部分是為了保證聯盟分配的公平性,提高聯盟的競技水平和賽事的觀賞性,還有一部分是根據賽事轉播的次數進行分配,保證利益分配的公正性,提高各俱樂部管理運作的積極性。
2.2 基于Shapley值法的聯盟利益分配
通過分析發現,對于第一部分分配顯然應該是由聯盟制度規定的,目前各大職業聯盟電視轉播費及平均分配比重見表1。
觀察表1中的統計數字我們發現,英超的電視轉播費幾乎是3個西甲、5個意甲、10個德甲,這首先是源于聯盟對賽事電視轉播權的整體出售,其次英超轉播費的分配制度非常公平、公正,為了提高聯賽的觀賞水平和整體競爭力,英超一直致力于轉播費的公平分配。在歐洲各國的聯賽體系中,英超的轉播費分配是最公平的,冠軍與排名最后球隊之間的轉播費收益差距最小,大約只有1.6倍。而在西甲,皇馬、巴薩的轉播費分成,就是西甲最弱球隊的19倍。在我國中超聯賽電視轉播費分配制度中,轉播費本身的收入不高,分配制度不完善,幾乎是典型的“一刀切”的分配方式,影響了聯賽的競技水平,同時滋生了諸如“黑哨”、“假球”、“”等腐敗現象。
對于第二部分采用Shapley值法進行分配,Shapley值法是基于合作博弈中局中人的效用和邊際貢獻率的一種分配方式[2],對于聯盟電視轉播權出售的議價能力主要是賽事的影響力,而賽事的影響力主要是因為各個俱樂部的競技體育水平和賽事的觀賞性,反映在各俱樂部的比賽成績上,Shapley值法是合作博弈求解法之一,它通過公理化方法描述解的性狀,進而得到唯一的解,即博弈中各局中人的效用分配。Shapley值法的出發點是根據聯盟中每個成員對聯盟的邊際貢獻分配聯盟的總收益,更能體現合作各方對聯盟的貢獻,保證了分配的公平性,因而更合理、更科學。對每個博弈,存在唯一的Shapley值φi(v),且
其中φi(v)表示博弈方i應得的效用分配,n表示博弈中局中人的數量,|S|表示聯盟中所含局中人的個數,v(S∪{i})表示i加盟S后,新聯盟的合作剩余,因此i的貢獻是v(SY{i}-v(S)。下面以表2中的數據矩陣為例, 運用Shapley值法對三個俱樂部的利益分配進行定量化的計算:
由表2的數據分析發現,兩家俱樂部合作比單獨與媒體進行談判所帶來的收益高,三家合作要比兩家合作或單獨行動帶來的收益高,利用Shapley值法對甲乙丙三個俱樂部的電視轉播收益分配計算結果如下:
則φi(v)=(533m,383m,293m)就是一個根據俱樂部比賽成績進行分配的一個方案,運用Shapley值法的好處是既避免了完全平均分配中由于聯盟中各俱樂部競技水平高低的差異所帶來的不公平性,同時又可以通過各個俱樂部在電視轉播權的出售議價能力上的貢獻有定量化的衡量標準。
為保證聯盟轉播費分配的公正,必須要將賽事轉播的次數考慮在內,通常職業體育比賽的激烈程度和觀賞性決定著賽事轉播的次數,而賽事的激烈程度和高觀賞性需要有高水平的運動員作保證,以NBA為例,見表3。
通過表3可以看出,衛冕冠軍湖人隊的比賽直播次數獨占鱉頭,另外姚明所在的火箭隊因為濃厚的中國元素和巨大的球迷市場也遙遙領先其他球隊,2010年夏天球員轉會市場上最轟動的“新三巨頭”的熱火隊為球迷帶來欣喜和期待也不容小視。這些都體現在媒體對他們的關注度和轉播次數上,從表3中我們可以發現,凡是轉播次數較多的比賽,球隊中明星球員的年薪明顯要高出一籌,湖人當家球星科比平均年薪達到2 785萬美元,因此在具有高薪運動員的俱樂部分配中就必須考慮利益分配的公正性,高水平的比賽需要有高水平的運動員參與,高水平、高觀賞性的比賽需要運動員付出艱辛的訓練強度和高超的技術水平,這些均不同程度地體現在媒體對賽事的轉播次數上,這就需要在利益分配上給予支持,如果付出與收入不成正比例關系,那么球員將失去競爭的動力,球隊也將失去引進高水平運動員的動力,長此以往,失去的將是聯賽的整體競爭力和觀賞性。
3 我國職業體育聯賽電視轉播市場存在的問題
3.1 大眾喜愛的職業聯賽水平不高,水平較高的又缺乏觀賞性,跟國外的職業體育聯賽相比缺乏競爭力,比如CBA和NBA以及中超和英超等聯賽水平相比都有著天壤之別,這樣導致電視轉播收視率不高,造成聯盟在與媒體進行議價過程中底氣不足。
3.2 我國電視轉播媒體存在嚴重的壟斷現象,由于其他電視臺電視覆蓋面遠不及中央電視臺,導致中央電視臺一枝獨秀問題嚴重,缺乏媒體競爭機制,最典型的例子就是上海文廣集團買斷了中超聯賽近三年的電視轉播權,但由于文廠集團的電視覆蓋面不及中央電視臺,加之央視受利益驅使等甚至連中超聯賽的新聞報道都幾乎沒有,因此中超聯賽的商業開發受到很大影響,許多觀眾也看不到中超比賽。
3.3 聯賽缺乏必要的平衡機制,比賽缺乏懸念,目前我國的職業聯賽強者恒強弱者恒弱現象嚴重,以CBA聯賽來說,近幾年廣東隊和新疆隊一直是聯賽的頂尖強隊,早幾年八一隊六連冠,近六年廣東隊五次奪冠,這些現象的出現導致聯賽競爭實力的嚴重不平衡,導致聯盟比賽缺乏懸念性,失去了競技體育的魅力。
4 對我國CBA聯賽電視轉播的幾點建議
4.1 通過對職業體育賽事電視轉播權的非合作博弈分析,得出各個俱樂部在追求個體利益最大化的過程中容易陷入“囚徒困境”損失了聯盟利益的同時也無形中放棄了聯賽電視轉播權整體出售帶來的效益。因此基于聯盟博弈的角度,CBA聯賽的電視轉播權應選擇整體出售的方式來保證聯盟的整體利益最大化,籃管中心應改變對電視轉播收益定額分配的方式,為提高各俱樂部參與聯賽經營的積極性,實現可持續發展。筆者認為CBA聯賽可借鑒NBA等成熟聯賽的經驗,采用約定比例或影響力比例的方式對CBA聯賽的收入進行分配。這一方面可最大限度地調動球隊與球員參與聯賽經營的積極性,另一方面也可減少籃管中心與球隊的沖突與磨擦。
4.2 基于職業體育賽事電視轉播費分配的特殊性分析,認為CBA聯賽的電視轉播費的分配可以由三部分組成,第一部分基于職業體育聯盟分配的平衡性和有效性,用于平均分配的部分;第二部分是根據Shapley值法計算出的根據各俱樂部競技成績排序的部分,依據是每個成員對聯盟的邊際貢獻分配的部分,更能體現合作各方對聯盟的貢獻,保證了分配的公平性,有利于賽事觀賞性和激烈程度的提高;第三部分是根據球隊比賽轉播的次數進行分配,這樣能夠保證分配的合理性和公正性,保證聯盟成員管理運作的積極性,提高俱樂部的影響力,從而提高聯盟的形象。
4.3 目前CBA聯賽在電視轉播權出售上存在媒體購買壟斷的現狀,根據福利經濟學和博弈論的分析可以得出:壟斷不利于整個社會福利的增加,賽事承辦方與電視媒體的博弈產生的交易成本越多,賽事承辦方利益損害越大,電視媒體利益損害越少。而競爭是導致福利增加的有效手段,因此增加對CBA聯賽電視轉播權開發的競爭性是提高整個聯賽乃至社會福利增加的有效方法,即如何在實現社會福利最大化過程的同時減少反壟斷成本,根據當前的情況,體育與媒體的有機融合同時采取反壟斷的措施是當前CBA聯賽賽事轉播權開發的參考途徑之一。
參考文獻:
[1]王曉東.美國職業體育賽事電視轉播權開發研究[J] .體育文化導刊,2007(2).
[2]李幫義,王玉燕.博弈論及其應用[M] .北京:機械工業出版社,2010.
[3]李章龍.博弈論在我國競賽表演業中的研究[D] .中國學位論文全文數據庫,2007.
[4]張洪振,陳文新,趙聰.體育賽事中體育產品有效提供的機制研究[J].山東體育科技,2010(4).
篇6
內容摘要:隨著房地產開發用經營性土地使用權出讓行為越來越規范,房地產開發企業之間為獲取土地使用權的競爭也日趨激烈,在土地使用權掛牌和拍賣出讓中,房地產開發企業需要確定一個合理的并綜合考慮競爭因素的出價,房地產開發企業之間土地使用權出讓博弈就顯得更為重要。本文針對房地產開發企業在獲得經營性土地使用權中存在的問題,針對土地使用權招拍掛方式,構建了房地產開發企業獲取土地使用權的競價博弈模型,并進行了相關分析,提出了一種考慮競爭因素的博弈競價法。
關鍵詞:土地使用權 掛牌 拍賣 博弈模型 博弈競價法
研究背景
房地產開發用經營性土地使用權出讓的行為越來越規范,土地使用權的招拍掛(特別是拍賣和掛牌)正成為房地產開發企業獲得土地使用權及政府部門出讓土地使用權的主要方式。同時由于房地產開發市場的日趨成熟,政府宏觀調控政策的影響,房地產開發企業之間為獲取土地使用權的競爭也更加日趨激烈。房地產開發企業對土地使用權出讓,特別是對土地使用權招拍掛形式出讓的研究就迫切地擺上了房地產開發企業的主要研究日程。
房地產開發企業研究土地使用權出讓行為是在我國進行房地產項目開發前期不可缺少的環節。由于歷史原因,我國土地使用權招拍掛出讓活動起步較晚,初期房地產市場不正規,有些房地產開發企業對土地的決策靠“拍腦門”、也有許多房地產開發企業以前靠“投機”行為獲取暴利,而沒有對土地使用權招拍掛引起重視,結果損失慘重。進入20世紀,房地產開發的投資環境逐漸趨于成熟,房地產法規的完善和市場行為的規范,對未來的房地產開發企業來講,即將面臨的是一個完備的房地產市場體系和一個公平、公正、公開的土地使用權出讓的競爭環境,房地產開發企業研究土地使用權出讓的博弈就顯得更為重要。
從房地產開發企業的角度來看,能否獲得土地取決于其出價的高低。如果出價過高,雖然能獲得土地,但由于土地成本過高,最終會使其利潤過低甚至虧損。如果出價過低,則難以獲得土地。因此,在土地使用權掛牌和拍賣出讓中,房地產開發企業需要確定一個合理的并綜合考慮競爭因素的出價。本文針對房地產開發企業在獲得經營性土地使用權中存在的問題,針對土地使用權招拍掛方式,構建了房地產開發企業獲取土地使用權的競價博弈模型,并進行了相關分析,提出了一種考慮競爭因素的博弈競價法。
土地使用權競價博弈模型實例分析
假定某土地使用權拍賣出讓或者掛牌出讓的底價為b0,有n家房地產開發企業有意獲得該塊土地,并參加競拍。第i家房地產開發企業的超出底價的報價為bi≥0,即第i家房地產開發企業的報價為b0+bi;第i家房地產開發企業認同的該塊房地產開發用地的土地使用權的認同的超過底價b0之外的價值為vi≥0,即房地產開發企業認同的該塊房地產開發用地的土地使用權的價值為b0+vi。
(一)兩家企業土地使用權競價博弈
設只有2家房地產開發企業決定參加此次土地使用權拍賣或掛牌,i=1,2。
顯然,每個房地產開發企業對地塊土地使用權的認同價值vi是不公開的,vi只有第i家房地產開發企業自己知曉,即相互獨立。但每房地產開發企業都知道vi獨立地取自定義在區間[0,1]上的均勻分布函數。若第i家房地產開發企業以價格b0+bi中標,則第i家房地產開發企業的凈收益為(b0+vi)-(b0+bi)=vi+bi,若第i家房地產開發企業未能中標,則凈收益為0。
因此,第i家房地產開發企業的收益函數為:
(1)
假定,第i家房地產開發企業的出價bi(vi)是其對該地塊土地使用權的認同價值vi的嚴格遞增函數,顯然,bi(vi)≤vi,因為沒有哪家房地產開發企業愿意付出比其認同的土地使用權價值更高的價格(那樣,房地產開發企業的效用將為負值)。
由于博弈是對稱的,只需要考慮對稱的均衡出價策略b=b*(v)。
給定v和b,第i家房地產開發企業的期望支付為ui=(v-b)Prob{bj
由于v是連續分布,則有Prob{bj
根據對稱性有bj=b*(vj),得到
(2)
式(2)中,Φ(b)=b*-1(b)是b*的反函數(即當房地產開發企業選擇出價為b時,出價b對房地產開發企業的價值為Φ(b)),則獲得第i家房地產開發企業的博弈論模型(期望支付函數)如下:
(3)
最優化問題的一階條件為
(4)
這是邊際收益等于邊際成本的條件,增加b的邊際成本為確保中標的情況下支出增加Φ(b),邊際收益為中標的概率乘以確保中標的情況下的凈收益(v-b)
Φ′(b)。
在均衡條件下,如果b*是第i家房地產開發企業的最優策略,那么Φ(b)=v,故最優化的問題的一階條件為,可轉化為。
解得最優解,即第i家房地產開發企業在該博弈中的貝葉斯均衡是,則第i家房地產開發企業最優的出價策略為 (5)
(二)n家企業土地使用權競價博弈
設有n個房地產開發企業決定參加此次土地使用權拍賣或掛牌,則得到博弈論模型(期望支付函數)如下:
(6)
最優化問題的一階條件為
或者 (7)
在均衡條件下Φ(b)=v
故最優化的問題的一階條件為 (8)
解上述微分公式,得最優解(9)
則第i家房地產開發企業在該博弈中的貝葉斯均衡是。
即第i家房地產開發企業最優的出價策略為。
考慮競爭因素的博弈競價法
顯然,b*(v)隨n的增大而增大,當n∞時,b*v,即參加土地使用權拍賣或掛牌出讓的房地產開發企業越多,企業支付的土地使用權出讓金也就越高,當參加土地使用權拍賣或掛牌出讓的房地產開發企業趨于無窮多時,企業幾乎支付出全部土地使用權的價值。
從式(9)最優解中可以看到:
當n=1時,b*(v)=0,即只需要支付底價即可獲得該塊地塊的土地使用權。
當n∞時,b*v,
即房地產開發企業需要支付全部的b0+v才可獲得該塊地塊的土地使用權,企業幾乎支付出全部土地使用權的價值。
房地產開發企業最優的出價策略為,即博弈競價法確定的房地產開發企業最優的出價策略為。
土地使用權出讓競價策略在于社會平均的建筑技術水平下制定的,房地產開發企業只有提高自己的技術水平、管理水平,通過提高生產率,縮短建設期等手段,達到減少項目成本的目的,從而提高利潤率,這樣才能獲得更高的土地使用權的估值vi,使自身在土地使用權競價過程中處于有利位置。
房地產開發企業應對土地使用權出讓的地塊進行深入的調查,同時選擇自己針對性的土地地塊,通過參加土地管理部門組織的現場勘查及了解提報競價申請的房地產開發企業的數量,選擇參加競拍的房地產開發企業數量n較少的地塊進行競拍,避免惡性競爭,以期獲得更多的期望效用。
房地產開發企業在確定報價時,既不能盲目地壓價,也不盲目樂觀地報高價,應當在確定自身成本的基礎上,認真地研究分析競爭對手情況,采用最優報價策略,以期獲得最大的收益。而從經營戰略上,成本優勢是房地產開發企業在突擊使用權競標中獲勝的關鍵。
博弈競價法在某地塊競拍中的應用
(一)案例概況
經某市人民政府批準,某市國土資源和房屋管理局決定以拍賣方式出讓一幅儲備地塊的國有土地使用權,土地拍賣起叫價(樓面地價)3180元/。
(二)案例分析
1.問題分析。
博弈的參與者人:某公司和其他參加該塊土地使用權拍賣的房地產開發企業。
某公司參加拍賣的情況了解:由于該地塊為某市某區不多的大幅地塊之一,引來眾多的企業關注,并有包括某公司在內的7家房地產開發企業參加競拍,可謂競爭激烈。某公司參加多次某市土地競拍,多以失利告終,其原因主要有二:其一采用的確定競價的方法產生的競價過低,造成失敗;其二不考慮自身開發水平,盲目競高價,雖然中標,但中標成本過高,造成開發收益不理想,甚至造成為了減少損失,不簽訂正式土地使用權出讓合同,造成流標,形成競拍保證金損失。本案例要求為該公司出具競拍策略,可應用博弈競價法求最優競價。博弈競價法的競價公式為最優競價。
2.求解。
確定b0,由公告可確定設定的土地使用權拍賣出讓的底價b0=3180元/平方米。
確定vi,確定該公司認同的該塊房地產開發用地的土地使用權的價值b0+vi。應用直線趨勢法測算完成開發后(預測整個開發周期為4年)的房價。根據對某市該區域近7年來商品房價格情況的調查,得出某市某地塊周邊商品房價格如表1所示。從表1中可以看出,近7年來,某市該地塊周邊商品房的價格總體呈明顯上升趨勢,其趨勢如圖1。從圖1看出,某市該地塊周邊商品房的銷售平均價格基本上呈直線形式,在此,采用直線趨勢法對該地塊建成房產后的銷售價格進行預測。
以y表示商品房價格,t表示年份序號,選用y=a+bt作為商品房銷售價格直線趨勢方程,其中a、b為參數,則由最小平方法可得標準方程組:
(10)
根據某市某地塊周邊商品房的銷售平均價格,得到直線趨勢法預測計算表2。
將表2計算結果代入最小平方法標準方程組得:
(11)
解此聯立方程組,得a=4382.7,b=674.36。
由此可得商品房價格直線趨勢方程為:y=4382.70+674.36t。
利用y=4382.70+674.36t直線趨勢方程,可以預測到某市某地塊在2009年的銷售價格為:
y2010=4382.70+674.36×11=11800.66
元/平方米
則該地塊的銷售總價值=11800.66元/ m2×58134.3 m2×3.28=225015.58萬元
利用假設開發法求開發后該塊房地產開發用地的土地使用權的價值。計算見表3假設開發法計算表。折合成樓面地價為6534.76元/m2。
求該塊房地產開發用地的土地使用權的價值的現值,即該公司認同的該塊房地產開發用地的土地使用權的價值b0+vi。以銀行貸款利率5.85%作為折現率,則可將該塊房地產開發用地的土地使用權的最高價值折算為現值,即
b0+vi=6534.76×(1+7.47%)-4=4898.70元/m2。
確定該公司認同的該塊土地使用權超過底價b0之外的價值vi,vi=(b0+vi)-b0=
4898.70-3180=1718.70元/m2
確定n。經調查,共有7家房地產開發企業確定參加該地塊土地使用權拍賣,則可確定決定參加此次土地使用權拍賣的房地產開發企業的數量n=7。
求該公司的最優出價策略b0+b*。根據最優解公式可以推出,如果某公司對該地塊的認可價值最高,則政府拍賣的成交價格為,可得出表4。則n=7時,該公司的最優出價策略b0+b*=4653.17元/平方米。
3.通過博弈競價法獲得的對策。某公司的最優報價策略為:出價b0+b*=4653.17元/平方米。
(三)競價結果分析
最終,某公司以4600元/平方米的價格競拍成功,獲得該塊地塊的土地使用權。
可見,最終的成交價格4600元/平方米的價格與推算價格4653.17元/平方米比較相符,誤差僅為1.16%。
結論
房地產開發企業研究土地使用權出讓行為是在我國進行房地產項目開發前期不可缺少的環節。由于歷史原因,我國土地使用權招拍掛出讓活動起步較晚,初期房地產市場不正規,有些房地產開發企業對土地的決策靠“拍腦門”、也有許多房地產開發企業以前靠“投機”行為獲取暴利,而沒有對土地使用權招拍掛引起重視,結果損失慘重。隨著房地產開發用經營性土地使用權出讓行為越來越規范,房地產開發企業之間為獲取土地使用權的競爭也日趨激烈,在土地使用權掛牌和拍賣出讓中,房地產開發企業需要確定一個合理的并綜合考慮競爭因素的出價,房地產開發企業之間土地使用權出讓博弈就顯得更為重要。
房地產開發企業在獲得土地使用權的過程中面臨的是一個完備的房地產市場體系和一個公平、公正、公開的土地使用權出讓的競爭環境,從房地產開發企業的角度來看,能否獲得土地取決于其在競爭的環境下出價的高低。本文針對房地產開發企業在獲得經營性土地使用權中存在的問題,構建了兩家企業和多家房地產開發企業獲取土地使用權時的競價博弈模型,提出了考慮競爭因素的博弈競價法并給出實例。該法為房地產開發企業提供了在多家企業競爭情況下的最優出價策略的參考,可以幫助房地產開發企業在具體的房地產開發項目管理中規避土地風險。
參考文獻:
1.張維迎.博弈論與信息經濟學.上海人民出版社,1996
2.肖條軍.博弈論及其應用.上海三聯書店,2004
3.黃小彪.住宅領域的市場失靈.中外房地產導報,2002(8)
4.汪利娜.房地產泡沫的生成機理與防范措施.中華工商時報,2002(12)
5.曹震.房地產市場的博弈問題研究:學位論文.河海大學國際工商學院,2003
6.羅建榮.房地產的風險與困惑.省略,2002
7.董英蘭.房地產市場博弈:學位論文.首都經濟貿易大學,2006
8.羅貞禮.基于土地資源可持續利用的競價拍賣政策博弈.國土資源導刊,2004(3)
9.劉曉君,劉云.拍賣出讓土地使用權的博弈分析.統計與決策,2005(1)
10.方豪斌,唐根年.基于博奕理論的土地拍賣出讓競價策略研究.經濟師,2003(1)
11.張淑娟,劉艷芳.城市土地使用權招標出讓的博弈分析.武漢大學學報,2005(11)
作者簡介:
侯樂君,男,1976.3―,碩士,經濟師,總經理,江西南昌人。在企業中從事各類項目的管理工作。
篇7
關鍵詞:黑哨;經濟;博弈
中圖分類號:F224.32 文獻標識碼:A doi:10.3969/j.issn.1672-3309(x).2011.11.45 文章編號:1672-3309(2011)11-99-03
一、引言
隨著生活水平的提高,體育競技逐步成為全球性產業,吸引了眾多消費者(觀眾)花費金錢和時間觀看比賽,購買的不是物質上的利益,而是精神上的愉悅,這種愉悅來自比賽過程和比賽結果的不確定性。但“黑哨”的出現讓比賽失去了不確定性,使消費者得不到所需的優質產品,導致消費者流失,進而危機到這些產業的根基。
關于黑哨的概念,普遍認為是指競技體育中的裁判員為了追求個人或集團利益而違背原則、采取不正當手段,損害競賽參與者以及觀眾等的合法權益,破壞競賽秩序等行為。本文假設在一場競技比賽中有3個參與者:A隊、B隊和G裁判,即博弈的局中人為N={A隊,B隊,G裁判}。3個局中人可以形成以下6個博弈:A隊和B隊的博弈、A隊和G裁判的博弈、B隊和G裁判的博弈、AB聯盟和G裁判的博弈、AG聯盟和B隊的博弈、BG聯盟和A的博弈。由于AG之間的博弈和BG之間的博弈都屬球隊和裁判的博弈,因此作球隊和裁判之間的博弈處理;AB聯盟和G裁判的博弈屬于假球,不在本文的討論范圍之內;AG聯盟和B隊的博弈與BG聯盟和A的博弈同屬黑哨的受益方與受害方的博弈,所以只需分析一個即可。綜上所述,僅分析A隊和B隊的博弈、A隊和G裁判的博弈以及AG聯盟和B隊的博弈就能將黑哨當事人之間的關系表述完全。
二、裁判為什么吹黑哨
首先,裁判有吹黑哨的權力。雖然比賽和執法都是在眾目睽睽之下進行,并且觀眾能對大多數的犯規行為做出正確的判定,如籃球中的走步、足球中的越位等,但球場上不可避免存在一些需要裁判主觀斷定的情況,如籃球中的進攻犯規、足球中的無意手球等,還有因裁判所站角度不同而造成的誤判等,并且裁判規則給了裁判最終裁決權,這個權力在保障了比賽流暢性的同時也給了裁判主觀裁決的機會,主觀性的判決讓裁判有了在關鍵時刻決定比賽的能力。也就是說裁判有“在某種程度上控制比賽”這一資源。
其次,裁判有吹黑哨的激勵。制度經濟學中假設人們有機會主義傾向,在經濟活動中總是盡最大的能力保護和增加自己的利益,自私并且不惜損人。因此,作為理性人的裁判將利用自己的權利來尋租,或威脅對球隊采取不利的執法行為,或許諾在比賽中偏袒球隊來獲得賄賂,以增加自己的物質利益。
最后,缺乏有效的監督機制。從裁判的專業性來看,許多競技比賽的裁判都來自相應項目的協會,在生活和工作中與競技雙方存在諸多交集,便于在私下達成交易而不被發現。從裁判供給的來看,裁判都來自相應協會的下級組織,如果出現黑哨,一般只作內部處理,處罰的力度不強。從法律法規來講,有政府的法律和協會的條例來禁止黑哨,但許多國家并沒有對競技比賽中的裁判行為專門立法,只是在事態特別嚴重時援引其他法律,威懾力有限。
三、參賽者為什么收買裁判
首先,球隊有收買裁判的沖動。大部分的競技比賽是一種商業活動,競技雙方的目的都是為了獲取收益,而能帶來最大收益的是比賽的勝利。勝利可以增加參與者的知名度,提高品牌價值,提高觀眾的忠誠度以及吸引更多的觀眾,進而提高上座率、門票價格、轉播賽事的價格和分成等。在商業利益的驅使下,球隊有不擇手段獲取勝利的沖動。
其次,比賽雙方都面臨著行賄的“囚徒困境”。從上面的分析可知,球隊有收買裁判的內在沖動,并且這是A隊和B隊的公共信息,也就是說,A隊和B隊都知道對方想收買裁判。由此,存在如下博弈:局中人N={A隊,B隊},SA={收買,不收買},SB={收買,不收買},各自的支付如下表:
這里假設收買裁判要付出1單位的成本;裁判偏袒的一方可得到2單位收益,同時損害對方2個單位的利益;兩隊策略一樣時裁判公正執法。
劃線法可知:這個博弈的納什均衡是(收買,收買)。對A、B來說,不管對方采取什么樣的措施,收買裁判都是最優的選擇,博弈后兩隊的收益都為-1。從表中可知,(-1,-1)是博弈中最差的結果,總體要損失兩單位的利益。對追求私利最大化的A隊和B隊來說,雖然最終收益都為負,但“理性”導致他們只能選擇收買裁判,忍受利益的損失。
最后,即使球隊沒有收買裁判的沖動,作為人的裁判也可能導致比賽雙方進入“囚徒困境”。這是因為,作為業內人士的裁判,對參賽雙方或者各隊隊員有著自己的好惡,這種好惡或是直接交往形成的或者是道聽途說形成的。裁判的好惡將導致對喜歡的一方放松尺度,對厭惡的一方嚴格執法。對于比賽雙方來說,由于不知道自己在裁判心中的地位比對方高還是低,就會去做能增強裁判對自己好感的事情,如請客、送禮等,這將形成如下困境:
這里將“做能增強裁判對自己好感的事情”稱為“作為”,否則,稱“不作為”,其他與上面的“囚徒困境”類似,不在累述。
因此,球隊對自身利益最大化追求的理性也是黑哨形成的重要原因。
四、黑哨協議的達成
“黑哨”的形成,需要雙方事先約定未來收益的分配協議。由于黑哨是有風險的,如果被查處,將導致行賄一方品牌價值降低以及由此帶來的利益損失;受賄一方面臨被清除出本行業及有關的法律懲罰等風險。在協議達成前,雙方都將衡量自己面臨的風險與收益,力爭在最小的風險下獲取最大的收益。由于雙方對自己的收益和風險估計是私人信息,可以作為一個雙向拍賣來分析。
假設A隊為行賄者,G裁判為受賄者。A隊確定一個行賄量QA,G裁判給出一個索賄量QG,如果QA≥QG,則黑哨協議以: Q= 達成,如果QA<QG,則不達成協議。A隊經過風險和收益分析,對行賄量有一個估計(estimate),設為EA,為A隊愿意為黑哨付出的最高價;G裁判對比自己的風險收益后也有個對索賄量的估計,設為EG,為裁判愿意執行黑哨的最低價。這兩個估計都是私人信息,假設都服從[0,1]區間的均勻分布。如果雙方以Q達成協議,A隊獲得EA-Q的收益,G裁判獲得Q-EG的收益;若達不成協議,雙方效用都為0。
在這一貝葉斯靜態博弈中,雙方的出價策略都為自己估價的函數,設為線形函數:
由貝葉斯納什均衡的條件可知,雙方的策略組合(QA,QG)應滿足:
式(3)中,花括號中第二項表示協議達成時的交易價格,最后一項 表示A隊出價QA時協議達成的概率, 表示A隊出價高于G裁判出價,協議達成時G裁判索賄量的期望值;式(4)中,花括號中第一項表示協議達成時的交易價格,最后一個因子 表示G裁判出價QG時協議達成的概率, 表示G裁判出價低于A隊出價,協議達成時A隊行賄量的期望值。
將(1)(2)兩式帶入(3)(4)兩式,并考慮雙方的估計量都服從[0,1]上的均勻分布,計算可得:
對比(1)式與(5)式,有 對比(2)式和(6)式,有 即有:
由于雙方達成協議的條件是QA≥QG,結合(7)(8)兩式,等價情況是:EA≥EG+,因此,協議可能達成的區域是下圖中的ABC,而不是所有≥的ODC區域,這是由于雙方以自己利益最大化原則博弈時喪失了一部分交易(即下圖中的四邊形OABD)。可以發現,在雙方的博弈過程中,黑哨達成的機會只有完全信息下的56.25%。
五、黑哨的查處
從黑哨的定義可知,A隊與G裁判協議中所分享的利益來自B隊,并不是新創造的,因此,AG聯盟與B隊形成了一個零和游戲,如果B隊無所作為,將導致AG聯盟對自己的掠奪,假設B隊面臨這一困境時的策略為{舉報,不舉報},AG聯盟與B隊的支付矩陣如下:
這里假設:如果存在黑哨,舉報后一定能被查處;黑哨被查處后處罰兩個單位用來補償受害者的損失;舉報要花費一個單位的成本。因此,在策略組合(黑哨協議達成,舉報)時,AG聯盟的支付為-2,B隊的支付為2+(-1)=1。用劃線法的結果(如表)表明,這個博弈不存在純策略的納什均衡,下面計算該博弈混合策略下的納什均衡:
設AG聯盟的混合策略為X={x,1-x},x∈[0,1];B隊的混合策略為Y={y,1-y},y∈[0,1]。由(X,Y)是博弈平衡點的充分必要條件(這里的EAG,EB都表示期望):
計算可得該博弈的混合策略納什均衡為 ,對應的均衡結果為: 。說明在舉報存在成本且只要舉報黑哨就能被查處的前提下,B隊對自己策略(舉報,不舉報)的選擇是隨機的,AG聯盟達成黑哨概率并不高。
但是,前面分析中“只要舉報黑哨就能被查處”的假設是有缺陷的,因為黑哨協議是當事人雙方簽署的,第三人很難找到確鑿的證據來證明黑哨交易的存在,如同大部分的行賄受賄案件一樣,除非當事人承認,否則很難找到直接的證據。而通過改變聯盟內部各主體的支付函數,來誘導當事人互相揭發也是行不通的,因為協議雙方的利益博弈形成了一個“反囚徒困境”,成為“拴在一根線上的蚱蜢”:
這里假設:若有一方承認就表示黑哨協議被查處,且沒收球隊的非法所得P和裁判的非法所得Q(也就是行賄量)。懲罰方面:如果一方承認,另一方不承認,承認一方的懲罰是1單位,不承認一方懲罰為10單位;如果兩方都承認,則各懲罰3個單位。
從上表中的劃線可知,該博弈有兩個納什均衡:(承認,承認)和(不承認,不承認)。對比這兩個納什均衡給雙方帶來的支付,(承認,承認)的結果導致原有的收益喪失而且還面臨新的處罰,(不承認,不承認)不但保全原有所得而且避免了新的損失,并且兩個均衡的結果對于局中人來說是公共信息。因此,不管是裁判還是對球隊,只有選擇不承認才能使自己的利益最大化。
當然,如果對承認者給予獎勵而不是懲罰,并且獎勵數量能夠超過或者至少能夠彌補承認所遭受的損失(對球隊來說就是獎勵大于P,對裁判來說是大于Q),就可能走向(承認,承認)的均衡,但這時的承認已經沒有了意義:查處黑哨本來是要給予懲罰,進而減少黑哨,但這個的結果不但沒有懲罰而且還給了激勵。所以不承認的均衡是很難被打破,黑哨的查處相當困難。
六、結論
上面已經談到,黑哨協議兩方的利益增加不是新的商業活動創造的,而是掠取了黑哨受害者一方的利益,跟欺詐和搶劫的性質一樣,將導致資源的不合理配置和低效使用,既不公平又無效率。此外,黑哨難以查處的性質使其有巨大的負外部效應,如果黑哨不被查處,協議雙方有種“黑一次也是黑,黑兩次也是黑”的想法,并且設法拉更多的人下水,以提高自身的安全性,從而擴大它的負外部效應。黑哨協議雙方的巨額收益還有可能給其他的裁判和球隊做出一個示范,進一步誘惑黑哨的發生,產生連鎖反應,最終可能導致整個產業的腐敗,以致產業的衰落。
鑒于黑哨的巨大危害,特提出幾點防范措施:
1、對于裁判來說,首先,通過細化比賽規則和運用高科技手斷(電子眼等)來減少裁判的主觀判罰量,以減弱裁判對比賽的控制力。其次,提高裁判的收入水平以減少尋租的激勵,增加其被發現的機會成本。最后,完善裁判市場,使裁判委員會獨立于相關運動協會,增加業余裁判的數量,以增加裁判的可替代性和選擇的不確定性。
2、對于參賽者來說,建立有關聯盟保證其經營的可持續性,以便通過長期的重復博弈打破行賄的“囚徒困境”;加大重大賽事的監控,防止球隊在巨大的利益面前鋌而走險。
3、對于整個產業來說,推行完全的市場化,保證參與者能在市場機制的約束下考量自己的利益;增加市場的透明度,并建立避嫌機制,以減少裁判和球隊協議達成的概率。
4、對于黑哨的查處,可以提高舉報人的獎勵,以鼓勵更多的舉報;加大對黑哨的處罰,以增加裁判和球隊的風險。
參考文獻:
[1] 汪賢裕、肖玉明.博弈論及其應用[M].北京:科學出版社,2008.
[2]盧現祥.新制度經濟學[M].武漢:武漢大學出版社,2004.
[3]李保明.效用理論與納什均衡選擇[M].北京:經濟科學出版社,2003.
[4]孫天法.黑哨之經濟學分析[N].中國經營報,2002-04-09.
[5]陳奪.我國足球職業聯賽“黑哨”問題的法學思考[J].科教文匯,2009,(06):219.
篇8
然而,直到最近10多年來,在均衡選擇方面才取得進展,這些進展提出當存在多個均衡時,應該怎樣去做。
一、納什均衡
納什,在1950年就已經對納什均衡給出兩種解釋。第一種是群體作用的解釋。此種解釋假設,在博弈中存在對每個參與者又稱局中人(player)起作用的參與者群體。參與者不斷地積累各種純策略中的令人注意的經驗信息,如果此博弈穩定下來,那么這種均衡必是納什均衡。然而。Shapley在1964年證明,如果博弈沒有穩定下來,那么必然存在一種策略選擇的有限循環。第二種解釋的觀點是把均衡看成一個“自動實施協議”或者是理性的預測。如果基于理性的預測是唯一的,那么博弈均衡確實得以存在,這時倘若均衡是眾所周知的,它必是納什均衡。納什本人對此做了闡述,這是“一種十分強的理性化和理想化的解釋”。這對闡述均衡而言是有效的,解決均衡選擇問題是一個基本的問題。因此,對于經濟學家的研究目的而言,與均衡選擇相關的問題是必須加以分析和深入探討。
對納什均衡的第三種解釋,是由MaynardSmith和Price在1973年首次提出的,它源于生物學領域的研究。在這種解釋中完全不存在有意識的選擇:參與者預先選取某一種策略,而且更為成功的策略生存下來;如果種群(population在生物學上稱為種群,在經濟學中我們將其稱為群體更好)達到一種穩定狀態,那么所有策略必是等價的,因此,這種狀態必是納什均衡。這種生物學上的方法,其優點是它不僅具體指出穩定的結果,而且它還靠可能達成的一些結果來給出一種顯示性的過程。
當然,經濟學家清楚地意識到將涉及到的生物學領域中的思想和方法應用到經濟學領域中的疑問和困難,比如,像生物學中的“復制方程”擴展到經濟學領域中的內容和意義是什么,至今還在探索中。
二、進化思想在經濟學中應用的回顧
對經濟學給出進化的解釋不是一種新的手法。實際上,進化解釋在社會科學中是先于達爾文(Darwin)而出現。例如,亞當·斯密(AdamSmith)曾說:“帶來許多利益的勞動分工,原本不是人類智能的結果,雖然人類智能預見到勞動分工產生普遍富裕,并想利用它來實現普遍富裕。盡管在人類本能里沒有意識到這樣廣泛效用中的一種互通有無、物物交換,以及相互之間交易的傾向,此傾向很緩慢并且漸進產生結果,但是勞動分工是必須的。”
進化思想也能夠在馬爾薩斯(Malthus)、馬歇爾(Marshall),熊彼特(Schumpeter)和哈耶克(Hayek)所寫的著作中找到。關于進化經濟學,這是一個單獨的學科領域,經常與熊彼特的工作相聯系。Robson在2001年系統地給出了經濟行為的生物學方面的基本解釋。
進化經濟學與進化對策論至今是完全相互獨立地發展起來的。在經濟學的理論研究中,理性人的偏好通常是固定的。然而,對于理性人的偏好變化或者進化選擇,經濟學家對此也進行了研究,特別是利他主義的生存價值以及風險態度等。然而,我們這里的進化對策論是將偏好作為固定的和已知的。
關于市場生存進化方面的研究和探討,開始于Winter在1964年的文章“經濟的‘自然選擇’與廠商理論”,接下來Winter在1971年發表了“滿足、選擇與改革殘余物”,Nelson和Winter在1982年出版的著作《經濟變遷的演化理論》(有中文版),是這一領域中出現的最為重要的文獻。最近由Blume和Easley(1992,1995,1996),Dutta(1992)Dutt和Radner(1993),Radner(1995),Bega—redondo以及Boldeke和Samuelson(1997)等學者在此領域進行探索和研究。雖然這個論題與進化對策論緊密相聯系,但是,目前這兩種文獻在方法論上相距甚遠。
三、進化對策論的基本原理與結論
最近10多年里,不像對策論的傳統分析方法那樣——考慮有限理性的經濟行為人以及在嚴格的認知局限之下必須學習執行策略,這樣的對策論理論及其應用有了迅速的發展。這方面的大量研究工作是在稱為進化對策論所提供的框架下進行的。正如此學科標題所表示的,這一新學科的原理借用生物學中的進化模型所具有的與眾不同的一些特征。然而,此學科本身也發展了一些新的方法和技術,特別地適合于有限理性基本假設下對社會和經濟體制方面的分析。進化對策論在10多年里以快速的步伐取得長足的發展。
進化對策淪為人們提供一種具有廣泛適用性的工具。其潛在的應用領域從進化生物學延伸到一般的社會科學,特別是經濟學中。進化理論在經濟學中有著悠久的歷史傳統。直到最近,這種方法在非合作對策論框架中才得到應用。
進化對策論是研究策略行為的穩健性,它是針對有限理人所組成的大群體中多次博弈背景下的進化力量而言的。這種新的組成部分在經濟理論里導致一種新的預測方法,并且為其他社會科學開辟一條嶄新的研究途徑。
進化對策論的基本內容:
(一)進化穩定策略概念。進化對策論理論中,一個關鍵概念是進化穩定策略(ESS),這一概念的提出歸功于MaynardSmith和Price在1973年的“動物沖突的邏輯”一文。此種策略在特定的意義上對進化壓力而言是穩健的:群體執行該種策略對執行任何其他策略而言是非入侵的。假定一對個體是重復隨機地來自于大的群體,去參與一個對稱并有限的兩人博弈,還假定所有的個體在博弈中起初都執行某一個純的或混合的策略x是進化穩定的,那么對于每一個變異策略y,都存在一個正的“入侵障礙”,使得執行變異策略y的個體群體所獲得的支付低于此障礙,從而x贏得的預期支付比執行的y所得要高。下面的不等式對于充分小的ε>0成立,即:
u[x,(1-ε)x+εy]>u[y,(1-ε)x+εy]…………(1)
其中左邊的表達式記為對于策略x而言,當執行相對應策略的個體進入之后,混合群體情況的混合策略(1-ε)x+εy時的預期支付,而右邊的表達式記為對于策略y而言,其所對應的情況的預期支付。
實際上,由上述定義知道,進化穩定性十分有用的特性是一個策略x是進化穩定的當且僅當(1)它是對自身的最佳反應;(2)它是對所有其他最佳反應的反應,當這些策略對其自身的反應比較時。為了弄清楚(1)是必要的,只需充分觀察即知,否則會存在一個對x而言的最佳反應y。在一個充分小的種群中,表現出的這個“變異”策略幾乎總會遇到策略x,從而會贏得比x水平高的收益。同樣,(2)是必需的,因為否則的話一定會存在一個對x而言的可供選擇的最佳反應y,它會贏得與x遇到x的時候或者至少x遇到y時候的收益相同,從而y的平均水平會贏得比混合種群要高一些的收益。注意到,進化穩定性準則沒有解釋種群是如何達到這種策略的。然而,一旦達到這種策略,則這樣的策略對進化壓力來說是穩健的。同時,人們發現,進化穩定性沒有處理種群中具有兩個或更多“變異”同時出現的情況。因而,它隱含地把變異當成稀少事件,以致于種群有時間在另一個變異出現之前響應這種狀況。
雖然,進化穩定性準則是一個生物學上的概念,但是它為各種各樣的人類行為提供一種有關的穩健性準則。這樣,進化穩定性要求人類群體中企圖采用可選擇的策略的任何一個小團體不比已經采用“固有”策略的那些個體所構成的團體收益好。相反,采用固有策略的那些個體所構成的團體缺乏激勵來改變他們的策略。但是,那些采用可選策略的小團體卻受激勵而具有轉變固有策略的行為。在這種社會背景下,進化穩定策略被人們看成是傳統習慣或者已經確立起來的行為規則。比如,社會風氣、企業管理模式等都可以看為是某種人類群體的規則,而極個別的人群社會行為、習氣的變化就會被認為是“變異”。當然,在這種背景下,如果那些極少數的人群或企業的收益比不變異的人群或企業高時,那么這些變異分子會生存得更好!反之,則被淘汰掉。
可惜的是,許多博弈沒有進化穩定策略。于是,研究人員探討各種比進化穩定性稍弱一些的形式,以及集值形式的進化穩定性概念等。此外,ESS概念不能推廣到n人對策的情況上。在本質上,ESS要求強的納什均衡來實施,也就是每一個策略對于策略組而言應是唯一的最佳反應。
(二)復制動力學。復制動力學是選擇過程的顯性模型,它說明種群是如何分配博弈中有聯系的不同純策略隨時間而演化的。復制動力學的數學公式是由Taylor和Jonker于1978年在“進化穩定策略和對策動力學”一文中提出的。他們認為由隨機配對的個體所構成的一個大種群執行有限對策的兩人博弈,猶如進化穩定性的設置一樣。然而,此處的個體僅僅采用純策略。種群狀態是指在純策略上的一個分布x。這種狀態在數學上與博弈中的混合策略是等價的。
如果博弈中的收益表示成生物學上的適合性,也就是后代的數目,同時每一個后代繼續其父母的策略,因此,采用純策略i的個體數目(在大的種群中)將以某一比率指數增長,而此等于對純策略i的預期收益u(ei,x),當執行著表示種群中當前策略分布的混合策略x時,采用任何純策略i的種群分布的增長率等于此策略的收益與種群中平均收益的差。后者,等同于混合策略x當與其自身博弈時的預期收益u(x,x)。這是一個單種群的對稱兩人博弈的復制動力學。
Xi=[u(ei,x)-u(x,x)]xi………………(2)
注意到,對當前種群狀態x的最佳反應具有最高的增長率。第二最佳反應具有第二高的增長率,如此等等。然而,雖然更成功的純策略比欠成功的純策略增長得快,但是種群中的平均收益不必隨時間而增長。產生這一原因的可能性是,如果一個個體由采用最佳策略的個體所代替,那么遇見這個新個體的成員會得到比較低的收益。例如,這正是囚徒困境博弈的情況。如果最初幾乎所有個體采用“合作”,那么個體中將逐漸地轉向“抵賴”,從而平均收益將下降。然而,如果博弈在兩個人總是獲得相等的收益意義上是一個雙對稱的,那么自然選擇的基本規律將成立:種群中收益隨時間而增長,即使沒有必要成為全局最大的。例如,這就是合作博弈的情況,其中所有個體逐漸地轉向到執行同一個純策略上。復制動力學能夠推廣到n人博弈的情況上,這可以看成是來自于n種群、中的個體隨機地以n類型配對,其中每一個參與者的地位狀況正如納什所給出的群體行為解釋的那樣。目前,存在兩種形式的n種群復制動力學,其中一個是由Taylor在1979年提出的,另一個是由MaynardSmith在1982年給出的。
(三)學習模型與選擇動力學
人們把學習模型分成三種類型,即基于信念的學習、強化學習以及模仿學習。最近的一些研究表明,復制動力學是由后面兩類的某種模型所促成的。
1.強化學習模型
心理學上的有關個體學習文獻的中心模型是所謂的強化模型,這是由Bush和Mosteller在1951年提出的。然而,它的思想可以追溯到Thorndikede的“導致過去好的選擇在將來最有可能重復”。當然,人們注意到這里的選擇隱含地作為概率上的一種說法。
Bush和Mosteller的強化學習模型及其他的推廣形式,已經在一系列的人類主觀執行博弈中得到運用。可惜,這些模型的通常數學性質,人們還知道得很少。然而,Borgers和Sarin在1997年發表的“通過強化和復制動力學的學習”文章把Cross的Bush—Mosteller學習模型的形式與Taylor的兩種群復制動力學進行了理論上的對比研究。雖然這種學習過程在離散時間背景中是隨機的、演化的,而復制動力學在連續時間背景中是確定的、演化的。他們證明,在適當地構造連續時間的界限下,他們的學習過程在有限時間區間內可通過復制動力學來*近。
更確切地講,他們研究在多次博弈回合中(n=l,2,…),在一個固定的兩人參與者采用混合策略對中有限兩人博弈的情況。每一個參與者憑借由其所運用的純策略來記錄概率如下。如果參與者1(同樣的考察參與者2)在博弈的n次回合中運用純策略k,并且獲得一個正的收益Vk(n),這里Vk(n)作為隨機變量,它依賴于參與者2所做出的隨機選擇,那么參與者1對于運用這個策略的未來概率將越增加,其收益也就越高。參與者2以同樣的方法記錄其選擇概率向量Y。所有收益均假設處于單位開區間上,不過,這里的收益不能解釋成N—M(馮·諾依曼和摩根斯藤)效用。因此,一旦所用策略的概率是遞增的,那么所有選擇均是強化的。
從任何一個初始概率向量X(0)=x0和Y(0)=Y0開始,方程(3)定義出博弈的混合策略空間中的一個馬爾可夫鏈{X(n),Y(n)}∞n=1。其中參數δ>0表示博弈的兩次回合之間的時間:t=nδ是n次博弈回合中的“真實”時間。Borgers和Sarin得到這一過程的連續時間界限,通過設n∞和δ0以便有δn=t,在任何有限的“真實”時間上來估計價值。因此,博弈在越來越短的時間區間上執行,同時概率以相稱的較小數值得以適應。他們證明,在這個界限內,此過程以狀態(x(t),y(t))的形式出現在單位區間概率上,其中如果復制動力學的初始狀態在時間0處以(x0,y0)開始,那么復制動力學會在時間t達到。在這個意義上,復制動力學在有限時間區間上近似于強化動力學(3)。
然而,這兩類模型的漸進性質卻十分不同。例如,為了在直觀上理解這點,假設參與者1的收益既是恒定獨立于他的策略選擇又獨立于參與者2的策略選擇。設參與者1在強化動力學中的初始狀態指派概率等于參與者1的所有可獲得純策略的概率。同樣的,設復制動力學的初始狀態指派種群的各部分采用策略的概率等于所有可獲得純策略的概率。顯然,復制動力學的解是一個常量:所有種群的各部分分得的收益永遠相等。然而,強化動力學的實現會容易隨時間而收斂到參與者1可獲得的任何一個純策略上。由于在博弈的第一個回合中選用策略的概率將高于在下一次博弈回合中所選用的策略概率,所以強化動力學的性質更有可能把參與者1“鎖定”到他的任何一個純策略上。Borgers和Sarin證明,任何有限兩人博弈的強化動力學以概率1收斂到一個純策略組合上,而不像復制動力學那樣。
2.模仿學習模型
博弈論學者Gale,Binmore和Samuelon在1995年提出一個所有個體參與者都采用純策略的大群體,但是有限博弈的社會學習的簡單模型。每一個參與者在博弈中都贏得一個渴望水平的收益。在離散時間0,δ,2δ,…上,任意從群體中抽取個體δ部分,把其當前收益與他們的渴望水平收益相比較,其中δ>0是很小的數。如果個體實現的收益低于其生存水平收益,那么該個體就會隨機地模仿已抽取的個體,在相同的參與者群體中,所有其他個體都具有相同的概率被抽取。由此可見,如果渴望水平收益具有均勻分布(某一個區間上包含所有可能的收益值),那么模仿的概率對于個體的當前策略而言,在預期收益上是線性遞減的。對于很小的δ,他們證明這個過程可以由有限時間區間上的復制動力學來*近。
人們把個體策略的適應過程作為連續時間中的一個隨機過程。假設在有限群體中每一個個體時常得到一個沖動,使其改變純策略。如果這些沖動是依照i.i.d.的Poisson分布,那么同時發生的概率是零,而且總的過程也是一個Poisson過程。此外,總過程的密度剛好是各個過程密度的和。如果群體是很大的,那么人們利用預期值給出的確定流來近似這個總過程。
Bjornestedt和Weibull在1996年研究了一系列這種模型,其中改變的個體在其博弈的群體中模仿其他的個體,并證明許多正收益的選擇動力學可以被人們推導出來,包括復制動力學的三種形式。特別,如果個體改變比率對其策略而言預期收益是線性遞減的,那么每一個純策略Poisson過程的密度是與其個體總數大小成比例,同時比例因素將是其預期收益遞減的。如果每一個改變的個體選擇其未來的策略是通過在其博弈中隨機地模仿抽取的個體,那么其作為結果的流*近也是一個復制動力學。
Schlag在1997年分析當個體經常以參與者的同樣地位去模仿其他參與者個體時,個體應該選擇什么樣的模仿規則的問題,然而參與者的同樣地位卻受制于信息和記憶的約束。他發現,如果個體想要學習規則是在所有平穩環境中收益遞增,那么此個體應該滿足:(1)當改變策略時,總是通過模仿來進行;(2)永遠不向收益實現比其所擁有收益低的那些個體模仿;(3)向收益實現比其擁有收益高的那些個體模仿。
這種模型被各種各樣不同的環境所發展。在有限兩人博弈中,Schlag假設在隨機地來自于兩個相等大小的有限群體的個體之間兩兩配對,每一個有其自己的地位。個體總是執行純策略。在每一個收益實現之后,每一個個體都要隨機地與其他個體所處的群體進行抽樣調查,并且比較兩種收益的實現。行為規則是一種函數關系,即把收益實現和所用策略對應到博弈中個體地位上可獲得的純策略集合上的分布,為的是采用新的策略。換句話說,允許使用個體的唯一資料是這種收益實現和純策略對。特別,從較早的博弈回合中實現收益被忽略。此外,假設個體在所有博弈中運用相同的行為規則,具有相同數目的純策略可選擇;也就是,個體不需要知曉他們執行什么樣的博弈,他們知道所使用的純策略數目就足夠了。
在任何這樣的博弈中,導致預期收益弱遞增的以及在對手種群中對于任何固定策略分布的行為規則,稱為改進。本文中的重要結果是對于所有這樣規則的刻畫。改進規則的一個特征是他們是模仿的:個體堅持其初始的策略或者采用抽樣的個體策略;但是不會轉向第三個的策略。
行為規則稱為是占優的改進規則,如果在某一個博弈中不存在改進規則產生比較高的預期收益改進比例,而且在對手種群中的某一個策略分布上。Schlag證明,某一個行為規則為占優的改進規則,其具有上面給出的性質(1)(2)(3)。這個比例模仿規則是其自己的一個改進規則,而且可以證明它確有一些其他吸引人的性質。Schlag證明,Taylor兩種群復制動力學的離散時間形式可以*近在任何給定有限時間范圍內導出的一個隨機過程,只要種群充分的大就行。
(四)進化對策論中的一些結論
本文集中探討關于有限n人博弈的顯性動力學種群模型方向的介紹,其中個體執行純策略。首先探討確定性選擇動力學,然后介紹隨機進化模型,其中把隨機變異過程與確定性選擇過程或者隨機選擇過程結合起來。
研究確定性動力學項目性質的一種直接方法是選取一個初始的種群狀態,并且稍后可以計算。然后,人們應該記住讓初始的所有純策略在種群中出現,由于初始的已亡策略將在選擇過程中仍保持已亡的狀態。這種解的軌跡稱為內部的。解的軌跡隨時間流逝而安定下來,就稱為收斂的。反之,則稱為發散的。
如果種群狀態是收斂的,那么什么是長時期限制狀態的本質呢?可以證明,在任何一種弱的正收益選擇動力學中,沿著任何收斂的內部軌跡,限制狀態必將構建納什均衡,研究人員發現,種群執行某種納什均衡或者在漸進意義上的納什均衡。Nachbar在1990年第一個證明出單種群復制動力學的這個結果。事實上,如果選擇過程遇見弱的正收益的相對溫和的條件,且如果匯總的行為隨時間而安定下來,那么在長時期種群狀態中的個體就好像他們預期一個特殊的納什均衡對此執行著一個最佳反應,這點頗像是納什所聲稱的“群體解釋”。
如果對于弱的正收益選擇動力學的內部解隨時間而收斂,那么我們看到幸存下來的策略在作為結果的混合策略組合的最佳反應的意義上是理性的。此處的問題是,如果解的軌跡不收斂,那么會發生什么情況嗎?當長時期中沒有均衡達成時,我們產生的問題是,執行是否為理性的。
非合作博弈論中基本的理性假設是參與者不采用作為嚴格的劣(strictlydominated)純策略。這個假設要求不知道其他參與者的偏好或者行為。一個更嚴格的理性一--附有知識的---假設是參與者不采用作為迭代的嚴格的劣策略。除了回避嚴格的劣的策略之外,這個假定要求所有參與者相互知道彼此的收益,而這些就是他們知道等等,一直到共同知識的某一個有限水平上使得迭代剔除嚴格劣的純策略的過程停止。
因此,進化對策論中的基本問題是進化選擇過程是否剔除掉所有的嚴格劣策略或者所有的迭代的嚴格劣純策略。如果所有迭代的嚴格劣策略消失,那么這提供了在策略上相互作用的參與者行為假設的一種進化證明,就好像此假設是參與者他們作為理性人的共同知識。
Akin在1980年證明,在任何有限對稱兩人博弈中所有嚴格劣的純策略沿著關于單種群復制動力學的任何一個內部解的軌跡都能消失。Samuelson和Zhang在1992年把這一結論推廣到某一個兩種群選擇動力學的正收益子集合中的迭代的嚴格劣純策略上。他們將這種情況稱為聚集單調的(aggregatemonotonic)。
對長時期進化狀態分析的輔助方法是研究種群狀態的穩定性,也就是考察種群對于很小的擾動是如何反應的。Bomze教授在1986年曾證明,如果種群狀態在單種群復制動力學中是弱的動態穩定的,那么此狀態就是對自己的最佳反應,這里的狀態被認為是采用混合策略的。經常運用的穩定性準則是李雅普諾夫穩定性,即狀態x是李雅普諾夫穩定的,如果x的鄰域B包含x的鄰域A,使得在A中開始的解將永遠保留在B中。不是李雅普諾夫穩定的狀態稱為不穩定的。因此,不僅進化穩定性的靜態穩定性準則,而且復制動力學中的動態穩定性都蘊涵著納什均衡的實施。這個結果能夠推廣到任何有限n人博弈中的任何弱的正收益選擇動力學上。總之,對進化壓力而言,以各種不同方式系統闡述的穩定性都需要納什均衡來實施。然而,不是所有的納什均衡在這個方面都是穩定的,因此,這些進化穩定性準則是納什均衡概念的精煉。
另外,研究者在考察動力學進化穩定性時,把隨機因素并入到進化過程的建模當中。特別,變異過程被認為是內在隨機的一種情況。隨機振動可以憑借穩定性分析方法來解釋確定性選擇動力學;一個穩定的種群狀態對于種群的孤立的很小擾動而言是穩健的。然而,這種穩定分析幾乎說不出一系列的小振動或者同時發生的小振動累計之后促成的大振動的穩健性。這樣的一系列或者同時發生的連續不斷的振動會使種群狀態離開選擇過程的吸引域。雖然這種大量涌現的小振動不可能是統計意義上的獨立而稀少變異的事件,但這一可能性在基本方法上卻改變了動力學進化過程的性質。代替歷史依賴性(依賴于初始種群狀態),此過程會成為遍歷的(ergodic),也就是具有一種漸進分布,其中漸進分布是歷史獨立的(對于所有的初始種群狀態都是相同的)。從而,導致人們現今研究的一個專題——隨機動力學穩定性。這種研究路線的先驅者是Foster和Young(1990),隨后是Fudenberg和Harris(1992),Young(1993)等等。注意到,進化穩定性準則沒有解釋種群是如何達到這種策略的。然而,一旦達到這種策略,則這樣的策略對進化壓力來說是穩健的。同時,人們發現,進化穩定性沒有處理種群中具有兩個或更多“變異”同時出現的情況。因而,它隱含地把變異當成稀少事件,以致于種群有時間在另一個變異出現之前響應這種狀況。
雖然,進化穩定性準則是一個生物學上的概念,但是它為各種各樣的人類行為提供一種有關的穩健性準則。這樣,進化穩定性要求人類群體中企圖采用可選擇的策略的任何一個小團體不比已經采用“固有”策略的那些個體所構成的團體收益好。相反,采用固有策略的那些個體所構成的團體缺乏激勵來改變他們的策略。但是,那些采用可選策略的小團體卻受激勵而具有轉變固有策略的行為。在這種社會背景下,進化穩定策略被人們看成是傳統習慣或者已經確立起來的行為規則。比如,社會風氣、企業管理模式等都可以看為是某種人類群體的規則,而極個別的人群社會行為、習氣的變化就會被認為是“變異”。當然,在這種背景下,如果那些極少數的人群或企業的收益比不變異的人群或企業高時,那么這些變異分子會生存得更好!反之,則被淘汰掉。
可惜的是,許多博弈沒有進化穩定策略。于是,研究人員探討各種比進化穩定性稍弱一些的形式,以及集值形式的進化穩定性概念等。此外,ESS概念不能推廣到n人對策的情況上。在本質上,ESS要求強的納什均衡來實施,也就是每一個策略對于策略組而言應是唯一的最佳反應。
(二)復制動力學。復制動力學是選擇過程的顯性模型,它說明種群是如何分配博弈中有聯系的不同純策略隨時間而演化的。復制動力學的數學公式是由Taylor和Jonker于1978年在“進化穩定策略和對策動力學”一文中提出的。他們認為由隨機配對的個體所構成的一個大種群執行有限對策的兩人博弈,猶如進化穩定性的設置一樣。然而,此處的個體僅僅采用純策略。種群狀態是指在純策略上的一個分布x。這種狀態在數學上與博弈中的混合策略是等價的。
如果博弈中的收益表示成生物學上的適合性,也就是后代的數目,同時每一個后代繼續其父母的策略,因此,采用純策略i的個體數目(在大的種群中)將以某一比率指數增長,而此等于對純策略i的預期收益u(ei,x),當執行著表示種群中當前策略分布的混合策略x時,采用任何純策略i的種群分布的增長率等于此策略的收益與種群中平均收益的差。后者,等同于混合策略x當與其自身博弈時的預期收益u(x,x)。這是一個單種群的對稱兩人博弈的復制動力學。
Xi=[u(ei,x)-u(x,x)]xi………………(2)
注意到,對當前種群狀態x的最佳反應具有最高的增長率。第二最佳反應具有第二高的增長率,如此等等。然而,雖然更成功的純策略比欠成功的純策略增長得快,但是種群中的平均收益不必隨時間而增長。產生這一原因的可能性是,如果一個個體由采用最佳策略的個體所代替,那么遇見這個新個體的成員會得到比較低的收益。例如,這正是囚徒困境博弈的情況。如果最初幾乎所有個體采用“合作”,那么個體中將逐漸地轉向“抵賴”,從而平均收益將下降。然而,如果博弈在兩個人總是獲得相等的收益意義上是一個雙對稱的,那么自然選擇的基本規律將成立:種群中收益隨時間而增長,即使沒有必要成為全局最大的。例如,這就是合作博弈的情況,其中所有個體逐漸地轉向到執行同一個純策略上。復制動力學能夠推廣到n人博弈的情況上,這可以看成是來自于n種群、中的個體隨機地以n類型配對,其中每一個參與者的地位狀況正如納什所給出的群體行為解釋的那樣。目前,存在兩種形式的n種群復制動力學,其中一個是由Taylor在1979年提出的,另一個是由MaynardSmith在1982年給出的。
(三)學習模型與選擇動力學
人們把學習模型分成三種類型,即基于信念的學習、強化學習以及模仿學習。最近的一些研究表明,復制動力學是由后面兩類的某種模型所促成的。
1.強化學習模型
心理學上的有關個體學習文獻的中心模型是所謂的強化模型,這是由Bush和Mosteller在1951年提出的。然而,它的思想可以追溯到Thorndikede的“導致過去好的選擇在將來最有可能重復”。當然,人們注意到這里的選擇隱含地作為概率上的一種說法。
Bush和Mosteller的強化學習模型及其他的推廣形式,已經在一系列的人類主觀執行博弈中得到運用。可惜,這些模型的通常數學性質,人們還知道得很少。然而,Borgers和Sarin在1997年發表的“通過強化和復制動力學的學習”文章把Cross的Bush—Mosteller學習模型的形式與Taylor的兩種群復制動力學進行了理論上的對比研究。雖然這種學習過程在離散時間背景中是隨機的、演化的,而復制動力學在連續時間背景中是確定的、演化的。他們證明,在適當地構造連續時間的界限下,他們的學習過程在有限時間區間內可通過復制動力學來*近。
更確切地講,他們研究在多次博弈回合中(n=l,2,…),在一個固定的兩人參與者采用混合策略對中有限兩人博弈的情況。每一個參與者憑借由其所運用的純策略來記錄概率如下。如果參與者1(同樣的考察參與者2)在博弈的n次回合中運用純策略k,并且獲得一個正的收益Vk(n),這里Vk(n)作為隨機變量,它依賴于參與者2所做出的隨機選擇,那么參與者1對于運用這個策略的未來概率將越增加,其收益也就越高。參與者2以同樣的方法記錄其選擇概率向量Y。所有收益均假設處于單位開區間上,不過,這里的收益不能解釋成N—M(馮·諾依曼和摩根斯藤)效用。因此,一旦所用策略的概率是遞增的,那么所有選擇均是強化的。
從任何一個初始概率向量X(0)=x0和Y(0)=Y0開始,方程(3)定義出博弈的混合策略空間中的一個馬爾可夫鏈{X(n),Y(n)}∞n=1。其中參數δ>0表示博弈的兩次回合之間的時間:t=nδ是n次博弈回合中的“真實”時間。Borgers和Sarin得到這一過程的連續時間界限,通過設n∞和δ0以便有δn=t,在任何有限的“真實”時間上來估計價值。因此,博弈在越來越短的時間區間上執行,同時概率以相稱的較小數值得以適應。他們證明,在這個界限內,此過程以狀態(x(t),y(t))的形式出現在單位區間概率上,其中如果復制動力學的初始狀態在時間0處以(x0,y0)開始,那么復制動力學會在時間t達到。在這個意義上,復制動力學在有限時間區間上近似于強化動力學(3)。
然而,這兩類模型的漸進性質卻十分不同。例如,為了在直觀上理解這點,假設參與者1的收益既是恒定獨立于他的策略選擇又獨立于參與者2的策略選擇。設參與者1在強化動力學中的初始狀態指派概率等于參與者1的所有可獲得純策略的概率。同樣的,設復制動力學的初始狀態指派種群的各部分采用策略的概率等于所有可獲得純策略的概率。顯然,復制動力學的解是一個常量:所有種群的各部分分得的收益永遠相等。然而,強化動力學的實現會容易隨時間而收斂到參與者1可獲得的任何一個純策略上。由于在博弈的第一個回合中選用策略的概率將高于在下一次博弈回合中所選用的策略概率,所以強化動力學的性質更有可能把參與者1“鎖定”到他的任何一個純策略上。Borgers和Sarin證明,任何有限兩人博弈的強化動力學以概率1收斂到一個純策略組合上,而不像復制動力學那樣。
2.模仿學習模型
博弈論學者Gale,Binmore和Samuelon在1995年提出一個所有個體參與者都采用純策略的大群體,但是有限博弈的社會學習的簡單模型。每一個參與者在博弈中都贏得一個渴望水平的收益。在離散時間0,δ,2δ,…上,任意從群體中抽取個體δ部分,把其當前收益與他們的渴望水平收益相比較,其中δ>0是很小的數。如果個體實現的收益低于其生存水平收益,那么該個體就會隨機地模仿已抽取的個體,在相同的參與者群體中,所有其他個體都具有相同的概率被抽取。由此可見,如果渴望水平收益具有均勻分布(某一個區間上包含所有可能的收益值),那么模仿的概率對于個體的當前策略而言,在預期收益上是線性遞減的。對于很小的δ,他們證明這個過程可以由有限時間區間上的復制動力學來*近。
人們把個體策略的適應過程作為連續時間中的一個隨機過程。假設在有限群體中每一個個體時常得到一個沖動,使其改變純策略。如果這些沖動是依照i.i.d.的Poisson分布,那么同時發生的概率是零,而且總的過程也是一個Poisson過程。此外,總過程的密度剛好是各個過程密度的和。如果群體是很大的,那么人們利用預期值給出的確定流來近似這個總過程。
Bjornestedt和Weibull在1996年研究了一系列這種模型,其中改變的個體在其博弈的群體中模仿其他的個體,并證明許多正收益的選擇動力學可以被人們推導出來,包括復制動力學的三種形式。特別,如果個體改變比率對其策略而言預期收益是線性遞減的,那么每一個純策略Poisson過程的密度是與其個體總數大小成比例,同時比例因素將是其預期收益遞減的。如果每一個改變的個體選擇其未來的策略是通過在其博弈中隨機地模仿抽取的個體,那么其作為結果的流*近也是一個復制動力學。
Schlag在1997年分析當個體經常以參與者的同樣地位去模仿其他參與者個體時,個體應該選擇什么樣的模仿規則的問題,然而參與者的同樣地位卻受制于信息和記憶的約束。他發現,如果個體想要學習規則是在所有平穩環境中收益遞增,那么此個體應該滿足:(1)當改變策略時,總是通過模仿來進行;(2)永遠不向收益實現比其所擁有收益低的那些個體模仿;(3)向收益實現比其擁有收益高的那些個體模仿。
這種模型被各種各樣不同的環境所發展。在有限兩人博弈中,Schlag假設在隨機地來自于兩個相等大小的有限群體的個體之間兩兩配對,每一個有其自己的地位。個體總是執行純策略。在每一個收益實現之后,每一個個體都要隨機地與其他個體所處的群體進行抽樣調查,并且比較兩種收益的實現。行為規則是一種函數關系,即把收益實現和所用策略對應到博弈中個體地位上可獲得的純策略集合上的分布,為的是采用新的策略。換句話說,允許使用個體的唯一資料是這種收益實現和純策略對。特別,從較早的博弈回合中實現收益被忽略。此外,假設個體在所有博弈中運用相同的行為規則,具有相同數目的純策略可選擇;也就是,個體不需要知曉他們執行什么樣的博弈,他們知道所使用的純策略數目就足夠了。
在任何這樣的博弈中,導致預期收益弱遞增的以及在對手種群中對于任何固定策略分布的行為規則,稱為改進。本文中的重要結果是對于所有這樣規則的刻畫。改進規則的一個特征是他們是模仿的:個體堅持其初始的策略或者采用抽樣的個體策略;但是不會轉向第三個的策略。
行為規則稱為是占優的改進規則,如果在某一個博弈中不存在改進規則產生比較高的預期收益改進比例,而且在對手種群中的某一個策略分布上。Schlag證明,某一個行為規則為占優的改進規則,其具有上面給出的性質(1)(2)(3)。這個比例模仿規則是其自己的一個改進規則,而且可以證明它確有一些其他吸引人的性質。Schlag證明,Taylor兩種群復制動力學的離散時間形式可以*近在任何給定有限時間范圍內導出的一個隨機過程,只要種群充分的大就行。
(四)進化對策論中的一些結論
本文集中探討關于有限n人博弈的顯性動力學種群模型方向的介紹,其中個體執行純策略。首先探討確定性選擇動力學,然后介紹隨機進化模型,其中把隨機變異過程與確定性選擇過程或者隨機選擇過程結合起來。
研究確定性動力學項目性質的一種直接方法是選取一個初始的種群狀態,并且稍后可以計算。然后,人們應該記住讓初始的所有純策略在種群中出現,由于初始的已亡策略將在選擇過程中仍保持已亡的狀態。這種解的軌跡稱為內部的。解的軌跡隨時間流逝而安定下來,就稱為收斂的。反之,則稱為發散的。
如果種群狀態是收斂的,那么什么是長時期限制狀態的本質呢?可以證明,在任何一種弱的正收益選擇動力學中,沿著任何收斂的內部軌跡,限制狀態必將構建納什均衡,研究人員發現,種群執行某種納什均衡或者在漸進意義上的納什均衡。Nachbar在1990年第一個證明出單種群復制動力學的這個結果。事實上,如果選擇過程遇見弱的正收益的相對溫和的條件,且如果匯總的行為隨時間而安定下來,那么在長時期種群狀態中的個體就好像他們預期一個特殊的納什均衡對此執行著一個最佳反應,這點頗像是納什所聲稱的“群體解釋”。
如果對于弱的正收益選擇動力學的內部解隨時間而收斂,那么我們看到幸存下來的策略在作為結果的混合策略組合的最佳反應的意義上是理性的。此處的問題是,如果解的軌跡不收斂,那么會發生什么情況嗎?當長時期中沒有均衡達成時,我們產生的問題是,執行是否為理性的。
非合作博弈論中基本的理性假設是參與者不采用作為嚴格的劣(strictlydominated)純策略。這個假設要求不知道其他參與者的偏好或者行為。一個更嚴格的理性一--附有知識的---假設是參與者不采用作為迭代的嚴格的劣策略。除了回避嚴格的劣的策略之外,這個假定要求所有參與者相互知道彼此的收益,而這些就是他們知道等等,一直到共同知識的某一個有限水平上使得迭代剔除嚴格劣的純策略的過程停止。
因此,進化對策論中的基本問題是進化選擇過程是否剔除掉所有的嚴格劣策略或者所有的迭代的嚴格劣純策略。如果所有迭代的嚴格劣策略消失,那么這提供了在策略上相互作用的參與者行為假設的一種進化證明,就好像此假設是參與者他們作為理性人的共同知識。
Akin在1980年證明,在任何有限對稱兩人博弈中所有嚴格劣的純策略沿著關于單種群復制動力學的任何一個內部解的軌跡都能消失。Samuelson和Zhang在1992年把這一結論推廣到某一個兩種群選擇動力學的正收益子集合中的迭代的嚴格劣純策略上。他們將這種情況稱為聚集單調的(aggregatemonotonic)。
對長時期進化狀態分析的輔助方法是研究種群狀態的穩定性,也就是考察種群對于很小的擾動是如何反應的。Bomze教授在1986年曾證明,如果種群狀態在單種群復制動力學中是弱的動態穩定的,那么此狀態就是對自己的最佳反應,這里的狀態被認為是采用混合策略的。經常運用的穩定性準則是李雅普諾夫穩定性,即狀態x是李雅普諾夫穩定的,如果x的鄰域B包含x的鄰域A,使得在A中開始的解將永遠保留在B中。不是李雅普諾夫穩定的狀態稱為不穩定的。因此,不僅進化穩定性的靜態穩定性準則,而且復制動力學中的動態穩定性都蘊涵著納什均衡的實施。這個結果能夠推廣到任何有限n人博弈中的任何弱的正收益選擇動力學上。總之,對進化壓力而言,以各種不同方式系統闡述的穩定性都需要納什均衡來實施。然而,不是所有的納什均衡在這個方面都是穩定的,因此,這些進化穩定性準則是納什均衡概念的精煉。
另外,研究者在考察動力學進化穩定性時,把隨機因素并入到進化過程的建模當中。特別,變異過程被認為是內在隨機的一種情況。隨機振動可以憑借穩定性分析方法來解釋確定性選擇動力學;一個穩定的種群狀態對于種群的孤立的很小擾動而言是穩健的。然而,這種穩定分析幾乎說不出一系列的小振動或者同時發生的小振動累計之后促成的大振動的穩健性。這樣的一系列或者同時發生的連續不斷的振動會使種群狀態離開選擇過程的吸引域。雖然這種大量涌現的小振動不可能是統計意義上的獨立而稀少變異的事件,但這一可能性在基本方法上卻改變了動力學進化過程的性質。代替歷史依賴性(依賴于初始種群狀態),此過程會成為遍歷的(ergodic),也就是具有一種漸進分布,其中漸進分布是歷史獨立的(對于所有的初始種群狀態都是相同的)。從而,導致人們現今研究的一個專題——隨機動力學穩定性。這種研究路線的先驅者是Foster和Young(1990),隨后是Fudenberg和Harris(1992),Young(1993)等等。四、進化對策論在經濟學中的應用
進化對策論的產生、發展在本質上就是起因于對策論中關于理人的假設與經濟應用中行為人“試驗——失誤”(即試錯法)學習過程相偏離的事實而引發的。從上述的闡述中,我們可以看到,進化對策論在經濟學里的應用前景是十分廣闊的和吸引人的。
最近,Routledge探討了金融市場上個體行為人是如何通過適應性或者進化學習來發現內生變化并運用這種內生關系的一種學習模型。他通過對來自于模仿過程和經驗過程來對個體的投資行為建模,而不是運用傳統上的顯性最優化方法放松關于知識和理性的假設。Routledge運用Grossman和Stiglitz的1980年發表的經濟模型的形式。Grossman和Stiglitz(GS)模型提供了考察適應學習過程的一種良好的框架,因為它是獲得內生信息的標準模型,這點已經被后來的其他許多關于學習方面的模型都是基于GS而提出的事實所證明。
如果假設交易者能夠觀察到他們自己的適應度和其他行為人的行為,那么模仿是如何發生的許多特殊細節就顯得不重要了。Routledge的研究結果表明:首先,作為單調選擇動力學的適應學習會促成GS均衡;其次,由單凋適應學習驅使的模仿的穩健性可從隨機實驗中來獲得噪聲(noise)來研究。他發現,適應學習是缺少穩健性的。特別,他運用Binmore和Samuelson(1999)的技術來對模仿和經驗建模。為了使帶有漂移(drift)的適應學習產生GS理性預期均衡,必要的條件是在風險資產供給中的噪聲與學習過程中的經驗水平有很大的關系。
五、問題與前景
我們注意到,進化過程并不總是導致最優性、均衡或者社會有效性。通過目前已取得的一些成果,我們認為下面的一些方向或許是值得學者進一步探討與研究的:
(1)引進機構,分析市場選擇機制。
(2)探討博弈中學習規則的進化穩定性。結果,這就會導致擁有適度認知能力的個體的模型。
(3)進一步探討擴展形式博弈中的進化過程。
(4)對*近理論方面的進一步探討。我們需要更多地了解確定性模型和隨機性模型之間的聯系與關系。
(5)探索、研究結構化的穩健預測。顯然,某種博弈的子結構,諸如在最佳反應和弱最佳反應的條件下所促成的純策略集合,是進化過程的穩健吸引子(robustattractor)等。
本文概括地闡述了進化對策論中的理論內容和一些模型,特別是博弈中有關學習模型的新近發展。通過上面的分析,我們發現,進化對策論的發展動力來自于與其他社會學科的交叉融合,吸收其他社會科學中的有益知識。為了把有關的選擇過程、學習過程以及變異過程的類別變窄,我們需要更多地知曉個體、團體、組織、廠商以及整個社會是如何隨時間而適應和學習的。這里的部分內容正是實驗對策論中所要探討的,同時這也是我們應向其他社會科學學習的領域。
參考文獻:
1.王忠玉:《1994年度諾貝爾經濟學獎與對策論》,載《科學(ScientificAmerican中文版)》,1996(7),3—5頁。
2.王忠玉:《金融市場從眾行為的數理模型》,載《中國管理科學》,2000(2),50~55頁。
3.Binmore,K.,1990.EssaysontheFoundationsofGameTheory,BasilBlackwell.
4.Binmore,K.,Samuelson,L.andVaughan,R.,1995.MusicalChairs:ModellingNoisyEvolution.GameandEconomicBehavior11,1--35.
5.Binmore,K.andSamuelson,L.,1999.EvolutionaryDriftandEquilibriumSelection.ReviewofEconomicStudies,66,363--393.
6.Blume,L.andEasleyD,1992.EvolutionandMarketBehavior.JournalofEconomicTheory58,9-45.
7.BlumeL.andEasley,D.,1990.EvolutionandLearninginCompetitiveMarkets,inKirman,A.andSalmon,M.(eds.),LearningandRationalityinEconomics,Blackwell(Oxford).
8.Bomze,1.andPotscher,B.,1989.GameTheoreticalFoundationsofEvolutionaryStability.SpringerVerlag(Berlin).
9.Bomze,I.andWeibull,J.,1996.DoesNeutralStabilityImplyLyapunovStability.9Gameand
EconomicBehavior11,173--192.
10.Bryan,R.Routledge,1999.AdaptiveLearninginFinancialMarkets.TheReviewofFinancial
Studies12,1165--1202.
11.Canning,D.,1990.LearningandSocialEquilibriuminLargePopulations,in
Kirman,A.andSalmon,M.(eds.),LearningandRationalityinEconomics,Blackwell(Oxford).
12.Cressman,R.,1992.TheStabilityConceptofEvolutionaryGameTheory,SpringerVerlag(Berlin).
13.VanDammeE.,1987.StabilityandPerfectionofNashEquilibria,SpringerVerlag(Berlin).
14.Dekel,E.andScotchmer,S.,1992.ontheEvolutionofOptimalBehavior.Journalof
EaonomicTheory57,392--406.
15.Fudenberg,D.andLevine,D.,1993.Steady-stateLearningandNashEquilibrium,Econometrica61,523-574.
16.Fudenberg,D.andLevine,D.,1997.TheTheoryofLearninginGames.MITPress.
17.Haesanyi,J.andSelten,R.,1988.AGeneralTheoryofEquilibriumSelectioninGame,MITPress.
18.Kandori,M.,Mailath,G.andRob,R.,1993.Learning,Mutation,andLong-runEquilibriainGame,Econometrica61,29--56.
19.Nelson,R.andWinter,S.1982.AnEvolutionaryTheoryofEconomicChange.HarvardUniversityPress(CambridgeMA).
20.Robson,J.A.2001.TheBiologicalBasisofEconomicBehavior.JournalofEconomicLiterature,Vol.ⅩⅩⅩⅨ(March2001),11--33.
21.Samuelson,L.andZhang,J.,1992.EvolutionaryStabilityinAsymmetricGames.JournalofEconomicTheory,57,363--391.
篇9
雖然利益相關者對企業的共同治理已成為現代企業制度發展的普遍趨勢,但這并不等于世界各國的企業制度都必然會趨向于同一種模式。這是因為,企業制度是“嵌入”[1]在制度環境當中的,企業制度變遷不僅遵循了效率追求的邏輯,同時也是制度環境選擇的結果。這就是說在制度環境的異質性假設前提下,企業制度必然也是異質性的。據此,可以對中國制度環境條件下的獨特企業共同治理機制做某些前瞻性的思考。
一、企業利益相關者共同治理的一般原理
歷史地考察發現,在企業治理的角度,企業制度安排經歷了一個:
單邊治理雙邊治理三邊治理利益相關者共同治理
的拓展過程。(1)所謂單邊治理,主要是就古典企業所遵循的物質資本邏輯而言,個人業主制和合伙制企業是其典型代表,企業契約中物質資本所有者對于雇傭工人的絕對優勢和支配地位是其顯著特征。(2)所謂雙邊治理,是就企業作為物質資本與(異質性)人力資本的合約性質而言。人力資本職能開始從古典企業家當中分離出來而開始成為企業的重要制度性要素是其顯著特征。(3)所謂三邊治理,主要是就企業“員工參與”亦即“同質性”人力資本擁有者參與企業的治理以及剩余的分享而言。“員工參與”的邏輯起點,是企業員工對其自身人力資本的產權;“員工參與”的現實狀況,取決于企業契約中其人力資本所決定的談判實力。三邊治理的顯著特征,是企業員工、經理人員、股東之間的博弈制衡關系。(4)所謂共同治理,是就企業利益相關者共同參與企業的治理而言。共同治理已成為現代世界各國企業制度演進的共同趨勢。
企業不同制度形式之間并非全然的縱向替代關系,也大量并存于現代經濟社會當中。結果,在企業治理結構的爭論中,形成了以物質資本邏輯為核心的委托理論和以利益相關者博弈均衡邏輯為核心的共同治理理論兩種主要觀點。一般來說,在現代社會,人力資本構成企業的制度性要素已成為不爭的事實,純粹的物質資本邏輯已經不能解釋現代企業的治理結構。另外,事實上如科斯所說的,影響他人損益的行為也可視為生產要素和權利[2],結果凡是能給企業帶來損益或其行為受企業行為直接影響的行為人均有可能參與或影響企業契約、企業所有權的分配進而企業制度的設定,也就是說成為了企業的利益相關者。因此,單從理論邏輯上推斷,企業制度就是在企業所有利益相關者之間對企業所有權(剩余索取權和剩余控制權)的合理配置;進而,企業治理也就應當是利益相關者對企業的共同治理。當然,企業利益相關者也有“潛在”與“真實”之分[3],在一般情況下,對企業投入了專用性資產的產權主體可視為企業的直接利益相關者,而其他利益相關者角色如顧客、其他企業等則具有一定的派生性質,往往處于潛在狀態。
現代企業理論把企業看作為一系列契約的聯接,其內在遵循的是博弈均衡的原則。這就是說:企業制度安排的具體情況取決于企業利益相關者之間的談判實力對比格局;企業的技術性特征、以及企業生產要素各自的特性是決定利益相關者談判實力的主要因素。在此基礎上,從理論上說設計企業利益相關者共同治理機制必須遵循同權原則、均占原則、市場原則和邊際調整原則。[4]所謂同權原則,是說企業各利益相關者均擁有企業的剩余控制權;所謂均占原則,是說企業各利益相關者也都擁有企業的剩余索取權;所謂市場原則,是說企業制度的達成應該堅持通過談判達成不應有不合理的人為干擾;所謂邊際調整原則,則是就企業的再談判機制和企業所有權的“狀態依存性”而言。
二、制度環境變量的引入及其對企業共同治理機制的影響
“共同治理”并不等于按照剩余索取權和剩余控制權對等的原則在企業利益相關者之間對企業產權進行“平等”的分配,甚至也不等于“所有”利益相關者的企業治理權利都可以在現實當中得到實現。這是因為企業的技術特征以及生產要素的特性決定了企業利益相關者各自具有不同的談判實力。但是,考察各國的企業制度發現,即使企業在技術特征和生產要素特性等方面幾乎完全一致的情況下,企業制度之間仍可能存在顯著的差異。西方發達國家公司存在的兩種不同的公司治理模式英美模式和大陸模式就是一個例證。這種現象如何解釋?
有學者對美國、日本等國的公司治理模式進行了歷史比較制度分析[5]發現,企業制度是效率追求和制度適應的統一。[6]這就是說,企業制度不僅僅是在效率追求邏輯下對自身內在因素的調整,而且還要同外在的制度環境盡量達成高度的“契合”;或者說企業制度不僅是(狹義)效率原則的體現,而且也是制度環境選擇的結果。由此可以推論,在對企業制度進行價值判斷的問題上應該堅持“存在即合理”原則;制度環境必然會給其中的企業制度打上自己獨特的烙印,而任何一種企業制度模式也只有在相應制度環境下才有意義而不可能具有普適性。由于技術特征和生產要素特性對企業制度的影響一般不以國別而不同,并且經濟全球化條件下技術和生產要素的高度流動性已經大大減弱了其在國家之間造成企業制度顯著不同的可能,因此可以說不同國家制度環境的“異質性”是形成多樣化企業制度模式的真正根源。可見,有必要拓寬視野引入外在制度環境變量的因素,以使我們對企業制度的研究進而對企業共同治理機制的設計更加趨近真實。
盡管制度環境的異質性是企業制度多樣化的真正根源,但現代企業理論作為西方企業理論所本來固有的“一維性”色彩,以及眾多國家迷惑于西方發達國家企業經濟績效的眩目光環而對其制度安排的盲目追隨,卻嚴重影響了經濟理論對制度環境與企業制度安排之間的契合關系以及異質性制度環境條件下企業制度不同模式的關注和考察。經濟學領域的這一缺陷,被新經濟社會學(TheNewSociologyofEconomicLife)敏銳的感知并捕捉,并運用“嵌入性”和“社會建構”理論對其進行了修正[7]。
新經濟社會學認為,從宏觀方面看,經濟組織都是“嵌入”在社會網絡之中的,經濟制度本質上是“社會建構”的;從微觀方面看,現實的人都是帶有歷史和社會屬性的經濟人。可見,如果說傳統經濟學主要遵循了個體主義的方法論的話,那么新經濟社會學則依據現實整合了整體主義的方法和個體主義的方法。新經濟社會學的理論使企業研究更加逼近現實。
總體上,新經濟社會學和經濟學的結合不僅是必要的,而且是可能的。新經濟社會學首先提供了一個宏觀制度背景的維度,這正是對經濟學自身所固有一維色彩的揚棄或有益補充;其次,修正經濟學的理性選擇理論,整合經濟學的“經濟理性”和新經濟社會學的“社會理性”,以“效用最大化”替代狹隘的“利益最大化”,實現人的選擇集或效用函數的多元化,就可以對現實人的選擇過程展開微觀分析;再次,在新制度經濟學和博弈論的平臺上,在對經濟生活的分析中把社會性變量納入進去,就可以對現實的多樣化制度安排作出合理解釋。就是說,與傳統經濟學出于個體主義的方法論和對經濟人的單維度界定而對制度創新的:
單維度經濟人唯一的博弈均衡最優制度安排
的特定路徑不同,現實經濟組織制度創新的路徑事實上是:
多樣化制度環境不同經濟人行為特征多重均衡樣式多樣化次優制度安排
這就是說,給定不同社會制度演進路徑和制度環境的異質性區別,經濟主體之間交易的博弈可能會存在多個均衡點或者多重的均衡樣式,從而形成各自不同的制度安排,并且雖然不一定臻至那種理想的最優效率的境界,但在相應的制度環境下也都是最具有“適應性效率”[8]的,也就是說特定情境下“次優選擇”即是“最優選擇”。
對于西方社會而言,由于其制度變遷的自然演進性質,也由于其許多國家都具有相同或類似的文化淵源,其制度創新過程一般不涉及“異質性”制度環境之間的碰撞和摩擦問題。因此,雖然事實上其制度安排僅僅代表了特定制度環境下的特定制度均衡樣式,其企業制度也僅僅意味著“企業制度特殊”,但在其發達經濟的眩目光環之下,由其自身“致命的自負”以及后發國家的盲目崇拜,卻被不恰當地賦予了普適性和一般性的色彩。而對于許多后發轉軌國家,一方面其制度演進路徑就與西方社會存在很大的不同,因此其企業制度建設必然是一種“過程”的創新;另一方面更重要的,是其制度環境與西方社會存在巨大的差別,與此適應,企業制度創新也必然是一種“目標”的創新,也就是說只可能有一種與特定制度環境高度契合的企業制度形式是最有效的,而決不能把西方的某些經驗和做法不加分析地拿來為我所用。事實上,雖然后發國家企業制度建設對西方經驗的借鑒不可避免,但是引進來的制度安排要想真正有效發揮作用,其一般也要經過一個特定的制度創新過程:首先,附著其上的那些與西方制度環境相適應的制度特征將被逐步剝離;其次,引進制度也必然會逐步打上本國特定制度環境的烙印從而逐步實現企業制度安排的“適應性效率”。
具體來說,不同企業制度模式的宏觀制度根源,主要是通過對企業內部利益相關者博弈格局的影響來體現出來的。這也就是說,在不同的制度環境下,企業的真實利益相關者及其談判實力和博弈均衡狀況會有顯著的不同,并進而體現在企業契約和企業制度安排當中。一個典型的案例,是在東南亞一帶普遍存在著的家族制企業。東南亞各國或地區的家族制企業與一般所說的家族制企業并不完全相同:后者主要體現了一種純粹的交易成本節約的邏輯,世界任何地方的初創企業都可能會采用;而前者則主要是一個文化地理上的概念,其后潛藏著特殊文化背景的深層根源。這就是說,在家文化傳統根深蒂固的東南亞一帶,經濟行為人所擁有的家族、血緣關系以及忠誠、信義、情感這些特殊“人力資本”的“質”和“量”,是判定其是否企業真實利益相關者的重要標準,也是決定其在企業利益相關者博弈格局中地位和作用的重要因素,并體現于企業契約、企業制度以及企業治理結構的方方面面當中。這一邏輯也可以對其他的企業制度模式作出合理的解釋。
三、中國制度背景下企業共同治理機制的若干特征
考慮到中國基本經濟制度的穩定性和文化傳統的深遠歷史淵源,中國企業的共同治理機制可能會具有如下特征:
第一,社會主義的和諧競爭理念與企業利益相關者“共贏”的利益格局
同一般而言制度環境“決定”企業制度特殊的“消極”含義相比,社會主義條件下中國特色的企業制度建設應當內涵一種特定的“積極”意蘊。就是說,居于后發轉軌國家的位置,在現代企業制度的建設過程中,我們應當也可以用社會主義的價值追求和政府主動的制度創新,來盡量避免馬克思所嚴厲批判過的,那種資本主義發展初期曾嚴重存在的種種緊張、矛盾、沖突所付出的巨額交易成本甚至由此造成的災難,比如說古典企業當中勞資雙方之間的種種斗爭現象,而應當反過來主動地倡導一種和諧的理念,通過相關的制度設置,在中國現代企業當中形成一種各利益相關者共贏的利益格局。這是因為,在傳統經濟學那里,由于每個人都追求自己的私利,因此“每個人都妨礙別人利益的實現,這種一切人反對一切人的沖突所造成的結果,不是普遍的肯定,而是普遍的否定”[9]。這種自斯密以來逐漸形成的“競爭”的經濟學體系,在較大程度上包含著霍布斯所謂“個人永遠處于所有人反對所有人的戰爭之中”的悲觀主義理念。而事實上,不僅在現實生活中人們之間的“合作”同“競爭”同樣的廣泛,而且由于合作是人們之間展開可持續性競爭的普遍基本框架,“合作”更加符合人類的終極價值追求。[10]
第二,我國基本經濟制度與企業治理的“勞動者參與”
我國的基本經濟制度對我國企業制度將會有非常重要的影響。雖然我國社會主義尚處于初級階段,基本經濟制度還不能達到經典作家所設想的個人在全社會范圍內實現對生產條件的社會的直接的結合,勞動還是人謀生的手段,而不是人生存的第一需要,但是,畢竟我國的社會性質是社會主義的,在生產力還不夠發達的現階段,企業制度即使不能臻至勞動者主導的理想境界,也必然會因由公有制主導的基本經濟制度,在相當程度上關心勞動者的訴求、關照勞動者的命運、關注勞動者的地位,從而促進勞動者對企業治理的參與,形成“勞動者參與”的鮮明企業制度特色。
第三,我國文化傳統與企業制度的家族色彩
家文化體現了中國文化傳統的突出特征,幾千年文化傳統的社會心理積淀作為一種非正式制度環境對嵌入其中的經濟行為人進而企業制度都產生著重大影響。一方面,在不同制度框架下活動著的經濟人其選擇集是不同,對于侵家文化傳統幾千年的中國人來說其選擇集中一個至關重要的內容就是信任、忠誠、情義,或者說是家族范圍內部的利他主義世界觀,這是一種內化了的精神效用;另一方面,嵌入家文化非正式制度之中的企業,其經濟行為人所擁有的家族關系,以及所擁有的信任、忠誠、情義這樣一種特殊人力資本的質和量,是企業據以判定自身真實利益相關者的一條重要標準,也是一種據以分配物質資源、經濟利益和企業剩余的重要標準,由此成為影響企業利益相關者談判格局和博弈均衡格局的決定性因素,使企業治理打上鮮明的家族烙印。顯然,這種意義上的家族企業和一般所理解的在企業發展初期階段為了節約交易成本而采取的家族式管理具有本質的不同,也更具有旺盛的生命力。不可否認,家族式企業治理方式在成功地避免企業成員的機會主義行為、節約交易成本、提高企業績效等方面的同時,也存在不少內生性的制度缺陷。但是,這只是說明我們需要根據新的情況對既有的家族制度進行創新以提高其“適應性”,而決不意味著我們對家族式企業制度模式的有效性視而不見甚至否定。我們認為,從總體上講,在正處于新舊制度轉型期的中國社會,在由于制度真空因而以一種異化了的方式引進西方那種個人主義的價值觀結果形成社會普遍信用缺失的情況下,家族式企業制度模式可能更主要地發揮著一種積極的作用。
注釋:
①⑦參見:張其仔,《新經濟社會學》,中國社會科學出版社2001年版。
②科斯:《社會成本問題》,載《論生產的制度結構》中譯本,上海三聯書店,1994年版,p191。
③楊瑞龍,《企業的利益相關者理論及其應用》,經濟科學出版社2000年版,p132。
④參見:《企業利益相關者共同治理機制設計》,張立君,載《中南財經政法大學學報》,2002年第三期。
⑤參見:王東,《美國日本企業的歷史比較制度分析》,載《經濟評論》2002年第二期。
⑥參見:孫早,《現代公司治理結構:經濟效率與制度適應的統一》,載《湖南社會科學》2000年第六期。
⑧“適應性效率”是說,當某一種制度能在不同的環境下得以生存和發展,那么該制度就是有效率的;假定生產費用不變,一個具有適應性能力的制度從投入來看就是最能節約交易費用的制度。由于一種有效率的行為都是在一定的制度環境下作出的;同一種制度安排在不同的制度環境下會有不同的效率表現;制度安排只有“適應”制度環境才能最大限度地節約交易成本,因此動態地看,制度安排只有同制度環境高度契合才有效率。本文對制度的“適應性效率”作此理解。
篇10
關鍵詞:道德風險; 農產品質量安全; 結構方程; 渠道權利
中圖分類號:F322 文獻標識碼:A 文章編號:1003-3890(2013)12-0005-06
一、引言
俗話說“民以食為天,食以安為先”。食品是我們生存和發展的基礎,食品安全問題不僅影響人的身體健康,更間接地影響整個社會經濟及政治秩序的穩定,同時也關系著國家的形象與尊嚴。然而由于種種原因,我國食品安全狀況仍不容樂觀。尤其是近年來,我國農產品質量安全問題呈現直線上升趨勢。因此,深入研究農產品市場問題,切實有效保障我國農產品質量安全就成為關系到廣大人民群眾身體健康和生命安全,關系到經濟健康發展和社會穩定,緊迫而又無法規避的重要課題。然而,解決農產品質量安全問題,既不能僅訴諸于制度,通過加強立法與日常監督管理以及懲戒措施來實現,也不能完全交給市場(楊瑞龍,聶輝華,2006)[1]。正是由于農產品市場具有信息不對稱、外部性、公共物品等屬性特征,農產品市場存在著市場機制失靈的可能性。王可山(2012)也認為,農產品質量安全問題的根源在于契約的不完全性。而契約的不完全性,一是由于信息不完全,部分農產品質量信息存在不可預測性或不可描述性;二是由于信息不對稱,部分農產品質量信息存在不可觀測性或不可鑒別性[2]。不完全信息會導致道德風險,一方面農產品生產者刻意降低質量,甚至以次充好、制假販假;另一方面消費者因無法判斷農產品質量,進而高質量產品的生產者或被逐出市場,或被迫改為生產低質量產品(聶輝華,2008)[3]。因此,深入研究農產品生產和流通環節中因市場失靈而出現的道德風險及其規避問題,就成為利用市場機制自身來解決農產品質量問題的重要方面。然而,目前國內外現有農產品質量安全問題研究多數忽略了道德風險在農產品質量安全中的作用,明顯缺乏農產品生產流通市場農戶風險行為與市場失靈內在機理研究。這種狀況不僅不利于農產品質量安全問題的進一步研究,而且也使得那些基于風險視角揭示農產品質量安全問題的精辟論述,不無遺憾地僅從非市場的角度去尋求解決問題的舉措,而失去了利用市場機制自身來解決市場問題的根本手段。
二、道德風險的理論分析與基本設想:制度視角
本部分從制度供給、示范效應以及實施主體自我效用考量三方面來探討可能導致農產品質量安全道德風險的因素。新制度經濟學的研究表明,制度是經濟理論中除傳統的要素、技術和偏好這三大理論基石外的第四大基石,制度至關重要(盧現祥,2011)[4]。很多時候,制度是影響某一經濟現象出現的關鍵因素。道德風險從制度視角可以理解成行為主體在現實制度所賦予的制約條件中活動的一種結果。因而,我們探討道德風險的成因就不得不從制度的視角來考慮制度因素對道德風險產生的影響。
很多研究表明我國多數經濟問題的出現根源于我國制度供給的缺失。制度供給缺失包括核心制度的缺失和一般配套制度的缺失。核心制度的缺失會導致陷入制度供給陷阱(鄧大才,2000)[5]。這意味著如果現有的制度中缺少核心制度,即使提供再多的有利制度也無濟于事,制度的邊際效率是不變或者下降的,于是就會出現政策失靈的現象。此外,制度供給中一般配套制度的缺失則可能造成制度效率的損失,即由于缺失配套制度而使得一項制度難以實現本應達到的效果。這里的配套制度,應該包括兩層涵義(以農產品質量安全管理制度為例):一層是指與農產品質量安全管理體系同一等級的用于輔助農產品質量安全管理順利實現的其他方面的制度安排;另外一層涵義是指對于中央政府出臺的農產品質量安全管理體系,地方政府為能更好地貫徹執行,結合其地方具體情況,相應出臺的配套政策。顯然,對于農產品質量安全的配套制度安排中,后者的供給協調程度對制度實施的影響更為重要。然而,由于中央與地方財權與事權的非對稱、不平衡導致地方政府為了保護地方經濟發展,維護地區利益而在配套制度的設立中存在傾向短期的眼前經濟利益,而“有意”或“無意”地忽視配套制度與中央制度的協調度,這就導致道德風險產生的可能性提高。
基于以上分析,提出假設1:
H1:制度供給與道德風險具有相關性。
制度供給短缺來源于制度的稀缺性。所謂制度的稀缺性,是指相對于人們行為的差異性、多樣性和發散性而言,作為規范人們行為的制度安排總是不足的,不可能對每種行為都制定相應的制度安排加以約束,總有一些行為沒有制度安排予以規范。或者說,由于制度被認為是關于人們相互行為的知識載體,制度的稀缺性也可以理解為相對于人們對這類信息的需要而言,制度所能傳遞的信息總是不足的。于是在制度稀缺的情況下,人們的行為選擇往往受到周圍他人(主要是那些與之從事相近活動的人)的行為的影響,這就是示范效應。一旦有人出現道德失范行為,由于示范效應的存在,往往使得道德失范風險的進一步擴大成為可能。尤其是對于一些新技術、新工藝和新資源的使用,制度供給存在“時滯”問題,這就意味著一個新生事物從產生到建立起針對它的制度規范,存在著一個制度空白期,這就使得道德風險發生的可能性加大。
基于以上分析,提出假設2:
H2:示范效應與道德風險具有相關性。
制度由三個基本部分構成:正式約束、非正式約束及其實施機制。一個制度形成之后所面臨的就是實施機制。從制度功能實現角度來看,只有規則而沒有執行機制,制度就是不完整的。而實施是由人執行的,因而他們自身的效用函數將影響制度執行的結果。就農產品質量安全監管來說,是消費者委托政府來執行實施職能的。于是,消費者與政府之間形成委托-關系。政府能否有效行使職能主要受其自我效用函數的影響。實施者有著自己的利益考慮,若是制度的實施與其自身利益沖突,必然導致實施主體的實施懈怠。所以制度能否有效發揮其應有效應,與實施者的自我效用考慮直接相關。另外,正式制度的制定和執行不僅需要建立一套專門的組織機構,而且需要通過一定的工作程序,這些都要耗費大量的資源,運行成本很高。若是政府由于資金等因素的困難而未能正常地執行實施職能,如不能建立先進的檢測體系,不能培養和雇傭足夠的業務人員,道德風險產生的可能性就增大了。同時,考慮到不同知識背景與不同個性特征都會影響到個體采取不同的經濟活動方式(郝大江,2011)[6]。
基于以上分析,進一步提出假設3:
H3:實施主體自我效用考量與道德風險具有相關性。
三、道德風險的理論分析與基本設想:行為主體視角
本部分從農產品流通市場中的主體間信息、行為以及渠道權力的視角探討農產品質量安全道德風險問題。農產品生產流通主體主要歸結為農產品生產者、中介組織(主要包括各種農產品的集散和物流組織)與農產品需求者三類。本部分將分析農產品流通環節中農戶的理性選擇及各主體之間的信息不對稱性,并將消費者納入渠道權力的研究范圍,將傳統的二元分析范式擴展為網絡分析,進而剖析可能導致流通主體道德風險的因素。
從流通領域的起點出發,農戶行為的決策機制將首先被研究。對農戶經濟行為的研究,西方經濟學中主要存在兩個流派。一是以恰亞諾夫為代表的組織生產流派,其主要觀點為:農民的經濟是一種道德經濟,導致農民這一行為特征的是社會壓力,即個人不追求欲望的極大滿足,而是擔心越軌而受到社會的懲罰,農戶以自身的需求和勞動辛苦程度決定自己的勞動投入程度。而另一流派則是以西奧金·舒爾茨為代表的理流派。該流派認為:在市場機制的競爭中,農戶行為與企業行為本質上沒有任何差別,農戶的行為完全是理性的,收益的最大化將是農戶的行為決策目標。在本部分的分析中,農產品的生產者具有博弈論中理性人的特質,即其所作決策不僅依據自己的個人效用函數,還將依賴市場中其他參與者的決策,這區別于傳統經濟學中理性的特質(張維迎,1996)[7]。基于農戶理性的判斷,我們得出農戶道德風險理性決策函數模型:
Z=(1-P)(R-U1)-P(U1+U2)(1)
函數中P為農戶道德風險行為被相關職能部門查出的概率(0
基于以上分析,本文提出假設4:
H4a:農業生產要素投入與道德風險具有相關性。
H4b:農戶道德失范成本與道德風險具有相關性。
在信息經濟學中,常常將博弈中擁有私人信息的參與人稱為“人”,不擁有私人信息的參與人稱為“委托人”。據此,信息經濟學的所有模型都可以在委托-的框架下進行分析(Rasmussen,1994)[8]。在農產品流通環節,消費者向中介機構購買農產品可以理解為委托中介機構收購安全的農產品,而中介機構向農產品生產者收購農產品則可以理解為委托其生產農產品。為此,消費者作為需求的終端,其需求的取向將會作為市場的取向影響中介機構和農產品生產者的行為。由于消費者處于信息不對稱的劣勢地位,其對于農產品質量安全的判斷主要基于其先前的經驗與主觀想象,這往往會導致事前信息隱藏的逆向選擇與信息傳遞問題。在農產品市場中,消費者由于信息不對稱而導致的消費非理性,往往使質量上乘的產品賣不到好價錢,進而可能會導致價格機制的失效,從而使農產品生產者退出市場。除了被動的選擇退出市場外,農產品生產者還可以利用信號傳遞模型主動出擊,規避可能由消費者非理性消費而扭曲市場的風險。為了顯示自己的類型,人選擇某種信號,委托人在觀測到信號之后與人簽訂合同。農戶在提供自己所生產的農產品信息時是有選擇性的,他們不僅可能會主動隱藏不利信息,甚至還有可能偽造信息,以促使自己在過度競爭的市場中快速達成交易。
基于以上分析,本文進一步提出假設5:
H5:誤導性市場導向與道德風險具有相關性。
在農產品流通的過程中,行為主體之間的聯系除了信息,還包括農產品自身。下面將討論農產品的流通路徑,即渠道的問題。渠道依賴與權力關系是渠道行為的基礎,也是整個渠道行為理論研究的中心議題之一(Stern,1988)[9]。所謂渠道權力,即為某個渠道成員A對另一個渠道成員B的權力,是指B在A的干預下的行為概率要大于沒有A干預下的行為概率。盡管渠道權力理論體系日漸完善,但從二元分析范式向網絡分析范式的轉換問題與作為渠道成員的消費者一直沒有被納入渠道權力分析視野是其中較為突出的兩個問題(張闖,2007)[10]。消費者作為一個渠道的終端,將生產的農產品全部消費,其對于農產品的需求將會產生較大影響。農產品的銷售渠道對于農戶來說十分重要,其決定著農戶是否能將農產品順利的銷售出去以及以什么樣的價格銷售出去的問題。我們將從農戶可選擇的渠道的多少、選擇或更改渠道的成本以及在與渠道商間的力量對比,即渠道商的侵略性渠道權力的強弱來分析農戶道德風險的可能。
H6a:渠道選擇自由度與道德風險具有相關性。
H6b:侵略性渠道權力與道德風險具有相關性。
四、數據及建模結果分析
(一)數據取得
基于制度經濟學、信息經濟學、渠道權力等相關理論,本研究提出八個農產品質量安全道德風險引致因素。為驗證這些引致因素的真實性和有效性,本研究采用問卷與實地走訪相結合的方式進行社會調查。其中,回收有效問卷392份。問卷涉及農戶類型多樣,覆蓋糧油、瓜果蔬菜、牧畜、食用菌等農戶。此外,通過農產品集散中心實地走訪,完成了農產品渠道市場調研。在調研數據的基礎上,本研究采用結構方程模型(Structural Equation Modeling,SEM)進行實證分析。SEM是一種建立、估計和檢驗因果關系模型的多元統計分析技術,它可以用線性方程系統表示觀測變量與潛變量之間,以及潛變量之間的關系,并可同時處理多個因變量。本部分利用研究中提出的基本設想及各變量間的相互影響構建用于驗證的結構方程模型。同時采用AMOS17.0軟件和SPSS13.0軟件對數據進行分析和模型檢驗。AMOS17.0是一種利用基于方差矩陣結構的潛變量對結構模型進行估計的軟件包,可通過多層路徑分析對變量之間的直接或間接的相互關系進行驗證。為了確保調查問卷的可信性,我們還采用了信度分析和效度分析,將Cronbach’α值作為信度的評判標準,將KMO樣本充足度和Bartlett球形檢驗作為效度評價標準,最后通過因子分析所得出的結果對設想的真實性進行討論。
(二)信度檢驗和效度檢驗
為確保實證結果的準確,本研究對392份問卷進行信度檢驗和效度檢驗。在進行信度和效度檢驗之前,已將反向題項的數據進行標準化處理。在總體的量表中,每個變量對應著不同的題項,首先通過對每個變量(設想)所對應的題項進行信度和效度檢驗,測量題項之間是否具有一致性以及題項是否包含了變量的所有層面,刪除不符合要求的題項或相關性較低的題項,然后對整個量表進行信度檢驗和效度檢驗,檢驗結果見表1。這里所使用的信度檢驗方法為Cronbach’s α檢驗,效度檢驗方法為因子分析法。對整體量表進行Cronbach’s α信度檢驗,值為0.949,說明量表的整體信度很好,各個題項之間存在較高的一致性,可以進行結構方程測算。
從表1的結果中可以看出,變量“農業生產要素”的Cronbach’s α值非常低,未通過信度檢驗,因此不能繼續進行效度檢驗,故沒有相應因子分析的指標值。
其余7個變量的檢驗結果:(1)信度檢驗:Cronbach’s α值均良好,說明可以進行因子分析。(2)KMO和Bartlett相關性檢驗:KMO值均顯著,通過球形檢驗,表明各個題項之間有相關關系。(3)因子分析結果:每個變量提取一個因子,且因子的特征值均大于1,解釋程度均大于50%,說明提取的因子的特征值能夠解釋總體方差的50%,各個題項因子載荷均大于0.5,均可保留。以上檢驗表明上述7個變量的各個題項之間具有較高的相關性和穩定性,通過了信度檢驗和效度檢驗。
(三)SEM模型及設想檢驗
1. 數據擬合情況。(1)選用的統計量及統計量標準。P統計量:大于0.05符合要求。擬合優度指數(GFI)和修正擬合優度指數(AFGI):大于0.9符合要求。近似誤差均方根(RMSE):小于0.05擬合較好,一般認為在0.08以下均為合理。Bentler的比較擬合指數(CFI):大于0.9,且接近1,擬合較好。正規化擬合指數(NFI):大于0.9,擬合較好。
(2)擬合結果。利用AMOS17.0構建的修正后的結構方程,其各項擬合指標檢驗結果見表2所示。
由表2可知,以上的擬合指標中除了P統計量以外基本都符合標準。一般情況下樣本容量應該為變量的10倍到15倍,但本文中所選用的樣本數量為392,遠遠超過標準,不過對于社會科學類的研究,樣本要涉及到足夠多的人群和足夠大的范圍。因此為了保證結構方程結果的可靠性,本研究選用了大樣本,而卡方會隨著被試樣本的數量增大而增大,易受被試樣本數的影響,“當樣本數過大,如400左右時,易使擬合度指標檢驗出現擬合不佳的結果”(侯杰泰,2004)[11]。一般在大樣本的情況下P值都較為容易顯著,因此在這里不考慮P值,而是觀察各個變量的總體擬合情況以及結構方程的檢驗情況。
2. 設想檢驗結果。H1:制度供給與道德風險具有相關性。該設想討論的是制度供給與道德風險產生之間的相互關系。檢驗結果表明二者之間的標準回歸系數即路徑系數為0.983,P=0.005
H2:示范效應與道德風險具有相關性。該設想討論的是示范效應與道德風險產生之間的相互關系。檢驗結果表明二者之間的標準回歸系數即路徑系數為0.126,P=0.033
H3:實施主體自我效用考量與道德風險具有相關性。該設想討論的是實施主體自我效用考量與道德風險產生之間的相互關系。檢驗結果表明二者之間的標準回歸系數即路徑系數為0.27,P=0.039
H4b:農戶道德失范成本與道德風險具有相關性。該設想討論的是農戶道德失范成本與道德風險產生之間的相互關系。檢驗結果表明二者之間的標準回歸系數即路徑系數為0.73,P=0.038
H5:誤導性市場導向與道德風險具有相關性。該設想討論的是誤導性市場導向與道德風險產生之間的相互關系。檢驗結果表明二者之間的標準回歸系數即路徑系數為1.77,P=0.145>0.05。因此,設想H5在0.05顯著性水平上未通過檢驗,同時路徑系數大于1說明變量間可能存在多重共線,應該對模型進行修正。但是,我們只是借助結構方程探索影響農產品質量安全道德風險產生的原因,因此將此未通過的檢驗刪除。
H6a:渠道選擇自由度與道德風險具有相關性。該設想討論的是渠道選擇自由度與道德風險產生之間的相互關系。檢驗結果表明二者之間的標準回歸系數即路徑系數為0.347,P=0.000
H6b:侵略性渠道權力與道德風險具有相關性。該設想討論的是侵略性渠道權力與道德風險產生之間的相互關系。檢驗結果表明二者之間的標準回歸系數即路徑系數為0.244,P=0.000
H4a:農業生產要素投入與道德風險具有相關性,由于在信度檢驗中未通過,因此刪除該設想。剩下的6個設想的檢驗結果如表3所示:
五、農產品質量安全道德風險現狀分析
兼具指導之力以及對策之功,這不僅是本文研究的初衷,同樣也是本文研究的理論歸宿。本研究在第二階段,以上述問題為導向,通過實踐調研,基于制度供給、示范效應、失范成本、渠道選擇自由度、侵略性渠道權力等角度,深入分析各種導致農產品質量安全道德風險產生的原因,探尋農產品質量安全中道德風險規避思路、對策建議及其制度安排。為使調研結論具有典型性和代表性,本階段調研對象不僅選取了在我國農產品生產和流通環節中具有普遍意義的個體農戶、大型農產品流通交易中心的經營者和管理者,而且也針對我國現代化大型農業生產特征,選取了黑龍江省農墾系統中較為突出的農場進行調研。結果顯示:
(一)制度宣傳不足,農戶未建立起標準意識
在保證農產品質量安全方面,農戶作為生產者,無疑是最為關鍵且責任最為重大的。農產品的質量安全水平與農戶對于質量安全的認識和執行有著密不可分的關系。本研究的調查結果顯示,81.5%的農戶反映在他們的實際生產過程中并沒有受到任何專業性的指導,且對農產品質量安全問題了解甚少,主要是靠以往的經驗進行農業生產。農戶的文化程度不高,獲取新事物和理念的渠道單一,是導致其匱乏農產品質量安全知識的根本原因。目前,農戶獲取相關信息和政策的主要途徑仍然是媒體廣播,然而根據調查結果表明,全國各省(市)廣播電視臺仍沒有專門針對農民宣傳農產品質量安全生產的節目。盡管我國農產品生產,以及與質量安全監管相關的各職能部門都在其官方主頁上開辟專欄,介紹和宣傳農產品質量安全標準和規范,但在實踐中,我國農戶間的網絡普及率較低,也很少瀏覽相關職能部門的官方媒介,因此我國農戶多數仍未建立起質量安全標準意識。
(二)制度體系仍不健全,缺乏必要的協調一致性
現階段,我國有關農產品質量安全監管的正式制度主要有:農產品質量標準體系、農產品質量安全監測體系以及認證體系。然而這些法律法規內容籠統,流于泛泛。對于農產品的生產過程和方法,農產品質量安全的檢測認證標準及方法等都只提出一般性的指導意見,沒有細節性的內容,存在很多漏洞。此外,我國目前農產品質量安全問題涉及工商、質檢等九個政府部門,多部門的分頭管理,勢必造成部門之間職能交叉責任不明,效率低下,協調性差,造成職能擴張和行政壟斷,更加重了政府行為失范。同時,我國現行標準也分為四級:國家標準、行業標準、地方標準和企業標準。除企業標準之外,國家標準、行業標準和地方標準都是政府標準,從法理上應該擁有相同的法律約束力,并且不能相互交叉。但在實踐中,由于各級標準的審批和制定部門不同,加之缺乏信息溝通與統一規范,結果許多農產品質量標準及其生產技術規范,存在標準不統一、不一致現象,甚至在一些重要的關鍵參數上差異也較大、相互矛盾。這就容易造成執法標準不統一,農戶難以適從,引起市場混亂。
(三)制度實施存在諸多失范,未有效發揮市場功能
在我國農產品質量安全問題的管理中,政府是制度實施的人,而消費者是委托人。由于政府在經濟中的特殊地位和職能,政府往往有著自我效益的考慮以及運行成本等方面的顧及,因此出現大量的執行失范行為。然而與此同時,由于經濟地位的懸殊,作為委托人的消費者卻無法對人的行為進行選擇或有效的約束[12]。事實上,在國外市場中存在著由政府以外的第三方作為方的制度安排。這里所謂的第三方機構,是指具有可靠的執行制度的必要能力,并在執行過程中能夠客觀、公正、獨立地從事經濟活動的機構。雖然近年來農產品質量安全第三方認證在我國一些地方發展速度較快,但由于種種現實原因,仍存在著很多突出的問題,如產品認證的總量規模小、認證缺乏權威性、認證的后續監管不嚴格等。
(四)市場存在道德失范的風險激勵
隨著市場機制的不斷完善,產業間生產要素流動加快,農業生產要素逐漸流失,但隨著科技的發展與進步,一些不正當的手段(如添加劑的使用等)可以彌補農業生產要素投入減少所帶來的后果,加之我國現階段所實行的政策性農業保險制度使得農戶即使不在農業生產中投入足量的要素,也能獲得政策性保險所提供的收入保障,使得其變相成為一種“道德失范風險激勵”,從而使農業生產的要素投入上存在著一定的道德風險。在實際走訪中,多數農戶認為由于現行的檢查機制和檢驗制度標準存在缺陷以及農產品質量出現問題之后的懲罰力度不足,存在質量問題的農產品并不會被完全查處,便使得農產品生產者在生產過程中會存在很大的僥幸心理,即使其被發現,付出的代價也是遠遠不及違法生產獲得的利益多,從而為道德風險行為提供激勵。
(五)渠道體系存在壟斷性現象,渠道權力失衡
在我國“小農戶”與“大市場”的背景之下,現有農產品市場的市場結構不合理,多數農產品流通渠道是無組織的、分散的,農產品從最初的由農戶生產到最后出現在消費者的餐桌上,中間將通過儲藏、加工、運輸和銷售眾多環節,各個環節之間復雜的渠道體系大大減弱了現有監管體制的效率,延緩了解決問題的時間。此外,農產品流通渠道兩端的力量不對等和缺乏足夠的市場競爭也是道德風險產生的重要原因。農產品生產者所面對的渠道商擁有相當大的權力,對于農產品的品種,數量及價格,渠道商都有著較大的話語權。在這樣的情況下,為了保障自身的利益,農戶或中介組織往往存在以次充好、對農產品的外觀做某些不合理的處理或者在農產品中添加某些有害的物質等道德風險行為。農產品渠道不規范,渠道權力失衡導致農產品質量安全中道德風險的增加。
六、結論與啟示
近年來,我國政府非常重視農產品質量安全管理工作,并在系列政策的實施中取得了令人矚目的成績。然而,我國農產品質量安全現狀卻仍不容樂觀。農藥殘留超標,添加劑誤用濫用問題嚴重,食品中毒事件也時有發生。毋庸置疑,提高食品科學技術和加強衛生檢疫水平是保障農產品質量安全的一個重要方面,但是整個農產品市場生產和流通環節中的倫理與道德規范,同樣也是保障農產品質量不可或缺的一面。事實上,國內外很多學者已經開始關注農產品生產流通環節中的道德風險問題,相關成果也日益深厚。然而,從目前的研究成果上看,現有以風險視角解讀農產品質量安全問題的研究多傾向于依靠政府制度供給來進行安全保障,而對農產品生產流通微觀主體風險行為缺乏深入研究。尤其是現有研究對農產品生產流通主體風險行為分析基礎理論準備不足,明顯缺乏農產品生產流通市場農戶風險行為與市場失靈內在機理研究,這就使得那些基于風險視角揭示農產品質量安全問題的精辟論述,一直游離于市場范疇之外。因此,本項目基于農產品市場主體風險行為分析,構建基于道德風險的農產品質量安全分析框架,揭示道德風險在農產品質量安全中的作用和影響機理,其理論價值在于創新了農產品質量安全研究視角,而其應用價值則在于可為我國完善農產品市場建設提供切實可行的政策引導,從而避免道德風險,保障我國農產品的質量安全。
參考文獻:
[1]楊瑞龍,輝華.不完全契約理論:一個綜述[J].經濟研究,2006,(2):104-114.
[2]王可山.食品安全政府監管的困境與對策研究[J].宏觀經濟研究,2012,(7):68-71.
[3]聶輝華.契約不完全一定導致投資無效率嗎?一個帶有不對稱信息的敲竹杠模型[J].經濟研究,2008,(2):132-143.
[4]盧現祥.新制度經濟學[M].武漢:武漢大學出版社,2011.
[5]鄧大才.農業制度安排的非均衡研究[J].當代財經,2000,(8):19-23.
[6]郝大江.區域經濟增長機制研究:基于要素適宜度視角的解析[M].北京:中國物資出版社,2011.
[7]張維迎.博弈論與信息經濟學[M].上海:上海三聯出版社,1996.
[8]Rasmussen. Crop Insurance and Agricultural Chemical Use[J].Natural Resource Management and Policy,1994,(4):121-125.
[9]Stern.The Roles of Weather Insurance and the Carbon Market [J].Greening the Financial Sector,1988,(4):87-91.
[10]張闖.渠道權力結構的過度傾斜與權力失效:基于農產品營銷渠道的研究[J].財經論叢,2006,(9):96-101.
[11]侯杰泰.結構方程模型檢驗:擬合指數與卡方準則[J].心理學報,2004,(7):186-194.
[12]劉彥平,田光.貨幣信息弱勢理論及其應用[M].北京:中國社會科學出版社,2012.
On the Moral Risk of Agricultural Goods' Quality and Safety in China
Jiang Li
(School of Marxism Studies, Heilongjiang Institute of Science and Technology, Haerbin 150027, China)