国产精品区在线免费观看,www在线观看免费网站,美腿丝袜变态另类,非洲一级黑寡妇毛片,黄色一级片在线免费播放

前言：想要寫出一篇令人眼前一亮的文章嗎？我們特意為您整理了5篇進(jìn)化博弈理論范文，相信會(huì)為您的寫作帶來幫助，發(fā)現(xiàn)更多的寫作思路和靈感。

進(jìn)化博弈理論

進(jìn)化博弈理論范文第1篇

引言

一、兩個(gè)簡(jiǎn)單的例子

1.1 老鷹（Hawk）與鴿子(Dove)博弈

1.2 系統(tǒng)選擇博弈

二、進(jìn)化博弈理論的產(chǎn)生及其發(fā)展

2.1 理性的由來及其缺陷

2.2 心理學(xué)研究成果及有限理性概念的提出

2.3 進(jìn)化博弈理論的產(chǎn)生及其發(fā)展

三、進(jìn)化博弈理論的基本內(nèi)容

3.1 進(jìn)化博弈理論基本模型分類

3.2 進(jìn)化博弈理論基本均衡概念-----進(jìn)化穩(wěn)定策略

3.3 進(jìn)化博弈理論基本動(dòng)態(tài)概念----模仿者動(dòng)態(tài)

四、進(jìn)化博弈理論的應(yīng)用

五、傳統(tǒng)方法的缺陷及進(jìn)化博弈理論研究方法的現(xiàn)實(shí)性

5.1 新古典經(jīng)濟(jì)學(xué)均衡分析法的缺陷

5.2 經(jīng)典博弈理論的策略互動(dòng)分析法及其缺陷

5.3 進(jìn)化博弈理論局部動(dòng)態(tài)分析方法的現(xiàn)實(shí)性

5.3.1 局部動(dòng)態(tài)分析法的均衡觀

5.3.2 局部動(dòng)態(tài)法的時(shí)間觀

5.3.3 局部動(dòng)態(tài)法的均衡選擇觀

5.3.4 局部動(dòng)態(tài)法的特殊性

六、結(jié)論

參考文獻(xiàn)

摘要

本文從兩個(gè)簡(jiǎn)單的博弈例子出發(fā)，以通俗的語言全面介紹了進(jìn)化博弈理論的理性基礎(chǔ)及其形成、發(fā)展、基本內(nèi)容和部分應(yīng)用，在此基礎(chǔ)上文章進(jìn)一步比較了新古典經(jīng)濟(jì)學(xué)、經(jīng)典博弈理論 ①及進(jìn)化博弈理論在研究方法上的不同之處，并特別強(qiáng)調(diào)了進(jìn)化博弈理論局部動(dòng)態(tài)法的均衡觀、時(shí)間觀、均衡選擇觀及方法上的特殊性。進(jìn)化博弈理論的局部動(dòng)態(tài)分析方法既是經(jīng)濟(jì)學(xué)研究方法的一次創(chuàng)新又是經(jīng)濟(jì)學(xué)直面現(xiàn)實(shí)的有力武器。

關(guān)鍵詞：沉默互動(dòng)；社會(huì)互動(dòng)；進(jìn)化穩(wěn)定策略；模仿者動(dòng)態(tài)；均衡分析法；局部動(dòng)態(tài)法

引言

為什么同樣一項(xiàng)經(jīng)濟(jì)制度在某個(gè)地方對(duì)經(jīng)濟(jì)發(fā)展有積極的推動(dòng)作用而在另一個(gè)地方對(duì)經(jīng)濟(jì)發(fā)展卻起著消極的阻礙作用？為什么能夠有效降低交易費(fèi)用的中介在一些地方會(huì)出現(xiàn)而在另一些地方卻不能出現(xiàn)？為什么同樣的管理方法在一個(gè)地方顯示出高效率而在另一地方卻不具有效率？諸如此類的問題，新古典經(jīng)濟(jì)學(xué)利用均衡分析法都無法給出令人滿意的答案。均衡分析法的最大缺陷是把經(jīng)濟(jì)系統(tǒng)中參與人看作是互不聯(lián)系的單個(gè)人（僅研究單個(gè)生產(chǎn)者或消費(fèi)者的行為），不能把其所考察的問題放在一定的環(huán)境中去，該方法完全忽略了制度環(huán)境、社會(huì)環(huán)境及人文環(huán)境等對(duì)參與人行為的影響，單純考察某個(gè)條件與結(jié)果之間的一一對(duì)應(yīng)關(guān)系。因而，無法對(duì)現(xiàn)實(shí)中出現(xiàn)的諸多現(xiàn)象給予合理的解釋。博弈理論盡管把參與人之間行為互動(dòng)關(guān)系納入到了模型之中，但依然沒能跳出新古典均衡分析法的基本框架，并且由于其對(duì)理性賦予更強(qiáng)的假定，使得該理論更加脫離現(xiàn)實(shí)。進(jìn)化博弈理論則一反常規(guī)，從一種全新的視角來考察經(jīng)濟(jì)及社會(huì)問題，它所提供的局部動(dòng)態(tài)研究方法是從更現(xiàn)實(shí)的社會(huì)人出發(fā)，把其所考察的問題都置于一定的環(huán)境中進(jìn)行更全面的分析，因而，其結(jié)論更接近于現(xiàn)實(shí)且具有較強(qiáng)的說服力。進(jìn)化博弈理論屬于經(jīng)濟(jì)學(xué)的前沿理論，該理論從其理論框架建立到現(xiàn)在僅僅只有近三十年的歷史，但其在經(jīng)濟(jì)學(xué)、社會(huì)學(xué)、生態(tài)學(xué)等領(lǐng)域卻得到了廣泛的應(yīng)用，近年來已經(jīng)成為主流經(jīng)濟(jì)的研究方法之一。在我國由于歷史原因，對(duì)經(jīng)濟(jì)學(xué)的研究起步較晚，特別對(duì)進(jìn)化博弈這樣的前沿理論更是知者甚少，本文的主要目的是以通俗的語言介紹進(jìn)化博弈理論的相關(guān)內(nèi)容及其應(yīng)用，讓讀者對(duì)該理論有一個(gè)全面的了解。

本文的結(jié)構(gòu)如下：第一部分給出進(jìn)化博弈理論的兩個(gè)典型的例子；第二部分對(duì)進(jìn)化博弈理論的產(chǎn)生及其發(fā)展進(jìn)行闡述；第三部分對(duì)進(jìn)化博弈理論的基本內(nèi)容進(jìn)行簡(jiǎn)要的介紹；第四部分概述進(jìn)化博弈理論的有關(guān)應(yīng)用；第五部分論述傳統(tǒng)的經(jīng)濟(jì)學(xué)研究方法的缺陷及進(jìn)化博弈理論研究方法的現(xiàn)實(shí)性；第六部分對(duì)進(jìn)化博弈理論的發(fā)展及理論前景進(jìn)行簡(jiǎn)要的說明。

一、兩個(gè)簡(jiǎn)單的例子

為了下文說明的方便，本文先給出進(jìn)化博弈理論中兩個(gè)具有代表性的例子，在此基礎(chǔ)上再進(jìn)一步給出該理論的基本內(nèi)容及其研究方法的基本特點(diǎn)。

1.1 老鷹（Hawk）與鴿子(Dove)博弈

假定一個(gè)生態(tài)環(huán)境中有老鷹與鴿子兩種動(dòng)物，它們?yōu)榱松嫘枰獱?zhēng)奪有限的資源（如食物或生存空間等）而競(jìng)爭(zhēng)。老鷹一般比較兇悍，必要時(shí)在斗爭(zhēng)中直到重傷。鴿子一般比較溫馴，競(jìng)爭(zhēng)時(shí)在強(qiáng)敵面前常常退縮。競(jìng)爭(zhēng)中獲勝者得到了生存資源就可以更好地繁衍后代，重傷者則不利于其后代生長，即會(huì)減少其后代的數(shù)量。如果群體中老鷹與鴿子相遇并競(jìng)爭(zhēng)資源，那么老鷹就會(huì)輕而易舉地獲得全部資源，而鴿子由于害怕強(qiáng)敵退出爭(zhēng)奪，從而不能獲得任何資源（當(dāng)然不會(huì)受傷）；如果群體中兩個(gè)鴿子相遇并競(jìng)爭(zhēng)生存資源，由于它們均膽小怕事不愿意戰(zhàn)斗，結(jié)果平分資源；如果群體中兩個(gè)老鷹相遇并競(jìng)爭(zhēng)有限的生存資源，由于它們都非常勇猛而相互殘殺，直到雙方受到重傷而精疲力竭，結(jié)果雖然雙方都獲得部分生存資源但損失慘重，入不敷出。假定競(jìng)爭(zhēng)中得到全部資源為50個(gè)單位（該數(shù)字也可以表示為生物的適應(yīng)度、繁殖成活率或后代數(shù)量）；得不到資源則表示其適應(yīng)度為零；雙方重傷則用來表示。于是老鷹、鴿子兩種動(dòng)物進(jìn)行的資源競(jìng)爭(zhēng)可以用一個(gè)對(duì)稱博弈來描述，博弈的支付矩陣如下：

操作依賴于該群體的初始狀態(tài)。如果初始時(shí)，該宿舍有多于4人使用操作系統(tǒng)，那么該宿舍所有學(xué)生最終都會(huì)使用該操作系統(tǒng)；否則所有學(xué)生最終會(huì)使用操作系統(tǒng)。

二、進(jìn)化博弈理論的產(chǎn)生及其發(fā)展

進(jìn)化博弈理論是經(jīng)濟(jì)學(xué)研究方法的一次創(chuàng)新，該理論從否定傳統(tǒng)理論賴以成立的基礎(chǔ)----理性人假定出發(fā)而建立起來一個(gè)新的分析框架，它結(jié)合了生態(tài)學(xué)、社會(huì)學(xué)、心理學(xué)及經(jīng)濟(jì)學(xué)的最新發(fā)展成果，從有限理性的社會(huì)人出發(fā)來分析參與人的資源配置行為。

2.1 理性的由來及其缺陷

經(jīng)濟(jì)學(xué)自從古希臘哲學(xué)中分離出來并成為一門系統(tǒng)的學(xué)問，是在亞當(dāng)•斯密1776年發(fā)表《國富論》之后。以斯密為代表的古典經(jīng)濟(jì)學(xué)關(guān)注的核心是資源的稀缺程度如何能被人類經(jīng)濟(jì)活動(dòng)所減少，他們關(guān)注的重點(diǎn)不是資源配置問題而是國民財(cái)富的增長及國別差異的原因。1890年馬歇爾《經(jīng)濟(jì)學(xué)原理》的出版，標(biāo)志著新古典經(jīng)濟(jì)學(xué)的成形，馬歇爾之后，新古典經(jīng)濟(jì)學(xué)關(guān)注的核心逐漸轉(zhuǎn)向在給定稀缺程度下資源的最優(yōu)配置問題。稀缺資源的配置是需要人的參與，也就是說經(jīng)濟(jì)學(xué)研究的問題演變?yōu)殛P(guān)于經(jīng)濟(jì)中參與人如何把稀缺的資源配置到效率最高地方去的問題，強(qiáng)調(diào)個(gè)體行為在資源配置中的作用。經(jīng)濟(jì)中參與人的決策行為是通過高度復(fù)雜的思維活動(dòng)作出的，為了更好地從微觀個(gè)體行為來解釋資源配置問題，新古典經(jīng)濟(jì)學(xué)借用了哲學(xué)中“理性”概念對(duì)復(fù)雜的人類行為過程進(jìn)行了抽象的假定。然而，理性一詞用于經(jīng)濟(jì)學(xué)時(shí)卻對(duì)其含義的理解與哲學(xué)中對(duì)其含義的理解已經(jīng)有了明顯的區(qū)別。哲學(xué)中的理性是指人類所特有的用以探索自然和社會(huì)奧秘的認(rèn)知能力，當(dāng)代偉大的哲學(xué)家康德在其著作《純理性批判》一書中指出，人類理性即認(rèn)知能力并不是萬能的，而是有限的。經(jīng)濟(jì)學(xué)中的理性則是指一種行為方式，具體地說即是經(jīng)濟(jì)中參與人對(duì)其所處世界的各種狀態(tài)及不同狀態(tài)對(duì)自己支付的意義都具有完全信息，并且在既定的條件下每個(gè)參與人都具有選擇使自己獲得最大效用或最大利潤的能力。

經(jīng)濟(jì)學(xué)家認(rèn)為理性是至高無上的，人們憑借理性就可以完全地認(rèn)識(shí)自然與社會(huì)。經(jīng)濟(jì)學(xué)中對(duì)理性的含義經(jīng)過這樣的處理以后，就使得經(jīng)濟(jì)學(xué)能夠充分運(yùn)用數(shù)學(xué)理論發(fā)展的成果來進(jìn)行分析。為了應(yīng)用數(shù)學(xué)工具并更好地處理經(jīng)濟(jì)問題，傳統(tǒng)經(jīng)濟(jì)學(xué)家們從偏好，信念及理性三個(gè)方面來界定經(jīng)濟(jì)主體的特征，其中信念就是個(gè)體認(rèn)為不同結(jié)果將會(huì)出現(xiàn)的基于個(gè)體所獲信息之上的條件概率。偏好則是基于不同結(jié)果的信念之上的序。理性是根據(jù)上述偏好及信念，個(gè)體獲得最優(yōu)決策的程度以及個(gè)體根據(jù)已經(jīng)獲得的信息來修正其信念的能力。這三個(gè)特征使得經(jīng)濟(jì)學(xué)研究的對(duì)象由現(xiàn)實(shí)人轉(zhuǎn)向了理想化的對(duì)象，經(jīng)濟(jì)學(xué)越來越偏離了現(xiàn)實(shí)。

由理性概念而引致的缺陷首先表現(xiàn)在理性人具有無限的信息收集及處理能力的均衡觀，認(rèn)為經(jīng)濟(jì)系統(tǒng)常常處于均衡狀態(tài)，非均衡只是一種暫時(shí)的現(xiàn)象，當(dāng)受到外生因素?cái)_動(dòng)而使系統(tǒng)偏離均衡狀態(tài)時(shí)，系統(tǒng)會(huì)以線性的方式回歸均衡，這種機(jī)械式線性反應(yīng)的均衡觀來源于牛頓力學(xué)，由此而得出的比較靜態(tài)分析法完全忽視了系統(tǒng)受到非線性擾動(dòng)及連續(xù)因素的影響。其次表現(xiàn)在由全知全能的理性人而引致的均衡跳躍觀，認(rèn)為經(jīng)濟(jì)系統(tǒng)達(dá)到均衡或者從一個(gè)均衡到另一個(gè)均衡是不需要時(shí)間的，認(rèn)為時(shí)間是可逆的，即經(jīng)濟(jì)變量與物理學(xué)的變量一樣，只要條件相同系統(tǒng)的均衡也就相同，市場(chǎng)和經(jīng)濟(jì)對(duì)于過去的記憶是短暫的或者是沒有的。這種應(yīng)用經(jīng)典牛頓力學(xué)分析方法來分析高度復(fù)雜的參與人經(jīng)濟(jì)行為使得其預(yù)測(cè)效果大打折扣。最后表現(xiàn)在其比較靜態(tài)分析方法上，傳統(tǒng)經(jīng)濟(jì)學(xué)的最基本分析方法----比較靜態(tài)分析法賴以成立的基礎(chǔ)是假定經(jīng)濟(jì)系統(tǒng)只受到外界一個(gè)個(gè)相互獨(dú)立、互不重疊的沖擊的影響，或者當(dāng)一個(gè)因素的影響消除之后，下一因素才開始對(duì)經(jīng)濟(jì)系統(tǒng)產(chǎn)生影響。我們知道現(xiàn)實(shí)世界是普遍聯(lián)系的，各種因素之間不可能相互獨(dú)立，系統(tǒng)中任何一個(gè)因素的變動(dòng)都會(huì)引起其他因素的變動(dòng)，這些因素之間相互作用的時(shí)間可能很短也可能很長，各因素對(duì)最終目標(biāo)會(huì)產(chǎn)生不同程度的影響。比較靜態(tài)法卻只見局部不見整體，企圖通過比較不同均衡來找出系統(tǒng)達(dá)到均衡的條件，因此得不出符合現(xiàn)實(shí)的結(jié)論，其研究方法上的局限性大大降低了其理論的現(xiàn)實(shí)意義。

2.2 心理學(xué)研究成果及有限理性概念的提出

隨著經(jīng)濟(jì)學(xué)家對(duì)理論研究的深入，特別近來實(shí)驗(yàn)經(jīng)濟(jì)學(xué)的迅速發(fā)展，主流經(jīng)濟(jì)學(xué)賴以成立的基礎(chǔ)“理性人”假定及其基本的比較靜態(tài)均衡分析法越來越受到了人們的質(zhì)疑。相繼出現(xiàn)了許多其他的研究方法，其中在經(jīng)濟(jì)學(xué)中影響最大的就是心理學(xué)的研究方法。心理學(xué)應(yīng)用于經(jīng)濟(jì)分析有著非常曲折的歷史。事實(shí)上，斯密、馬歇爾、庇古、費(fèi)雪爾和凱恩斯等一批古典經(jīng)濟(jì)學(xué)家都仔細(xì)地分析了偏好和信念的心理學(xué)基礎(chǔ)。但從1940’s開始，一方面受到薩繆爾森及?？怂沟刃乱慌苫诶硇约俣ń?jīng)濟(jì)學(xué)家的影響，心理分析在經(jīng)濟(jì)學(xué)中的地位慢慢地被降低了；另一方面理性模型也遇到了許多如Allais(1952)悖論等難以給出合理解釋的經(jīng)濟(jì)現(xiàn)象。于是1960’s開始，許多微觀經(jīng)濟(jì)學(xué)家再次運(yùn)用心理學(xué)研究方法來解釋現(xiàn)實(shí)中的異?，F(xiàn)象，宏觀經(jīng)濟(jì)學(xué)也把經(jīng)驗(yàn)法則和適應(yīng)性預(yù)期納入到其模型之中，正是在這一時(shí)期心理學(xué)家Simon(1957)提出了其著名的“有限理性”概念。然而，1970’s初隨著Robert Lucas等人提出的理性預(yù)期理論、Selten、Kreps等倡導(dǎo)的強(qiáng)調(diào)正確信念及貝葉斯修正的博弈理論及Stiglitz、Spence等研究的信息經(jīng)濟(jì)學(xué)理論相繼成為主流經(jīng)濟(jì)學(xué)的一部分，經(jīng)濟(jì)學(xué)界再一次掀起了排除滲透在經(jīng)濟(jì)學(xué)領(lǐng)域中心理學(xué)研究方法的熱潮，心理的研究方法在經(jīng)濟(jì)學(xué)界幾乎無立足之地，嚴(yán)格理性假定席卷整個(gè)經(jīng)濟(jì)學(xué)界。行為經(jīng)濟(jì)學(xué)的發(fā)起者Amos Tversky在經(jīng)濟(jì)學(xué)界根本找不到志趣相投者。1970’s末期，隨著心理學(xué)家Amos Tversky與Kahneman合作發(fā)表了一系列應(yīng)用心理分析方法來研究經(jīng)濟(jì)學(xué)問題的原創(chuàng)性文章，如1974年他們?cè)赟cience發(fā)表的Judgment under uncertainty: Heuristics and biases，1979年他們合作在Econometrica發(fā)表Prospect theory: An analysis of decision under risk，慢慢消除了經(jīng)濟(jì)學(xué)界中存在的對(duì)心理學(xué)分析方法的偏見，此后應(yīng)用心理分析方法來解釋經(jīng)濟(jì)現(xiàn)象的文獻(xiàn)見諸于各種經(jīng)濟(jì)學(xué)期刊之中，心理分析方法也漸漸地成為了主流經(jīng)濟(jì)學(xué)的研究方法之一。

進(jìn)入1980’s，隨著經(jīng)典博弈理論、生態(tài)理論及心理學(xué)理論研究的深入發(fā)展，特別是心理學(xué)家西蒙把其在心理學(xué)領(lǐng)域研究的成果直接應(yīng)用經(jīng)濟(jì)分析并因此獲得了諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)，極大地激勵(lì)著經(jīng)濟(jì)及社會(huì)學(xué)家從現(xiàn)實(shí)人行為出發(fā)來解釋經(jīng)濟(jì)及社會(huì)現(xiàn)象。心理學(xué)研究表明人類認(rèn)知過程首先表現(xiàn)為人們通過一種“感知秩序”進(jìn)行學(xué)習(xí)活動(dòng)，并形成分散的非同質(zhì)的知識(shí)，其中“感知秩序”是指人的理解力、知識(shí)和人類行動(dòng)之間的關(guān)系；其次表現(xiàn)為個(gè)體通過學(xué)習(xí)所達(dá)到的理性程度的有限性，組織學(xué)習(xí)個(gè)體學(xué)習(xí)行為的整合而形成的多層次“理性結(jié)構(gòu)”，個(gè)體理性便會(huì)在一個(gè)累積性的組織或制度環(huán)境中得到塑造和提高并發(fā)揮作用，在這個(gè)過程中，個(gè)體學(xué)習(xí)行為總會(huì)受到組織、習(xí)慣和文化等制度性的限制和影響。西蒙認(rèn)為人類并不是完全理性而是有限理性的，因?yàn)槿祟愓J(rèn)知能力有著心理的臨界極限，人類進(jìn)行推理活動(dòng)需要消耗大量的能量，推理也是一種相對(duì)稀缺的資源，另外決策者決策時(shí)需要大量的信息，而這些信息是不可能免費(fèi)獲得的，獲得決策所需要的信息是需要大量成本的?？紤]到參與人有限的知識(shí)水平、有限的推理能力、有限的信息收集及處理能力，經(jīng)濟(jì)主體的決策行為并非總是最大化的結(jié)果，其決策受到參與人所處的社會(huì)環(huán)境、過去的經(jīng)驗(yàn)、日常慣例及其他人相似情形下的行為選擇等因素的影響。在有限理性條件下，由于參與人無法免費(fèi)獲得決策所需要的全部信息，并且參與人即使獲得了決策所需要的全部信息也可能由于有限的計(jì)算能力而無法得出最優(yōu)決策。因此，參與人只能采取模仿、學(xué)習(xí)等簡(jiǎn)單的直觀決策方法或一些固定的常規(guī)來進(jìn)行決策。人類的決策結(jié)果受到復(fù)雜的認(rèn)知過程的影響，不同的人或者同一個(gè)人在不同時(shí)間即使給出相同的條件也可能會(huì)得出不同的決策結(jié)果，即決策結(jié)果受到認(rèn)知過程的路徑影響。

2002年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)得主之一心理學(xué)家丹尼爾·卡內(nèi)曼(Daniel Kahneman)將源于心理學(xué)的綜合洞察力應(yīng)用于研究在不確定條件下參與人的決策過程及行為結(jié)果并展示了人為決策是如何異于標(biāo)準(zhǔn)經(jīng)濟(jì)理論預(yù)測(cè)的結(jié)果。在1979年，他與有著深厚數(shù)學(xué)及哲學(xué)背景的心理學(xué)家特韋爾斯基（Tversky）提出了震撼經(jīng)濟(jì)學(xué)界的“前景理論”(Prospect theory)。他們的發(fā)現(xiàn)激勵(lì)了新一代經(jīng)濟(jì)學(xué)研究人員運(yùn)用認(rèn)知心理學(xué)來研究經(jīng)濟(jì)學(xué)，使經(jīng)濟(jì)學(xué)的理論更加豐富。一個(gè)理論獲得諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)不僅是對(duì)獲獎(jiǎng)?wù)哌^去成就的肯定，更主要說明了獲獎(jiǎng)理論將會(huì)成為主流經(jīng)濟(jì)學(xué)未來的發(fā)展方向。2002年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)授予給丹尼爾·卡內(nèi)曼標(biāo)志著經(jīng)濟(jì)學(xué)的研究對(duì)象從傳統(tǒng)的“經(jīng)濟(jì)人”轉(zhuǎn)向現(xiàn)實(shí)的“社會(huì)人”，經(jīng)濟(jì)學(xué)直面現(xiàn)實(shí)。如何從有限理性出發(fā)來研究參與人的行為，許多經(jīng)濟(jì)學(xué)家對(duì)之進(jìn)行了廣泛而深入的研究并提出了許多理論，在這些理論之中影響最大且受到了經(jīng)濟(jì)學(xué)界普遍接受的理論即進(jìn)化博弈理論。

2.3 進(jìn)化博弈理論的產(chǎn)生及其發(fā)展

進(jìn)化博弈理論源于對(duì)生態(tài)現(xiàn)象的解釋，1960年代生態(tài)學(xué)家Lewontin就開始運(yùn)用進(jìn)化博弈理論的思想來研究生態(tài)問題。生態(tài)學(xué)家從動(dòng)植物進(jìn)化的研究中發(fā)現(xiàn)，動(dòng)植物進(jìn)化結(jié)果在多數(shù)情況下都可以用博弈論的納什均衡概念來解釋。然而，博弈論是研究完全理性的人類互動(dòng)行為時(shí)提出來的，為什么能夠解釋根本無理性可言的動(dòng)植物的進(jìn)化現(xiàn)象呢？我們知道動(dòng)植物的進(jìn)化遵循達(dá)爾文“優(yōu)勝劣汰”生物進(jìn)化理論，生態(tài)演化的結(jié)果卻能夠利用博弈理論來給予合理的解釋，這種巧合意味著我們可以去掉經(jīng)典博弈理論中理性人假定的要求。另外，1960年代生態(tài)學(xué)理論研究取得突破性的進(jìn)展，非合作博弈理論研究成果也不斷涌現(xiàn)并日趨成熟，進(jìn)化博弈理論具備了產(chǎn)生的現(xiàn)實(shí)及理論基礎(chǔ)。

進(jìn)化博弈理論應(yīng)用于研究經(jīng)濟(jì)學(xué)問題在學(xué)術(shù)界曾經(jīng)引起極大的爭(zhēng)議，爭(zhēng)論的焦點(diǎn)在于理性假定。當(dāng)時(shí)由于理性概念在經(jīng)濟(jì)學(xué)界已經(jīng)根深蒂固。多數(shù)人認(rèn)為利用研究生態(tài)演化的進(jìn)化博弈理論來研究參與人的行為是不合適的。因?yàn)閯?dòng)植物行為是完全由其基因所決定的，而經(jīng)濟(jì)問題則涉及到具有邏輯思維及學(xué)習(xí)、模仿能力的理性參與人的行為，因此，借助于進(jìn)化博弈理論來研究遠(yuǎn)比動(dòng)植物復(fù)雜的人類行為顯然是行不通的。但隨著心理學(xué)研究的發(fā)展及有限理性概念的提出，越來越多的經(jīng)濟(jì)學(xué)家應(yīng)用進(jìn)化博弈理論來解釋經(jīng)濟(jì)現(xiàn)象并獲得了巨大的成功，利用進(jìn)化博弈理論來研究并解釋經(jīng)濟(jì)現(xiàn)象的文獻(xiàn)大量出現(xiàn)于各種經(jīng)濟(jì)學(xué)期刊了。盡管如此，利用進(jìn)化博弈理論來解釋經(jīng)濟(jì)現(xiàn)象還是需要對(duì)該理論的基本分析框架作出相應(yīng)的調(diào)整。如果去掉參與人偏好、信念及理性假定等條件，那么參與人是如何作出決策的呢？進(jìn)化博弈理論在處理有限理性參與人決策問題時(shí)，常常假定參與人遵循某種比貝葉斯法則更簡(jiǎn)單的行為規(guī)則，這種行為規(guī)則應(yīng)該告訴如何采取行動(dòng)及如何根據(jù)經(jīng)驗(yàn)來改變行為選擇，這樣參與人只要知道什么會(huì)發(fā)生，而不必知道為什么會(huì)發(fā)生。

1970年代，生態(tài)學(xué)家Maynard Smith and Price（1973）結(jié)合生物進(jìn)化論與經(jīng)典博弈理論在研究生態(tài)演化現(xiàn)象的基礎(chǔ)上而提出了進(jìn)化博弈理論的基本均衡概念----進(jìn)化穩(wěn)定策略（Evolutionarily stable stragegy ESS），目前學(xué)術(shù)界普遍認(rèn)為進(jìn)化穩(wěn)定策略概念的提出標(biāo)志著進(jìn)化博弈理論的誕生。此后，生態(tài)學(xué)家Taylor and Jonker（1978）在考察生態(tài)演化現(xiàn)象時(shí)首次提出了進(jìn)化博弈理論的基本動(dòng)態(tài)概念----模仿者動(dòng)態(tài)（Replicator Dynamics）。至此，進(jìn)化博弈理論有了明確的研究目標(biāo)。

1980年代以后，隨著新古典經(jīng)濟(jì)學(xué)及博弈論固有的缺陷逐漸被人們所認(rèn)識(shí)，有限理性概念得到了學(xué)術(shù)界的普遍認(rèn)可，加之進(jìn)化博弈理論在解釋生態(tài)現(xiàn)象時(shí)獲得的巨大成功，特別是經(jīng)濟(jì)學(xué)界于1992年在康奈爾大學(xué)召開的進(jìn)化博弈理論學(xué)術(shù)會(huì)議，正式確立了該理論的學(xué)術(shù)地位。一大批如Larry Sameulson、Ken Binmore、Peyton Young等經(jīng)濟(jì)學(xué)家從不同的角度對(duì)傳統(tǒng)的進(jìn)化博弈理論分析框架進(jìn)行拓展，并使之逐漸轉(zhuǎn)化為描述經(jīng)濟(jì)行為的理論。目前，進(jìn)化博弈理論的基本理論體系雖然已經(jīng)形成但還是相當(dāng)粗糙。因此，它仍然處于不斷發(fā)展和完善的階段，但該理論提供了比傳統(tǒng)理論更具現(xiàn)實(shí)性且能夠更準(zhǔn)確地解釋并預(yù)測(cè)參與人行為的研究方法，從而得到了越來越多的經(jīng)濟(jì)學(xué)家、社會(huì)學(xué)家、生態(tài)學(xué)家的重視，我們有理由相信該理論成為主流經(jīng)濟(jì)學(xué)的一部分已經(jīng)為時(shí)不遠(yuǎn)。

三、進(jìn)化博弈理論的基本內(nèi)容

進(jìn)化博弈理論結(jié)合經(jīng)典博弈理論及生態(tài)理論研究成果，并以有限理性的參與人群體為研究對(duì)象，利用動(dòng)態(tài)分析方法把影響參與人行為的各種因素納入其模型之中，并以系統(tǒng)論的觀點(diǎn)來考察群體行為的演化趨勢(shì)。

進(jìn)化生態(tài)學(xué)與博弈論的結(jié)合至少已有三十幾年的歷史，初看起來使人覺得奇怪，因?yàn)椴┺恼摮３＜俣▍⑴c人是完全理性的，而基因和其他的演化載體常常被假定是以一種完全機(jī)械的方式運(yùn)動(dòng)。然而一旦用參與人群體來代替博弈論中的參與者個(gè)人，用群體中選擇不同純策略的個(gè)體占群體中個(gè)體總數(shù)的百分比來代替博弈論中的混合策略，那么這兩種理論就達(dá)到了形式上的統(tǒng)一。盡管這兩種理論在形式上達(dá)到了統(tǒng)一，但進(jìn)化博弈理論與經(jīng)典博弈理論還是存在本質(zhì)區(qū)別。在進(jìn)化博弈理論中每個(gè)參與人都是隨機(jī)地從群體中抽取并進(jìn)行重復(fù)、匿名博弈，他們沒有特定的博弈對(duì)手 ④。在這種情況下，參與人既可以通過自己的經(jīng)驗(yàn)直接獲得決策信息，也可以通過觀察在相似環(huán)境中其他參與人的決策并模仿而間接地獲得決策信息，還可以通過觀察博弈的歷史而從群體分布中獲得決策信息。對(duì)參與人來說，觀察群體行為的歷史即估算群體分布是非常重要的，首先，群體分布包含了對(duì)手如何選擇策略的信息。其次，通過觀察群體分布也有助于參與人知道什么是好的策略什么是不好的策略。參與人常常會(huì)模仿好的策略⑤ 而不好的策略則會(huì)在進(jìn)化過程中淘汰，模仿是學(xué)習(xí)過程中的一個(gè)重要組成部分，成功的行為不僅以說教的形式傳遞下來，而且也容易被模仿。參與人由于受到理性的約束而其行為是幼稚的（Naive），其決策不是通過迅速的最優(yōu)化計(jì)算得到，而是需要經(jīng)歷一個(gè)適應(yīng)性的調(diào)整過程，在此過程中參與人會(huì)受到其所處環(huán)境中各種確定性或隨機(jī)性因素影響。因此，系統(tǒng)均衡是達(dá)到均衡過程的函數(shù)，要更準(zhǔn)確地描述參與人行為就必須考察經(jīng)濟(jì)系統(tǒng)的動(dòng)態(tài)調(diào)整過程，動(dòng)態(tài)均衡概念及動(dòng)態(tài)模型在進(jìn)化博弈理論中占有相當(dāng)重要的地位。

3.1 進(jìn)化博弈理論基本模型分類

進(jìn)化博弈理論的基本模型按其所考察的群體數(shù)目可分為單群體模型(Monomorphic Population Model)與多群體模型(Polymorphic Populations Model)。單群體模型直接來源生態(tài)學(xué)的研究，在研究生態(tài)現(xiàn)象時(shí)，生態(tài)學(xué)家常常把同一個(gè)生態(tài)環(huán)境中所有種群看作一個(gè)大群體，由于生物的行為是由其基因唯一確定的，因而可以把生態(tài)環(huán)境中每一個(gè)種群都程式化為一個(gè)特定的純策略。經(jīng)過這樣處理以后，整個(gè)群體就相當(dāng)于一個(gè)選擇不同純策略（純策略集的數(shù)目就相當(dāng)于群體中的種群數(shù)）的個(gè)體。群體中隨機(jī)抽取的個(gè)體兩兩進(jìn)行的都是對(duì)稱博弈，有些文獻(xiàn)中稱這類模型為對(duì)稱模型（Symmetry model）。嚴(yán)格地說，單群體時(shí)個(gè)體進(jìn)行的并不是真正意義上的博弈，博弈是在個(gè)體與群體分布所代表的虛擬參與人之間進(jìn)行。如第一部分的老鷹----鴿子博弈，該生態(tài)環(huán)境中有兩個(gè)種群老鷹與鴿子，它們代表兩個(gè)不同的純策略，用進(jìn)化方法進(jìn)行處理時(shí)認(rèn)為該生態(tài)群體中每個(gè)個(gè)體都有兩種可供選擇策略即老鷹策略與鴿子策略，此時(shí)的博弈并不是在隨機(jī)抽取的兩個(gè)個(gè)體之間進(jìn)行，而是每個(gè)個(gè)體都觀察群體狀態(tài)（選擇老鷹策略與鴿子策略個(gè)體數(shù)在群體中所占的比例），給定此狀態(tài)它就可以計(jì)算自己選擇不同策略所得的期望支付（嚴(yán)格地說這并不是期望支付，但為了說明的方便本文仍然借用該概念）進(jìn)而確定選擇哪一個(gè)策略不選擇哪一個(gè)策略，對(duì)物種而言這就意味著種群數(shù)量的增加或減少。

多群體模型是由Selten (1980)首次提出并進(jìn)行研究的，他在傳統(tǒng)單群體生態(tài)進(jìn)化模型中通過引入角色限制行為（Role Conditioned Behavior）而把對(duì)稱模型變?yōu)榱朔菍?duì)稱模型。在非對(duì)稱博弈個(gè)體之間有角色區(qū)分，此時(shí)可以從大群體中區(qū)分出不同的小群體，群體中隨機(jī)抽取的個(gè)體之間進(jìn)行真正意義上的兩兩配對(duì)重復(fù)、匿名非對(duì)稱博弈，有時(shí)又稱之為非對(duì)稱模型（Asymmetry model）。如果我們把系統(tǒng)選擇博弈中的宿舍變成學(xué)校（整個(gè)學(xué)校相當(dāng)于一個(gè)大群體）而把十個(gè)人變成十個(gè)班（每一個(gè)班看成是一個(gè)小群體，且同一班的同學(xué)無角色區(qū)分即與單群體情形一樣），每個(gè)班的學(xué)生都有多種選擇，此時(shí)該校學(xué)生所進(jìn)行的計(jì)算機(jī)系統(tǒng)選擇博弈就是非對(duì)稱博弈。非對(duì)稱博弈模型并不是對(duì)單群體博弈模型的簡(jiǎn)單改進(jìn)，由單群體到多群體涉及到一系列的如均衡及穩(wěn)定性等問題的變化。Selten(1980)證明了“在多群體博弈中進(jìn)化穩(wěn)定均衡都是嚴(yán)格納什均衡⑥ ”的結(jié)論，這就說明在多群體博弈中，傳統(tǒng)的進(jìn)化穩(wěn)定均衡概念就顯示出其局限性了。同時(shí)，在模仿者動(dòng)態(tài)下，同一博弈在單群體與多群體時(shí)也會(huì)有不同的進(jìn)化穩(wěn)定均衡。

按照群體在演化過程中所受到的影響因素是確定性的還是隨機(jī)性的，進(jìn)化博弈模型可分為確定性動(dòng)態(tài)模型和隨機(jī)性動(dòng)態(tài)模型。確定性模型一般比較簡(jiǎn)單并且能夠較好地描述系統(tǒng)的演化趨勢(shì)，因而，理論界對(duì)之進(jìn)行較多的研究。隨機(jī)性模型需要考慮許多隨機(jī)因素對(duì)動(dòng)態(tài)系統(tǒng)的影響，一般比較復(fù)雜，但該類模型卻能夠更準(zhǔn)確地描述系統(tǒng)的行為，近年來理論界對(duì)之也進(jìn)行廣泛的探討[對(duì)隨機(jī)動(dòng)態(tài)的詳細(xì)討論可以參閱這方面的經(jīng)典文獻(xiàn)Foster, D., and P. Young.(1990), Fudenberg, D. and C. Harris (1992), Kandori, M. G. Mailath, and R. Rob(1993)]。

3.2 進(jìn)化博弈理論基本均衡概念-----進(jìn)化穩(wěn)定策略

進(jìn)化博弈理論的基本均衡概念---進(jìn)化穩(wěn)定策略⑦ [文獻(xiàn)2、5有詳細(xì)介紹]是由Maynard Smith and Price（1973）及Maynard Smith(1974)在研究生態(tài)演化問題時(shí)提出來的，其直觀思想是：如果一個(gè)群體（原群體）的行為模式能夠消除任何小的突變?nèi)后w，那么這種行為模式一定能夠獲得比突變?nèi)后w高的支付，隨著時(shí)間的演化突變者群體最后會(huì)從原群體中消失，原群體所選擇的策略就是進(jìn)化穩(wěn)定策略。系統(tǒng)選擇進(jìn)化穩(wěn)定策略時(shí)所處的狀態(tài)即是進(jìn)化穩(wěn)定狀態(tài)，此時(shí)的均衡就是進(jìn)化穩(wěn)定均衡。下面給出Maynard Smith and Price（1973）對(duì)進(jìn)化穩(wěn)定策略的定義（此后本文稱之為原初定義），用符號(hào)表示如下：

說是進(jìn)化穩(wěn)定策略，如果，存在一個(gè)<，不等式對(duì)任意都成立。其中A是群體中個(gè)體博弈時(shí)的支付矩陣；y表示突變策略；是一個(gè)與突變策略y有關(guān)的常數(shù)，稱之為侵入邊界（Invasion Barriers）；表示選擇進(jìn)化穩(wěn)定策略群體與選擇突變策略群體所組成的混合群體。實(shí)際上相當(dāng)于該吸引子對(duì)應(yīng)吸引域的半徑，也就說進(jìn)化穩(wěn)定策略考察的是系統(tǒng)落于該均衡的吸引域范圍之內(nèi)的動(dòng)態(tài)性質(zhì)，而落于吸引域范圍之外是不考慮的，所以說它只能夠描述系統(tǒng)的局部動(dòng)態(tài)性質(zhì)。至于系統(tǒng)是如何進(jìn)入吸引域的原初的進(jìn)化穩(wěn)定策略定義所沒有給予足夠的重視。

要準(zhǔn)確地理解進(jìn)化穩(wěn)定策略概念就必須正確理解突變者和侵入邊界的含義。我們可借助于前面的兩個(gè)例子來理解。在老鷹、鴿子博弈中，當(dāng)該生態(tài)環(huán)境中只有老鷹（或只有鴿子）時(shí)，這時(shí)系統(tǒng)已經(jīng)處于均衡狀態(tài)，但它們都是不穩(wěn)定的均衡，因?yàn)檫@兩個(gè)均衡都可以被突變者侵入。開始時(shí)，假定該生態(tài)環(huán)境處于老鷹均衡，如果由于某種原因而進(jìn)入鴿子時(shí)，那么隨著時(shí)間的演化，整個(gè)生態(tài)系統(tǒng)最終就會(huì)穩(wěn)定于一半為老鷹一半為鴿子的狀態(tài)，即混合策略納什均衡是進(jìn)化穩(wěn)定的。這說明該博弈中兩個(gè)純策略納什均衡是不穩(wěn)定的。因?yàn)?，?dāng)系統(tǒng)處于純策略所表示的狀態(tài)時(shí)，只要存在突變者系統(tǒng)就會(huì)離開這種狀態(tài)，所以它們都不是進(jìn)化穩(wěn)定的。相反混合策略納什均衡卻不一樣，即當(dāng)系統(tǒng)處于一半是老鷹一半是鴿子時(shí)，如果由于某種因素使得系統(tǒng)偏離該狀態(tài)，那么系統(tǒng)會(huì)自動(dòng)恢復(fù)到原來狀態(tài)。另外，在系統(tǒng)選擇博弈中突變者、侵入邊界就更為明顯，所謂突變者即是指選擇進(jìn)化穩(wěn)定策略以外的策略者，且侵入邊界與不同的均衡有關(guān)。該博弈有兩個(gè)純策略納什均衡和一個(gè)混合策略納什均衡（），前一個(gè)均衡所對(duì)應(yīng)的侵入邊界就是，也就是說如果選擇操作系統(tǒng)的學(xué)生數(shù)占群體總數(shù)的比例大于（即學(xué)生數(shù)大于4），那么選擇操作系統(tǒng)的突變者就不可能侵入到該群體中，如果選擇操作系統(tǒng)的學(xué)生數(shù)占群體總的比例小于（即學(xué)生數(shù)小于4），那么選擇操作系統(tǒng)的突變者就會(huì)侵入到該群體中而原來選擇操作系統(tǒng)的學(xué)生會(huì)轉(zhuǎn)而學(xué)習(xí)操作系統(tǒng)。

最初進(jìn)化穩(wěn)定策略定義有比較苛刻的條件限制，如單群體、群體中個(gè)體數(shù)目無限大、系統(tǒng)只受到不連續(xù)且互不重疊沖擊的影響等。這些條件大大地限制該定義的應(yīng)用，隨著學(xué)術(shù)界對(duì)進(jìn)化博弈理論研究的深入，許多理論家們從不同的角度對(duì)最初定義進(jìn)行了拓展，如Selten 1980首次給出了適應(yīng)于描述多群體均衡的定義；Schaffer 1988首次給出了適應(yīng)于描述有限規(guī)模群體的均衡定義；Foster and Young（1990）首次給出了適應(yīng)于描述連續(xù)隨機(jī)系統(tǒng)的均衡定義等等（有關(guān)對(duì)進(jìn)化穩(wěn)定策略進(jìn)行拓展的討論見文獻(xiàn)[5]）。最初定義是在解釋生態(tài)現(xiàn)象時(shí)提出來的，如果進(jìn)行經(jīng)濟(jì)分析，時(shí)需要進(jìn)行相應(yīng)的改變。在分析生態(tài)現(xiàn)象時(shí)，把每一個(gè)種群的行為都程式化為一個(gè)策略，因此進(jìn)化的結(jié)果將會(huì)是突變種群的消失（消失的原因在于生物的行為是由其遺傳基因唯一確定的）。如果用于經(jīng)濟(jì)分析，那么進(jìn)化的結(jié)果將是那些選擇突變策略的個(gè)體最終會(huì)改變策略而選擇進(jìn)化穩(wěn)定策略（因?yàn)槿祟惪梢酝ㄟ^學(xué)習(xí)、模仿等來改變自己所選擇的策略）。

經(jīng)典博弈理論中的核心概念納什均衡即是指一種策略組合，在該策略組合下任何個(gè)人單獨(dú)偏離都不會(huì)變得比不偏離好。納什均衡是一個(gè)靜態(tài)概念，不能描述系統(tǒng)的動(dòng)態(tài)性質(zhì)，用數(shù)學(xué)語言來說它是動(dòng)態(tài)系統(tǒng)的不動(dòng)點(diǎn)，納什的成功就是在于他應(yīng)用拓?fù)鋵W(xué)的不動(dòng)點(diǎn)定理證明了納什均衡的存在性。進(jìn)化穩(wěn)定策略必定是納什均衡策略，它是納什均衡的精練，文獻(xiàn)[3]對(duì)此有詳細(xì)的介紹。在進(jìn)化穩(wěn)定策略的定義中引入突變者及侵入邊界使之能夠更好地描述系統(tǒng)的局部動(dòng)態(tài)性質(zhì)。第一部分的兩個(gè)例子中，按照納什均衡的概念是無法得知兩個(gè)系統(tǒng)最終會(huì)選擇哪一個(gè)均衡，但利用進(jìn)化穩(wěn)定策略卻可以說明系統(tǒng)最終會(huì)穩(wěn)定哪一個(gè)均衡并可以分析系統(tǒng)達(dá)到不同均衡的條件，在某種程度上，較好地解決了多重均衡選擇問題。

3.3 進(jìn)化博弈理論基本動(dòng)態(tài)概念----模仿者動(dòng)態(tài)

進(jìn)化博弈理論來源于生態(tài)學(xué)的研究，該理論基本上從“優(yōu)勝劣汰”的進(jìn)化論觀點(diǎn)來看待群體行為的調(diào)整過程。一般的進(jìn)化過程都包括兩個(gè)可能的行為演化機(jī)制：選擇機(jī)制(Selection Mechanism)和突變機(jī)制（Mutation mechanism）。選擇機(jī)制是指本期中能夠獲得較高支付的策略，在下期被更多參與者選擇；突變是指參與者以隨機(jī)（無目的性）的方式選擇策略，因此突變策略可能獲得較高支付也可能獲得較低支付，突變一般很少發(fā)生。新的突變也必須經(jīng)過選擇，并且只有獲得較高支付的策略才能生存（Survive）下來。進(jìn)化博弈理論需要解決的關(guān)鍵問題就是如何描述群體行為的這種選擇機(jī)制和突變機(jī)制。博弈理論家對(duì)群體行為調(diào)整過程進(jìn)行了廣泛而深入的研究，由于他們考慮問題的角度不同，對(duì)群體行為調(diào)整過程的研究重點(diǎn)也就不同，因而提出了不同的動(dòng)態(tài)模型，如Weibull(1995) 提出的模仿動(dòng)態(tài)（Imitation Dynamics）模型，認(rèn)為人們常常模仿其他人的行為尤其是能夠產(chǎn)生較高支付的行為；Börgers and Sarin(1995，1997)等提出并應(yīng)用強(qiáng)化動(dòng)態(tài)（Reinforcement Dynamics）來研究現(xiàn)實(shí)中參與人的學(xué)習(xí)過程；Skyrms (1986) 引入了意向動(dòng)態(tài)（Deliberational Dynamics）模型對(duì)哲學(xué)中的理性問題進(jìn)行了討論；Swinkels(1993)提出了近似調(diào)整動(dòng)態(tài)（Myopic Adjustment Dynamics）；Borgers and Sarin(1995)提出了刺激—反應(yīng)動(dòng)態(tài)（Stimulus-Response Dynamics）等等。到目前為止，在進(jìn)化博弈理論中應(yīng)用得最多的還是由Taylor and Jonker(1978)在對(duì)生態(tài)現(xiàn)象進(jìn)行解釋時(shí)首次提出描述單群體動(dòng)態(tài)調(diào)整過程的模仿者動(dòng)態(tài)（Replicator Dynamics）。所謂模仿者動(dòng)態(tài)是指使用某一策略人數(shù)的增長率等于使用該策略時(shí)所得的支付與平均支付之差。下面就給出Taylor and Jonker（1978）提出的模仿者動(dòng)態(tài)的微分形式：

化的而且因素之間的互動(dòng)作用也是需要時(shí)間的。因此，均衡只是一種暫時(shí)現(xiàn)象或者在多數(shù)情況下，系統(tǒng)根本不可能達(dá)到的現(xiàn)象，要更準(zhǔn)確地考察參與人的行為就必須運(yùn)用系統(tǒng)論的觀點(diǎn)，把行為互動(dòng)性、因素互動(dòng)性及時(shí)間因素納入到其模型之中。

5.2 經(jīng)典博弈理論的策略互動(dòng)分析法及其缺陷

考慮到新古典經(jīng)濟(jì)學(xué)沒有把參與人行為之間的互動(dòng)關(guān)系納入到其模型之中，經(jīng)典博弈理論則在理性人假定的基礎(chǔ)上把參與人行為的互動(dòng)關(guān)系納入到其模型之中進(jìn)一步考察了參與人的決策問題。在我國，對(duì)人類互動(dòng)行為的研究至少可以追溯到三國時(shí)期田賽馬的故事，但作為一種正式理論提出來，一般認(rèn)為是始于馮·諾意曼和摩根斯藤（Von Neumann and O. Morgenstern, 1944）出版的《博弈論與經(jīng)濟(jì)行為》一書，直到納什（Nash 1950）在研究非合作博弈的基礎(chǔ)上提出著名的納什均衡（Nash Equilibrium）概念才使得博弈論成為一門完整的理論。經(jīng)過近五十年的發(fā)展，終于在1994年，三位杰出的博弈論大師：納什（John F. Nash）、澤爾藤（Rechard Selten）和海薩尼(John C. Harsanyi)獲得了經(jīng)濟(jì)學(xué)的最高榮譽(yù)——諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)，在全球經(jīng)濟(jì)學(xué)界再次掀起了對(duì)博弈論的研究熱潮。經(jīng)典博弈論為社會(huì)科學(xué)提供了一個(gè)新的研究視角，使我們能夠以全新的方法來處理各種沖突與合作的問題。博弈論作為一種理論工具，其應(yīng)用相當(dāng)廣泛。在信息經(jīng)濟(jì)學(xué)中得到了充分的應(yīng)用，1996年諾獎(jiǎng)得主Mirrlees等、2001年諾獎(jiǎng)得主Akerlof等都對(duì)信息經(jīng)濟(jì)學(xué)研究作出了卓越的貢獻(xiàn)。這充分說明了博弈論在經(jīng)濟(jì)學(xué)的地位可見一斑。

經(jīng)典博弈理論的核心概念----納什均衡就是由普林斯頓大學(xué)數(shù)學(xué)家納什在研究非合作博弈時(shí)提出來的。納什均衡即是指給定其他參與人選擇的情況下，每一個(gè)人單獨(dú)偏離均衡都不會(huì)變得比不偏離好，顯然納什均衡是一個(gè)靜態(tài)均衡概念。經(jīng)典博弈理論盡管把參與人的互動(dòng)行為引入到其模型之中，并認(rèn)為現(xiàn)實(shí)中參與人不是孤立地作出自己的決策，每一個(gè)參與人的決策不僅依賴于其自身所面臨的條件及其所擁有的信息，而且也依賴于其他參與人的決策選擇。但該理論卻面臨著其自身無法克服的缺點(diǎn)。首先，博弈論中的互動(dòng)是一種“沉默互動(dòng)⑨ ”，這種互動(dòng)不允許參與人之間存在任何形式的交流，即假定參與人都是一個(gè)個(gè)只會(huì)理性計(jì)算的孤立經(jīng)濟(jì)人而非社會(huì)人，一旦引入社會(huì)互動(dòng)，許多博弈都無法進(jìn)行分析，也就是說經(jīng)典博弈理論中的互動(dòng)并不“社會(huì)互動(dòng)”而是孤立的“沉默互動(dòng)”。其次，博弈論的基本均衡概念納什均衡要求博弈各方都是理性的，并且理性是共同知識(shí)，博弈時(shí)如果某一方選擇了非理，那么博弈就無法進(jìn)行下去。特別地該理論在利用后向歸納法（Backward Induction）對(duì)納什均衡進(jìn)行精練時(shí)，不但要求參與人完全理性，而且還要求參與人的行為滿足序貫理性（Sequential Rationality）要求。這一比理性更強(qiáng)的要求使得博弈論更加遠(yuǎn)離現(xiàn)實(shí)人。再次，在處理參與人所面臨的不確定性時(shí)，不僅要求各參與人知道世界的各種狀態(tài)，而且要求參與人知道每一種狀態(tài)所出現(xiàn)的概率，并且給定一個(gè)先念信念，當(dāng)出現(xiàn)任何新信息時(shí)，每個(gè)參與人都能夠應(yīng)用貝葉斯法則修正自己的先念信念，也就是說參與人不但具有很強(qiáng)的計(jì)算、推理能力，而且能夠在一個(gè)大的狀態(tài)空間上應(yīng)用貝葉斯法則解決相當(dāng)復(fù)雜的問題。現(xiàn)實(shí)中多數(shù)情況下，參與人并不都具有這種計(jì)算、推理能力。最后，博弈論碰到了其最棘手的問題就是多重均衡的處理，當(dāng)博弈出現(xiàn)多重均衡特別是多重嚴(yán)格納什均衡時(shí)，盡管許多理論家提出了一些方法（Selten（1965）提出的子博弈精煉納什均衡概念，Selten（1975）提出的顫抖手精練納什均衡，Kerps—wilson(1982)提出的序貫均衡，Schelling（1960）提出的聚點(diǎn)均衡等）來處理多重均衡問題，但始終沒能獲得一致認(rèn)可的結(jié)論。

與新古典經(jīng)濟(jì)學(xué)相比，經(jīng)典博弈理論雖然在其模型中納入了行為的“沉默互動(dòng)”關(guān)系，但該理論給出的研究方法仍然沒能跳出新古典經(jīng)濟(jì)學(xué)的均衡分析框架，這種只注重結(jié)果而忽略達(dá)到結(jié)果的過程的分析方法依然把對(duì)經(jīng)濟(jì)系統(tǒng)的影響因素都看作為一個(gè)個(gè)孤立因素，依然認(rèn)為影響因素與決策結(jié)果是一一對(duì)應(yīng)的關(guān)系，依然沒能把參與人所處社會(huì)環(huán)境等因素納入到其模型之中，因而不能準(zhǔn)確地描述現(xiàn)實(shí)中人的決策行為，其結(jié)論也僅僅具有理論意義而缺乏政策含義。

5.3 進(jìn)化博弈理論局部動(dòng)態(tài)分析方法的現(xiàn)實(shí)性

進(jìn)化博弈理論利用達(dá)爾文“優(yōu)勝劣汰”的生物進(jìn)化論、經(jīng)典博弈理論并結(jié)合心理學(xué)的研究成果，從西蒙提出有限理性（Bounded Rationality）的參與人群體出發(fā)，通過對(duì)群體行為的研究進(jìn)一步得出參與人個(gè)體的行為。進(jìn)化博弈理論跨越了完全理性的“經(jīng)濟(jì)人”與有限理性的“社會(huì)人”的鴻溝，實(shí)現(xiàn)了經(jīng)濟(jì)學(xué)研究方法革命性的突破。與傳統(tǒng)均衡分析法相比，進(jìn)化博弈理論的局部動(dòng)態(tài)分析方法在以下幾個(gè)方面獨(dú)具特色。

5.3.1 局部動(dòng)態(tài)分析法的均衡觀

傳統(tǒng)的均衡分析方法認(rèn)為完全理性參與人能夠?qū)Νh(huán)境的任何變化作出迅速的最優(yōu)反應(yīng)，因而，經(jīng)濟(jì)系統(tǒng)是常常處于均衡狀態(tài)的，分析參與人的行為只需要研究均衡結(jié)果，并以此來預(yù)測(cè)經(jīng)濟(jì)人的行為，通過比較不同均衡結(jié)果來尋找系統(tǒng)達(dá)到均衡的條件。這種處理方法為了數(shù)學(xué)上處理的方便而撇開現(xiàn)實(shí)中“因素互動(dòng)”而分別考察單個(gè)因素對(duì)均衡的影響，使得理論更加缺乏現(xiàn)實(shí)基礎(chǔ)。進(jìn)化博弈理論則完全摒棄傳統(tǒng)理論中非現(xiàn)實(shí)的“理性人”假定，直接從有限理性參與人群體出發(fā)而提出的一種全新的研究方法----局部動(dòng)態(tài)法。局部動(dòng)態(tài)法把經(jīng)濟(jì)系統(tǒng)達(dá)到均衡結(jié)果的過程納入到其模型之中，認(rèn)為經(jīng)濟(jì)系統(tǒng)達(dá)到均衡需要一個(gè)長期的漸進(jìn)過程，均衡結(jié)果依賴于達(dá)到均衡的過程，也就是說任何一個(gè)結(jié)果都是路徑依賴的，它與混沌經(jīng)濟(jì)學(xué)完全動(dòng)態(tài)的研究方法具有某種程度的相似之處。

5.3.2 局部動(dòng)態(tài)法的時(shí)間觀

傳統(tǒng)的均衡分析法并沒有納入因素互動(dòng)關(guān)系并且理性計(jì)算是不需要時(shí)間的，所以得出經(jīng)濟(jì)系統(tǒng)常常是均衡的結(jié)論。進(jìn)化博弈理論的局部動(dòng)態(tài)法一個(gè)顯著特征就是把參與人的決策過程時(shí)間及因素互動(dòng)的時(shí)間納入到其基本模型之中，強(qiáng)調(diào)系統(tǒng)達(dá)到均衡的過程，并認(rèn)為經(jīng)濟(jì)系統(tǒng)由于受到各種互動(dòng)行為及互動(dòng)因素的影響，有些系統(tǒng)達(dá)到均衡可能只需要很短的時(shí)間，有些系統(tǒng)達(dá)到均衡可能需要很長的時(shí)間，有些系統(tǒng)可能無法達(dá)到均衡。時(shí)間因素對(duì)經(jīng)濟(jì)學(xué)研究有著非常重要的意義，如均衡分析法無法考慮宏觀經(jīng)濟(jì)政策中“時(shí)滯”使得許多實(shí)施時(shí)有效的政策在發(fā)生作用時(shí)卻出現(xiàn)了與原意相反的結(jié)果。時(shí)間是度量政策效率的一個(gè)很重要的因素，如果不考慮時(shí)間因素有些政策可能很有效率，但納入時(shí)間因素，一些需要太長時(shí)間才能使系統(tǒng)達(dá)到意愿均衡的政策可能根本就沒有效率。進(jìn)化博弈理論把時(shí)間納入到模型分析中并充分應(yīng)用數(shù)學(xué)中的相圖來描述經(jīng)濟(jì)系統(tǒng)達(dá)到均衡的路徑，這樣有利于決策者控制經(jīng)濟(jì)系統(tǒng)使之朝向既定的目標(biāo)前進(jìn)，也有利于決策者尋找能夠最大限度地促進(jìn)系統(tǒng)向意愿均衡轉(zhuǎn)化的因素，使系統(tǒng)盡快達(dá)到有效率的均衡。

5.3.3 局部動(dòng)態(tài)法的均衡選擇觀

新古典經(jīng)濟(jì)學(xué)研究的邏輯有理性就有均衡，然后在既定均衡下通過對(duì)不同均衡的比較來尋找系統(tǒng)達(dá)到不同均衡的條件，即比較靜態(tài)法，最后結(jié)合條件找出希望達(dá)到的均衡，因此，該理論不存在真正意義的均衡選擇問題。經(jīng)典博弈理論提供的分析方法在多數(shù)情況下都存在其自身所無法處理的多重均衡問題。如老鷹與鴿子博弈及系統(tǒng)選擇博弈中多重均衡問題。進(jìn)化博弈理論的局部動(dòng)態(tài)法引入突變因素就能夠較好地解決了多重均衡的選擇問題，在老鷹與鴿子博弈中，盡管全是老鷹（全是鴿子）都是均衡的，但這兩個(gè)均衡都極不穩(wěn)定即都不是進(jìn)化穩(wěn)定均衡，一旦有鴿子（老鷹）突變者進(jìn)入該系統(tǒng)就會(huì)使系統(tǒng)偏離，隨著時(shí)間的推移而使得系統(tǒng)趨向于混合策略進(jìn)化穩(wěn)定均衡即一半鴿子一半老鷹（該均衡是一個(gè)全局吸引子）；在系統(tǒng)選擇博弈中經(jīng)典博弈理論無法解釋系統(tǒng)最終會(huì)趨于哪一個(gè)均衡，局部動(dòng)態(tài)法引入了突變因素就能夠很好地解決了均衡選擇問題，即系統(tǒng)最終會(huì)趨于哪一個(gè)均衡依賴于系統(tǒng)的初始狀態(tài)即路徑依賴。進(jìn)化博弈理論的基本均衡概念----進(jìn)化穩(wěn)定均衡描述的是當(dāng)經(jīng)濟(jì)系統(tǒng)一旦進(jìn)入到某一均衡的吸引域內(nèi)時(shí)，系統(tǒng)就會(huì)對(duì)其他的突變策略具有一定程度（即在突變邊界內(nèi)）的抵抗力。

5.3.4 局部動(dòng)態(tài)法的特殊性

新古典經(jīng)濟(jì)學(xué)與經(jīng)典博弈理論均衡分析法都是以單個(gè)消費(fèi)者、單個(gè)生產(chǎn)者、單個(gè)市場(chǎng)為研究對(duì)象來考察參與人的最優(yōu)決策行為，并由此研究整個(gè)社會(huì)的資源配置問題。然而它們卻碰到了如何由個(gè)體行為轉(zhuǎn)化到群體行為的困難，因?yàn)檫@種轉(zhuǎn)化過程涉及到各種互動(dòng)因素的影響。一個(gè)明顯的例子是經(jīng)典博弈理論中囚徒困境博弈，在該博弈中兩個(gè)囚徒都從個(gè)體理性出發(fā)，但得到了集體非理性均衡的結(jié)論。也就是說，均衡分析法根本無法實(shí)現(xiàn)從個(gè)體行為向集體行為的過渡，在此框架內(nèi)尋找宏觀經(jīng)濟(jì)的微觀基礎(chǔ)的困難是非常大的。進(jìn)化博弈理論的局部動(dòng)態(tài)法則從人的社會(huì)性出發(fā)，利用系統(tǒng)論的處理方法來看待參與人的決策行為。該理論直接以參與人的群體為其研究的邏輯起點(diǎn)，在考慮到影響參與人行為的社會(huì)因素、文化因素、民族習(xí)俗及個(gè)體生活習(xí)慣等因素的基礎(chǔ)上進(jìn)一步考察群體中有限理性個(gè)體的行為互動(dòng)關(guān)系，很巧妙地避開由個(gè)體行為向集體行為轉(zhuǎn)化問題，因而能夠更加真實(shí)地反應(yīng)現(xiàn)實(shí)人的決策過程及其決策結(jié)果。

六、結(jié)論

進(jìn)化博弈理論是經(jīng)濟(jì)學(xué)領(lǐng)域的前沿理論，它來源于對(duì)生態(tài)現(xiàn)象的研究，雖然該理論應(yīng)用于經(jīng)濟(jì)分析的時(shí)間不長，但它為經(jīng)濟(jì)學(xué)研究提供了一個(gè)全新的分析方法，較好地克服了新古典經(jīng)濟(jì)學(xué)及經(jīng)典博弈理論中理性假定及多重均衡的困難。并且，應(yīng)用進(jìn)化博弈理論來研究經(jīng)濟(jì)系統(tǒng)能夠獲得比傳統(tǒng)理論更準(zhǔn)確的結(jié)果，能夠更加現(xiàn)實(shí)地解釋經(jīng)濟(jì)現(xiàn)象，因而在短期內(nèi)為多數(shù)經(jīng)濟(jì)學(xué)家所接受。從某種意義上說引入進(jìn)化博弈理論局部動(dòng)態(tài)法來分析經(jīng)濟(jì)中參與人的行為是經(jīng)濟(jì)學(xué)研究方法的一次創(chuàng)新。

注釋： ①本文把源于馮·諾意曼和摩根斯藤經(jīng)納什發(fā)展而成的博弈理論稱之為經(jīng)典博弈理論。 ②即無性生殖，這樣假定的意思就是說后代繼承其母體的策略，并且永遠(yuǎn)不改變，當(dāng)然用于研究人類的行為時(shí)，需要作相應(yīng)的調(diào)整。 ③所謂近視調(diào)整即是指參與人不管未來怎么樣，只知道使當(dāng)前的支付最大化 ④ 經(jīng)典博弈理論中每一個(gè)參與人都有特定的博弈對(duì)象，并且，在重復(fù)動(dòng)態(tài)博弈中，后行動(dòng)者通過觀察先行動(dòng)者的理而利用貝葉斯法則來修正自己的先念信念，然后，在此信念下選擇使自己獲得最大支付的策略。 ⑤好的策略即是指能夠獲得較高支付的策略。 ⑥所謂嚴(yán)格納什均衡即是嚴(yán)格占優(yōu)納什均衡。給定對(duì)手選擇的情況下，每個(gè)人都通過選擇嚴(yán)占優(yōu)的策略而組成的納什均衡。 ⑦事實(shí)上，這與Selten提出的顫抖手均衡概念具有相似性，所謂顫抖手均衡是指一個(gè)戰(zhàn)略組合，只有當(dāng)它在允許所有參與人都可能犯錯(cuò)誤時(shí)仍是每一個(gè)參與人的最優(yōu)戰(zhàn)略的組合時(shí)才是一個(gè)均衡，其嚴(yán)格定義可以參閱張維迎的《博弈論與信息經(jīng)濟(jì)學(xué)》。其中的顫抖或者犯錯(cuò)誤與進(jìn)化穩(wěn)定策略中的突變因素有差不多的含義，但它們之間存在本質(zhì)上的不同。 ⑧由模仿者動(dòng)態(tài)方程進(jìn)行支付變換，可得。 ⑨這一點(diǎn)我們可以從博弈論一個(gè)著名的捐款----回贈(zèng)實(shí)驗(yàn)中看出，募捐者要求每一個(gè)人都自愿捐款，最終募捐者以3倍于捐款總額的錢平均分派給每個(gè)捐款者，為了使得博弈能夠分析下去，募捐者要求自愿捐款時(shí)每個(gè)人都不得與其他人討論，否則該博弈就無法進(jìn)行下去，因此，本文稱博弈論中的互動(dòng)是一種沉默互動(dòng)而非社會(huì)互動(dòng)。這個(gè)實(shí)驗(yàn)充分體現(xiàn)了古典經(jīng)濟(jì)學(xué)及博弈論研究對(duì)象上的一致性，即它們都是研究單個(gè)個(gè)體的行為而排除了人的一個(gè)重要特征----社會(huì)性。參考文獻(xiàn)

[1] 王則柯（1999）：《博弈論平話》，中國經(jīng)濟(jì)出版社。

[2] 張維迎（1999）：《博弈論與信息經(jīng)濟(jì)學(xué)》，上海三聯(lián)出版社。

[3] 張良橋，馮從文（2001）：《進(jìn)化穩(wěn)定均衡與納什均衡：兼談進(jìn)化博弈理論的發(fā)展》，《經(jīng)濟(jì)科學(xué)》，3，103-111。

[4] 張良橋（2001）：《理性與有限理性：論經(jīng)典博弈理論與進(jìn)化博弈理論之關(guān)系》，《世界經(jīng)濟(jì)》，8，74-78。

[5] 張良橋（2003）：《論進(jìn)化穩(wěn)定策略》，《經(jīng)濟(jì)評(píng)論》，2，70-74。

[6] 張良橋，郭立國（2003）：《論模仿者動(dòng)態(tài)》，《中山大學(xué)學(xué)報(bào)自然科學(xué)版》，3。

[7] 楊小凱（2000）：《新興古典經(jīng)濟(jì)學(xué)和超邊際分析》，中國人民大學(xué)出版社。

[8] 青木昌彥, 奧野正寬(1999):《經(jīng)濟(jì)體制的比較制度分析》, 魏加寧等譯, 北京: 中國發(fā)展出版社.

[9] Allais, M., (1952): The foundations of a positive theory of choice involving risk and a criticism of the postulates and axioms of the American school, in expected utility hypotheses and the Allais Paradox, edited by M. Allais and O. Hagen, Dordrecht: Teidel.

[10] Börgers, T. and R. Sarin (1997): Learning Through Reinforcement and Replicator Dynamics, Journal of Economic Theory, 77, 1-14.

[11] Börgers, T. and R. Sarin, (1995): “Learning through Reinforcement and Replicator dynamics”, Mimeo University College London.

[12] Conlisk, J.(1980): Costly Optimizers Versus Cheap Imitators, Journal of Economic Behavior and Organization, 1980, (1): 275-293.

[13] Cowen , Tyler, and Randall Kroszner, The Development of the New Monetary Economics, Journal of Political Economy , 1987, (95): 567-590.

[14] Crawford, Vincent, P. (1989): “An Evolutionary explanation of Van Huyck. Battalio, and Beil’s Experimental Results on Coordination,”Manuscript, Department of Economics, University of California, San Diego.

[15] Daniel Kahneman and Amos Tversky (1979):Prospect theory: An analysis of decision under risk, Econometrica, 1979, (47), 263-291.

[16] Foster, D., and P. Young.(1990) Stochastic Evolutionary Game Dynamics, Theoretical Population biology, (38): 219-232.

[17] Fudenberg, D. and C. Harris (1992): Evolutionary Dynamics with Aggregate Shocks, Journal of Economic Theory, 1992, (57): 420-441.

[18] Jones, R.. The Origin and Development of Media of Exchange, Journal of Political Economy, 1976, (84): 757-775.

[19] Kahneman, D. and A. Tversky(1974) : judgment under uncertainty: heuristics and biases, Science, 185, 1124-1131.

[20] Kahneman, D. and A. Tversky(1979) : Prospect theory: An analysis of decision under risk, Econometrica, 47, 263-291.

[21] Kandori, M. G. Mailath, and R. Rob (1993): Learning, Mutation, and Long-run Equilibria in Games, Econometrica, 61, 29-56.

[22] Kreps. D., and Wilson,(1982): Signaling Games and Stable equilibrium, Econometrica, 50, 863-894.

[23] Lewontin, R. C. (1960): Evolution and the Theory of Games. Journal of Theoretical. Biology. 1, 382-403.

[24] Maynard Smith, J. and G. R. Price.(1973): “The Logic of Animal Conflicts”, Nature, , (246): 15-18.

[25] Nash, Jr. John F.(1950), The Bargaining Problem. Econometrica.

[26] Nash, Jr. John F.(1951), Noncooperative games, Annals Mathematics 54.

[27] Schelling, T. (1960): The Strategy of Conflict, Harvard University Press, Cambridge, MA.

[28] Schelling, Thomas(1960), Strategy of Conflict, Harvard U. Press.

[29] Selten, P. (1978): The chain store paradox,Theory and decision 9, 127-159.

[30] Selten, R. (1980): A Note on Evolutionarily Stable Strategies in Asymmetric Games Conflicts, Journal of Theoretical. Biology. 84, 93-101.

[31] Selten, R.(1975), Reexamination of the Perfectness Concept for Equilibrium Points in Extensive Games, International Journal of Game Theory, 4, 25-55.

[32] Selten, R., (1965): Spieltheoretische Behandlung Eines Pligopolmodells mit Nachfagetragheit, Zeitschrift fur die gesamte Staatswissenschaft, 12, 301-324.

[33] Simon, H. A., (1955): A behavioral model of rational choice, Quarterly Journal of Economics, 69,99-118.

[34] Skyrms, Brian (1986): Deliberational Equilibria, Topoi, 5, 59-67.

[35] Smith, V. L. (1979): Indirect revelation of the demand for public goods: An overview and critique, Scottish Journal of political economy, 25, 183-189.

[36] Swinkels, J. (1993): Adjustment Dynamics and rational Play in Games, Games and Economic Behavior, .5, 455-484.

[37] Taylor, P. D. and L. B. Jonker.(1973): Evolutionarily Stable Strategy and Game Dynamics, Mathematical Social. Science (40): 145-156.

[38] Tversky, A. and D. kahneman(1992): Advances in prospect theory: cumulative representation under uncertainty, Journal of risk and uncertainty, 5, 297-323.

[39] Von Neumann, John and Oskar Morgenstern(1944), Theory of Games and Economic Behavior, Princeton U Press.

[40] Weitzman, Martin(1984): The Share Economy.Cambridge, Harvard University Press.

進(jìn)化博弈理論范文第2篇

關(guān)鍵詞：知識(shí)共享進(jìn)化博弈蛙鳴博弈

企業(yè)內(nèi)部的知識(shí)有多種形式，如個(gè)人經(jīng)驗(yàn)、產(chǎn)品信息、客戶信息、工作流程、各種文檔。企業(yè)知識(shí)共享，就是員工互相交流彼此的知識(shí)，使知識(shí)由個(gè)人的經(jīng)驗(yàn)擴(kuò)散到企業(yè)的層面，從而提高企業(yè)的工作效率。知識(shí)共享在企業(yè)中產(chǎn)生的是一種知識(shí)放大效應(yīng)，它通過知識(shí)管理等手段，使企業(yè)的知識(shí)資源不斷得到整合與利用，從根本上推動(dòng)企業(yè)競(jìng)爭(zhēng)能力的提升。

進(jìn)化博弈理論與企業(yè)知識(shí)共享機(jī)制

對(duì)于企業(yè)知識(shí)共享機(jī)制問題，可以用博弈理論進(jìn)行研究。目前，國內(nèi)一些研究已對(duì)此做出了初步的探索，如用“囚徒困境”模型解釋不愿知識(shí)共享的問題，但是這些分析研究均是應(yīng)用經(jīng)典博弈理論進(jìn)行分析。經(jīng)典博弈理論從博弈方的完全理性出發(fā)，在信息充分的前提下找到了博弈的均衡解。然而對(duì)現(xiàn)實(shí)中的決策行為者來說，完全理性是很難滿足的高要求。當(dāng)社會(huì)經(jīng)濟(jì)環(huán)境和決策問題較復(fù)雜時(shí)，人的理性局限是非常明顯的。因此要保證博弈分析的理論和應(yīng)用價(jià)值，必須對(duì)有理性局限的博弈方之間的博弈進(jìn)行分析，進(jìn)化博弈論從有限理性的個(gè)體出發(fā)，以群體行為為研究對(duì)象，合理解釋了生物行為的進(jìn)化過程。生物進(jìn)化中生物性狀和行為特征動(dòng)態(tài)變化過程的“復(fù)制動(dòng)態(tài)”，在有限理性博弈分析中正是模擬有限理性博弈方學(xué)習(xí)博弈和調(diào)整策略過程最主要的動(dòng)態(tài)機(jī)制之一，而生物進(jìn)化理論中具有在動(dòng)態(tài)調(diào)整過程中達(dá)到，在受到少量干擾后仍能“恢復(fù)”的穩(wěn)健性均衡概念“進(jìn)化穩(wěn)定策略”，正是有限理性博弈分析最核心的均衡概念，或者說動(dòng)態(tài)策略穩(wěn)定性概念。

一般來說，在企業(yè)內(nèi)部的知識(shí)共享行為上，行為主體的理性層次較低。這主要是因?yàn)檫@類決策是群體決策，而行為是企業(yè)行為。此時(shí)行為主體意識(shí)到錯(cuò)誤和調(diào)整策略的能力較差，其行為變化更多的是一種緩慢進(jìn)化而不是快速學(xué)習(xí)與調(diào)整機(jī)制。因此可以用生物進(jìn)化的復(fù)制動(dòng)態(tài)機(jī)制模擬，即進(jìn)化穩(wěn)定策略（ESS）。在重復(fù)博弈中，具備有限信息的個(gè)體根據(jù)其既得利益不斷地在邊際上對(duì)其策略進(jìn)行調(diào)整以追求自身利益的改善，不斷地用較滿足的事態(tài)代替較不滿足的事態(tài)，最終達(dá)到一種動(dòng)態(tài)平衡。在這種平衡中，任何一個(gè)個(gè)體不再愿意單方面改變其策略，這種平衡狀態(tài)下的策略稱為進(jìn)化穩(wěn)定策略。因此，利用進(jìn)化博弈的方法分析企業(yè)知識(shí)共享機(jī)制更加接近于現(xiàn)實(shí)情況，也更有實(shí)際意義。

理論基礎(chǔ)和模型構(gòu)建

（一）理論基礎(chǔ)

假定兩類行為主體均采用純策略，令S是行為主體所有純策略的集合，(S)代表所有在t階段采用純策略s∈S的行為主體集合，定義狀態(tài)變量θt(S)表示在t階段采用純策略 s的行為主體的群體比例向量，于是有：

根據(jù)前面的假設(shè)，有限理性的行為主體有一定的統(tǒng)計(jì)分析能力和對(duì)不同策略收益的事后判斷能力，收益較差的行為人遲早會(huì)發(fā)現(xiàn)這種差異，并開始學(xué)習(xí)模仿另一類行為人，因此行為人的比例是隨時(shí)間而變化的，是時(shí)間的函數(shù)。上述比例隨時(shí)間變化的速度取決于行為主體的學(xué)習(xí)模仿速度。學(xué)習(xí)模仿速度取決于兩個(gè)因素：一是模仿對(duì)象數(shù)量的大?。捎孟鄳?yīng)類型的行為人的比例表示），因?yàn)檫@關(guān)系到觀察和模仿的難易程度；二是模仿對(duì)象的成功程度（可用模仿對(duì)象的策略收益超過平均收益的幅度表示），因?yàn)檫@關(guān)系到判斷差異的難易程度和對(duì)模仿激勵(lì)的大小。于是，有以下連續(xù)時(shí)間的動(dòng)態(tài)模型：

這是一個(gè)模仿者復(fù)制動(dòng)態(tài)方程，在本模型中，有如下的定理：

定理(Fudenberrg,1998)模仿者動(dòng)態(tài)的一個(gè)穩(wěn)定穩(wěn)態(tài)是一個(gè)納什均衡，更一般地說，具有源于內(nèi)部路徑限制的任何穩(wěn)態(tài)都是納什均衡。反之，如果對(duì)于一個(gè)非納什均衡，存在一個(gè)σ＞0，所有內(nèi)部路徑最終將從該穩(wěn)態(tài)的σ鄰域內(nèi)被清除。

（二）模型構(gòu)建

假設(shè)與前提條件。

1.博弈方：假設(shè)該博弈方都是有限理性，且劃分為兩類，即同事群體1和同事群體2。分析的框架是反復(fù)在兩個(gè)群體中各隨機(jī)抽取一個(gè)成員配對(duì)進(jìn)行博弈。博弈方的學(xué)習(xí)和策略模仿局限在他們所在的群體內(nèi)部。這樣我們就可以分別對(duì)兩類群體進(jìn)行復(fù)制動(dòng)態(tài)和進(jìn)化穩(wěn)定策略分析。

2.行為策略。博弈方都有兩種行為方式：共享；不共享。如果他們的知識(shí)都不愿共享，相互封鎖，那么個(gè)人的知識(shí)就會(huì)出現(xiàn)低水平重復(fù)，使他們各自獲得的利益不多，假設(shè)為0收益；如果有一個(gè)企業(yè)成員打破常規(guī)，進(jìn)行知識(shí)共享，那么他就獲得m(0.5＜m＜1)發(fā)展機(jī)會(huì),但共享者是有學(xué)習(xí)成本z的;如果他們的知識(shí)都實(shí)行共享,就會(huì)獲得更多的發(fā)展機(jī)會(huì)p(m＜p＜1),此時(shí)各有學(xué)習(xí)成本z。

3.行為策略的采取比例。博弈方中可能采取“共享”與“不共享”的比例分別為x、1－x。

4.得益矩陣。用w表示參與人的收益。隨機(jī)博弈中雙方的得益矩陣如圖1所示。

企業(yè)知識(shí)共享行為的博弈分析

由得益矩陣可知，該博弈的納什均衡取決于其中P、m、z的具體水平或者說相對(duì)水平。根據(jù)上述假設(shè)，按照博弈的一般公式：

博弈方1中，“共享”類型參與人的收益為：

根據(jù)進(jìn)化穩(wěn)定策略的性質(zhì)，一個(gè)穩(wěn)定態(tài)必須對(duì)微小擾動(dòng)具有穩(wěn)健性才能稱為進(jìn)化穩(wěn)定策略。也就是說，作為進(jìn)化穩(wěn)定策略的點(diǎn)x*，除了本身必須是均衡狀態(tài)外，還必須具有這樣的性質(zhì)，即如果某些博弈方由于偶然的錯(cuò)誤偏離了它們，復(fù)制動(dòng)態(tài)還會(huì)使x恢復(fù)到x*。在數(shù)學(xué)上，相當(dāng)于要求當(dāng)干擾使x出現(xiàn)低于x*時(shí)，必須大于0，當(dāng)干擾使x出現(xiàn)高于x*時(shí)，必須小于0。這就是微分方程的“穩(wěn)定性定理”。

當(dāng)0＜(m-x)/(1-P)＜1時(shí)，上述進(jìn)化過程復(fù)制動(dòng)態(tài)的三個(gè)穩(wěn)定狀態(tài)都是合理的，因?yàn)槎继幱?≤x≤1的有效范圍。這時(shí)候復(fù)制動(dòng)態(tài)方程的相位如圖2所示。

由圖2可以看出，x*=(m-z)/(1-P)是進(jìn)化穩(wěn)定策略。這意味著一旦企業(yè)內(nèi)少數(shù)成員開始共享，那么隨著獲得利益的機(jī)會(huì)增多，就有更多的成員進(jìn)行仿效，開始共享，直到組織中成員共享的數(shù)量比重為x*=(m-z)/(1-P)。如果超出這個(gè)比重，甚至所有的成員都進(jìn)行共享，那么就會(huì)出現(xiàn)有些成員不愿貢獻(xiàn)自己的知識(shí)讓他人共享，反而利用其他成員創(chuàng)造環(huán)境氛圍，從中牟利，出現(xiàn)“搭便車”的現(xiàn)象，最終仍然回到了x*=(m-z)/(1-P)的均衡比例。

隨著支付矩陣的不同取值，x*可能與其它的兩全解相等或者不存在第三個(gè)解，博弈退化為只有兩個(gè)穩(wěn)定態(tài)。

當(dāng)(m-z)/(1-P)＜0，也就是m由圖3不難看出，這時(shí)候復(fù)制動(dòng)態(tài)的唯一穩(wěn)定的均衡點(diǎn)為x*=0，也就是說企業(yè)所有的成員都是不愿共享的。只要不是一開始所有成員都是共享型的極端情況，最終都會(huì)在長期的動(dòng)態(tài)變化中趨于不共享。即使是所有成員都共享，只要在組織內(nèi)部有不共享的人出現(xiàn)，就會(huì)破壞共享學(xué)習(xí)的氛圍，破壞整個(gè)企業(yè)的現(xiàn)狀，企業(yè)去管理就會(huì)增加成本，這樣企業(yè)反而不去管，最終會(huì)趨向所有成員都不愿共享的均衡。

當(dāng)(m-z)/(1-P)＞1,也就是m-z＞1-P的情況。此時(shí)，復(fù)制動(dòng)態(tài)的三個(gè)不動(dòng)點(diǎn)中也只有x*=0和x*=1兩點(diǎn)符合要求。復(fù)制動(dòng)態(tài)方程的相位如圖4所示。

由圖4可以看出，現(xiàn)在的進(jìn)化穩(wěn)定策略是x*=1，也就是所有的成員都共享，整個(gè)企業(yè)組織就是學(xué)習(xí)共享型的。在社會(huì)環(huán)境和成員的素質(zhì)都很好以及從學(xué)習(xí)中獲得的收益遠(yuǎn)遠(yuǎn)大于成本代價(jià)時(shí)，這樣的條件下是合理的。

通過對(duì)以上三種情況的分析，我們可以知道，企業(yè)知識(shí)共享機(jī)制是個(gè)長期的問題，無法以短期來解決。企業(yè)中的成員不是每個(gè)都是知識(shí)共享型的，而是存在著“搭便車”的現(xiàn)象，在有限理性的條件下，不是所有的企業(yè)都是知識(shí)共享型的，不是所有的企業(yè)都能做到長期性的知識(shí)共享。這也可以解釋我國有很多的企業(yè)在實(shí)施知識(shí)管理，但真正取得好的結(jié)果的卻并不多。

企業(yè)知識(shí)共享的行為演化機(jī)制

通過進(jìn)化博弈的參數(shù)分析，可以看出企業(yè)知識(shí)共享機(jī)制的進(jìn)化博弈包括如下幾種可能的行為演化機(jī)制。

企業(yè)知識(shí)共享機(jī)制的選擇機(jī)制，即在博弈中能夠獲得較高收益的策略，在以后演化過程中被更多的參與者選擇。通過進(jìn)化博弈的得益矩陣分析，使企業(yè)知識(shí)共享機(jī)制容易實(shí)現(xiàn)較高效率進(jìn)化策略均衡。只要調(diào)整好P、m和z的大小，就可以保證較高效率的企業(yè)知識(shí)共享機(jī)制順利進(jìn)行。具體來說是要求用更低的成本z，創(chuàng)造更多的發(fā)展機(jī)會(huì)P和m，企業(yè)就會(huì)促使更多的工作人員去實(shí)施知識(shí)共享。為此企業(yè)需要加大內(nèi)部不共享行為的機(jī)會(huì)成本，務(wù)必對(duì)企業(yè)內(nèi)部成員的知識(shí)自私行為進(jìn)行懲罰和壓制，以提高這種變異的門檻，使這種不愿知識(shí)共享的行為成為一種風(fēng)險(xiǎn)很大收益很小的活動(dòng)，從而壓縮不實(shí)現(xiàn)知識(shí)共享者的生存空間，避免企業(yè)內(nèi)部的知識(shí)共享機(jī)制向不利的方向演進(jìn)。

企業(yè)知識(shí)共享機(jī)制的放棄機(jī)制，即在博弈中獲得較低收益的策略，在以后演化過程中被更多的參與者放棄。在進(jìn)化博弈分析的第二種情況下，由于m企業(yè)知識(shí)共享機(jī)制的突變機(jī)制，即參與者以隨機(jī)（無目的性）的方式選擇策略，其中包括突變策略，參與者將選擇獲得較高收益的策略。通過進(jìn)化博弈的得益矩陣分析，使p-z 變大或1-m 變小，促使(p-z)-(1-m)增大，保證企業(yè)較易地實(shí)現(xiàn)較高相互支持、相互協(xié)作、相互溝通，鼓勵(lì)和促進(jìn)企業(yè)內(nèi)部的知識(shí)共享行為，褒揚(yáng)部門、同事的團(tuán)隊(duì)精神，把知識(shí)共享變成一種自動(dòng)機(jī)制，從而使企業(yè)內(nèi)部采取知識(shí)共享行為者獲得較高的收益，這樣使企業(yè)內(nèi)部采取少數(shù)不共享行為的人所占的比例越來越小，提高企業(yè)知識(shí)共享機(jī)制向理想方向進(jìn)化的可能性和比例，從而促進(jìn)企業(yè)知識(shí)共享機(jī)制向最理想的方向演進(jìn)。

參考文獻(xiàn)：

1.謝識(shí)予.有限理性條件下的進(jìn)化博弈理論.上海財(cái)經(jīng)大學(xué)學(xué)報(bào)，2001（5）

進(jìn)化博弈理論范文第3篇

關(guān)鍵詞：班級(jí)安全文化；進(jìn)化博弈；有限理性

一、問題的提出

學(xué)校是培育人才的搖籃，班級(jí)是學(xué)校的基本構(gòu)成單元。班級(jí)安全文化是指班級(jí)在教學(xué)、科研以及生活等領(lǐng)域所創(chuàng)造的理念、形象、設(shè)施與行為等的總和，班級(jí)安全文化建設(shè)是學(xué)校安全文化建設(shè)的基本立足點(diǎn)。學(xué)生是班級(jí)的主體，班級(jí)安全文化是全班學(xué)生共建共享的，一個(gè)班級(jí)的安全文化氛圍濃厚只是一枝獨(dú)秀，只有當(dāng)學(xué)校所有班級(jí)的安全文化不斷優(yōu)化，才能有助于學(xué)校安全文化的提升，為學(xué)生的學(xué)習(xí)和生活提供安全保障。徹底否定傳統(tǒng)博弈論賴以成立的基礎(chǔ)即“理性人假設(shè)”的進(jìn)化博弈理論從具有有限理性的“社會(huì)人”出發(fā)，分析參與人的行為從而建立起嶄新的分析框架。自從1973年生態(tài)學(xué)家史密斯和普賴斯引進(jìn)進(jìn)化穩(wěn)定策略，TaylorandJonker于1978年提出模仿者動(dòng)態(tài)概念后，進(jìn)化博弈論被廣泛應(yīng)用于各學(xué)科。經(jīng)典的博弈論建立在完全理性的假設(shè)基礎(chǔ)上，在解釋現(xiàn)實(shí)行為方面具有明顯不足。而進(jìn)化博弈論用于解釋群體之間的行為是如何相互影響的動(dòng)態(tài)變化過程，因而適用于班級(jí)安全文化建設(shè)的解釋性分析及探索性研究。

二、有限理性條件下學(xué)生之間的安全文化建設(shè)進(jìn)化博弈分析

學(xué)生作為行為主體，具有有限理性，在班級(jí)安全文化建設(shè)中的策略選擇也是可模仿學(xué)習(xí)的。運(yùn)用進(jìn)化博弈原理對(duì)具有有限理性的學(xué)生間的相互行為及班級(jí)安全文化建設(shè)進(jìn)行分析，頗具理論及現(xiàn)實(shí)意義。

（一）基本假設(shè)

學(xué)生之間是無差異的，由學(xué)生組成的群體成員間進(jìn)行了隨機(jī)配對(duì)博弈，形成兩人對(duì)稱博弈，學(xué)生的策略選擇受其他學(xué)生的策略影響，策略的調(diào)整是一個(gè)緩慢的動(dòng)態(tài)調(diào)整過程。

（二）模型構(gòu)建

第一，博弈參與者。根據(jù)進(jìn)化博弈原理，將隨機(jī)配對(duì)的兩名學(xué)生分別記作“學(xué)生1”和“學(xué)生2”。在班級(jí)安全文化建設(shè)中，學(xué)生有認(rèn)真參與和敷衍了事兩種選擇。第二，博弈方的行為策略。在班級(jí)安全文化建設(shè)中，學(xué)生采取的博弈策略有兩種：一是積極主動(dòng)，另一種是敷衍應(yīng)付，分別記作“主動(dòng)”和“敷衍”。第三，博弈得益。通過開展班級(jí)安全文化建設(shè)，假設(shè)兩名學(xué)生都能夠認(rèn)真學(xué)習(xí)安全知識(shí)和技能，可以在很大程度上避免和防范常見校園安全事故，即使遇到安全事件也能盡其所能成功應(yīng)對(duì)的概率為1，從而獲得一定的效用，記作V。假設(shè)兩名學(xué)生中，一名學(xué)生在班級(jí)安全文化建設(shè)中采取“主動(dòng)”策略，安全素質(zhì)得以提高，從而獲得了安全文化建設(shè)效用，另一名學(xué)生選擇“敷衍”策略。嚴(yán)格來講，學(xué)校安全事故的發(fā)生具有偶然性，即兩名學(xué)生在防范和應(yīng)對(duì)校園安全事故時(shí)也有一定的成功概率，分別記作R和r。因此，采取“主動(dòng)”策略的學(xué)生獲得的效用水平為V*R，采取“敷衍”策略的學(xué)生獲得的效用水平為r*V，且r≤R，0≤r≤1，0≤R≤1。假設(shè)在班級(jí)安全文化建設(shè)中，兩名學(xué)生都采取“敷衍”策略，則獲得的效用均為M，可正可負(fù)，在學(xué)校安全形勢(shì)比較穩(wěn)定的條件下，學(xué)生即使不積極主動(dòng)參與班級(jí)安全文化建設(shè)，也不會(huì)有任何損失，此時(shí)M為正值。相反，校園安全事件的發(fā)生會(huì)造成一定的人身財(cái)產(chǎn)損失以及不良聲譽(yù)，此時(shí)M為負(fù)值。

（三）隨機(jī)配對(duì)的兩名學(xué)生

對(duì)稱博弈模型的納什均衡求解根據(jù)劃線法對(duì)博弈模型進(jìn)行分析，班級(jí)安全文化建設(shè)中“主動(dòng)”的學(xué)生都能獲得較高的效用，即V*R≥M。根據(jù)班級(jí)安全文化建設(shè)實(shí)際，運(yùn)用劃線法求解得：當(dāng)r≤R，V*R＞M時(shí)，“主動(dòng)”是每名學(xué)生在任何情況下都不會(huì)改變的占優(yōu)策略，因此（認(rèn)真學(xué)習(xí)，認(rèn)真學(xué)習(xí)）成為隨機(jī)配對(duì)的兩名學(xué)生對(duì)稱博弈模型的唯一納什均衡。當(dāng)r≥R，V*R＜M，存在兩個(gè)納什均衡，即兩名學(xué)生會(huì)相互影響，（認(rèn)真學(xué)習(xí)，認(rèn)真學(xué)習(xí)）和（敷衍學(xué)習(xí)，敷衍學(xué)習(xí)），學(xué)生以一定的概率選擇參與班級(jí)安全文化建設(shè)策略，要么都“主動(dòng)”，要么都“敷衍”。當(dāng)r≥R，認(rèn)真學(xué)習(xí)安全知識(shí)和技能，即“主動(dòng)”參與班級(jí)安全文化建設(shè)的學(xué)生仍然不幸遇到安全事故，當(dāng)事故具有偶然性時(shí)，“主動(dòng)”參與班級(jí)安全文化建設(shè)的學(xué)生會(huì)改變策略，轉(zhuǎn)為“敷衍”參與班級(jí)安全文化建設(shè)。

（四）有限理性條件下學(xué)生之間的安全文化建設(shè)進(jìn)化博弈分析

當(dāng)進(jìn)行班級(jí)安全文化建設(shè)，對(duì)學(xué)生開展安全教育和安全管理時(shí)，假定以y（t）表示選擇純策略———“主動(dòng)”參與班級(jí)安全文化建設(shè)策略的學(xué)生人數(shù)在群體中所占的比重，則選擇“敷衍”策略的學(xué)生人數(shù)所占比重為1-y（t）。

三、結(jié)論及建議

通過構(gòu)建學(xué)生參與班級(jí)安全文化建設(shè)的進(jìn)化博弈模型并進(jìn)行分析求解，得到不同條件下兩種不同的進(jìn)化穩(wěn)定策略，從而得出學(xué)生在參與班級(jí)安全文化建設(shè)過程中，受其他同學(xué)的影響非常明顯，要么都“主動(dòng)”，要么都“敷衍”。安全文化建設(shè)是一種居安思危、預(yù)防為主、防患于未然的系統(tǒng)工程，如同溫水煮蛙實(shí)驗(yàn)。從學(xué)生參與班級(jí)安全文化建設(shè)的演化過程看，要改變目前多數(shù)學(xué)生都存在“敷衍”的現(xiàn)狀，應(yīng)注重對(duì)學(xué)生學(xué)習(xí)安全知識(shí)和技能的引導(dǎo)，強(qiáng)化安全防范意識(shí)，提高“主動(dòng)”參與班級(jí)安全文化建設(shè)的效用。采取多種形式開展班級(jí)安全文化建設(shè)，對(duì)學(xué)生開展人性化的安全管理尤其是參與式管理，例如通過應(yīng)急演練、情境模擬等方式吸引學(xué)生參與，激發(fā)學(xué)生的學(xué)習(xí)力，提高學(xué)生安全素質(zhì)，提升班級(jí)安全文化建設(shè)實(shí)效。

參考文獻(xiàn)：

[1]石連海學(xué)校安全問題分析與對(duì)策[J].當(dāng)代教育科學(xué),2011,(16):27-30.

進(jìn)化博弈理論范文第4篇

影子銀行是游離在傳統(tǒng)銀行體系之外的金融體系。它能夠促進(jìn)信貸市場(chǎng)進(jìn)行有效的資金配置，刺激經(jīng)濟(jì)發(fā)展。然后影子銀行不受監(jiān)管，難以把控，從而導(dǎo)致其產(chǎn)生負(fù)面影響。2008年美國的次貸危機(jī)國內(nèi)外學(xué)者幾乎將內(nèi)因歸結(jié)于影子銀行。但是，在如今互聯(lián)網(wǎng)金融發(fā)展的背景下，想要完全消除影子銀行是不可能的，引導(dǎo)影子銀行朝著積極正面的方向發(fā)展才是正確之路。若是影子銀行與傳統(tǒng)銀行能夠?qū)崿F(xiàn)合作共贏，那將成功解決對(duì)影子銀行的監(jiān)管問題。

二、相關(guān)概念闡述

（一）影子銀行

影子銀行一詞來源于美國次貸危機(jī)爆發(fā)后，首次被Paul Mcculleys提出的。后來FBS（2011）正式指出，影子銀行是傳統(tǒng)銀行體系之外所涉及信用融資活動(dòng)的機(jī)構(gòu)。這成為了國內(nèi)外學(xué)者接受度最大的界定。

我國對(duì)影子銀行的界定一直與體制外金融、民間金融、民營金融、地下金融等概念混用的現(xiàn)象。但是大家對(duì)影子銀行的基本認(rèn)知都包括未受國家法律規(guī)范，游離于監(jiān)管當(dāng)局監(jiān)管之外等等。有的學(xué)者還指出，除了金融機(jī)構(gòu)外，還應(yīng)包含金融創(chuàng)新產(chǎn)品、服務(wù)以及產(chǎn)品和服務(wù)適用的金融市場(chǎng)。不過由于本文討論的是兩個(gè)主體間的合作關(guān)系，故而本文所指的影子銀行即是游離于傳統(tǒng)銀行管理體系之外的非銀行金融機(jī)構(gòu)。

（二）有限理性

由于現(xiàn)實(shí)生活中許多現(xiàn)象無法用傳統(tǒng)金融學(xué)來解釋，故而后起之秀――行為金融學(xué)因合理解釋了這些金融現(xiàn)象被廣大學(xué)者所接受，行為金融學(xué)與傳統(tǒng)金融理論最大的不同之處就在于，行為金融學(xué)認(rèn)為是投資者不是完全理性人，而是有限理性人。他們總是會(huì)受到心理、環(huán)境、他人的影響而作出決定。投資行為不全是根據(jù)利益最大化原則，還包括安全最大化等等。

（三）進(jìn)化博弈模型

進(jìn)化博弈論博弈是一個(gè)動(dòng)態(tài)的博弈過程，是有限理性博弈雙方群體在一定的前提下對(duì)當(dāng)前局面進(jìn)行選擇，在一個(gè)群體中得益較差的博弈方遲早會(huì)發(fā)現(xiàn)這種差異，并開始學(xué)習(xí)模仿得益較高的博弈方，后經(jīng)過自我體驗(yàn)以及學(xué)習(xí)其他人的選擇，而不斷改變自己的策略。最終市場(chǎng)會(huì)根據(jù)“優(yōu)勝劣汰”的自然規(guī)律，形成一個(gè)穩(wěn)定的策略。這種類似于生物進(jìn)化論的動(dòng)態(tài)博弈方式被稱為進(jìn)化博弈論。最終形成的策略成為進(jìn)化穩(wěn)定策略（ESS）。

本文基于進(jìn)化博弈論的研究方法，對(duì)傳統(tǒng)銀行和影子銀行二者的合作進(jìn)行預(yù)測(cè)，并判斷何時(shí)能夠達(dá)到二者自然選擇“合作”策略。基于進(jìn)化博弈論的基本理論，我們假設(shè)傳統(tǒng)銀行和影子銀行都是有限的理性人，對(duì)兩個(gè)博弈方不再細(xì)分其內(nèi)部的個(gè)體，并且假設(shè)傳統(tǒng)銀行與影子銀行的最大的區(qū)分是是否受監(jiān)管當(dāng)局監(jiān)管。

三、影子銀行和傳統(tǒng)銀行合作問題的進(jìn)化博弈分析

我們粗略地假定我國金融市場(chǎng)中有傳統(tǒng)銀行機(jī)構(gòu)和影子銀行兩類機(jī)構(gòu)，而雙方面臨的選擇只有“合作”和“不合作”兩種策略，自我的選擇和其他群體的選擇都將影響自身與他人的收益。他們都將依據(jù)這種相對(duì)收益率不斷地調(diào)整自己的策略。兩個(gè)群體不斷地博弈交流，最終通過“物競(jìng)天擇、適者生存”的進(jìn)化法則自發(fā)進(jìn)化到具有穩(wěn)定性的均衡狀態(tài)――進(jìn)化穩(wěn)定策略（ESS）。

1.博弈雙方的得益

我們先假設(shè)傳統(tǒng)銀行和影子銀行在非合作狀態(tài)下的收益分別為Rc和RY。我們假設(shè)，當(dāng)二者采取合作時(shí)，由于渠道拓寬，客戶量增大以及銷售效率提升，雙方的收益將會(huì)增加πc和πY，此時(shí)雙方存在一個(gè)合作的成本分別Cc和CY，且我們假定πc大于Cc，πY大于CY。根據(jù)上述假設(shè)，可以得到如表1所示的矩陣圖。我們發(fā)現(xiàn)，如果傳統(tǒng)銀行與影子銀行都是理性“經(jīng)濟(jì)人”時(shí)，表1的結(jié)果必然存在一個(gè)純戰(zhàn)略的納什均衡（合作、合作）；但是如果我們把前提假設(shè)放寬至“有限理性”，我們發(fā)展最后的進(jìn)化穩(wěn)定策略并非都是（合作，合作）

2.傳統(tǒng)銀行和影子銀行的期望得益及其動(dòng)態(tài)微分方程

假定當(dāng)t時(shí)，x是傳統(tǒng)銀行群體中選擇合作策略的銀行占傳統(tǒng)銀行的且X∈（0，1），則選擇不合作策略銀行比例為1-x；同理，在影子銀行群體中，y是選擇合作策略的銀行占影子銀行的比例，且Y∈（0，1），則選擇不合作策略的銀行比例為1-y。

在傳統(tǒng)銀行群體中采取“合作”和“不合作”策略兩類博弈方的期望得益分別為μCHZ和μCNH，群體平均期望得益為μC：

3、基于傳統(tǒng)銀行群體和影子銀行復(fù)制動(dòng)態(tài)微分方程的分析

從（7）式可知，傳統(tǒng)銀行群體中選擇“合作”策略博弈方的比例x的變化率與該類型博弈方的超額期望得益呈正相關(guān)關(guān)系，也與該類型博弈方的比例x呈正相關(guān)。

當(dāng)y=時(shí)，，傳統(tǒng)銀行中選擇 “合作 ”策略的銀行的比例的變化率為0，即采取“合作”策略的博弈方比例不會(huì)發(fā)生變化，此時(shí)傳統(tǒng)銀行群體處于穩(wěn)定狀態(tài)。當(dāng)，即采取“合作”策略的銀行獲得超額收益，那么，選擇“不合作”策略的銀行將逐漸發(fā)現(xiàn)并調(diào)整策略的策，選擇“合作”策略，選擇“合作”的比例x會(huì)向趨近1，此時(shí)是該群體復(fù)制動(dòng)態(tài)下的一個(gè)ESS。當(dāng)，即采取“合作”策略的博弈方的期望得益小于群體平均得益。那么，選擇“合作”策略的銀行也會(huì)逐漸選擇“不合作”策略，采取“合作”策略的博弈方數(shù)量會(huì)逐漸減少，直到X=0 ，此時(shí)是該群體復(fù)制動(dòng)態(tài)下的另一個(gè)ESS。下圖1給出了上述三種情況的動(dòng)態(tài)變化的相位圖和穩(wěn)定狀態(tài)。

同理可知影子銀行群里的情況。當(dāng)，在影子銀行里選擇“合作”策略銀行比例y的變化率為0 ，即y不會(huì)發(fā)生變化，此時(shí)影子銀行群體處于穩(wěn)定狀態(tài)。當(dāng)0，即選擇“合作”的影子能夠獲得超額收益，此時(shí)采取“不合作”策略的銀行將會(huì)調(diào)整策略，最終選擇“合作”，之后y會(huì)向趨近1，當(dāng)y=1時(shí)，該群體處于進(jìn)化穩(wěn)定策略。當(dāng)，表示，選擇“合作”的影子銀行不能獲得超額收益，甚至所獲得的收益低于平均收益，故而采取“合作”策略的銀行數(shù)量會(huì)調(diào)整策略，y會(huì)向趨近0，此時(shí)是該群體復(fù)制動(dòng)態(tài)下的另一個(gè)進(jìn)化穩(wěn)定策略。下圖2給出了上述三種情況的動(dòng)態(tài)變化的相位圖和穩(wěn)定狀態(tài)。

4. 傳統(tǒng)銀行與影子銀行合作的進(jìn)化博弈系統(tǒng)復(fù)制動(dòng)態(tài)分析將傳統(tǒng)銀行和影子銀行兩個(gè)特殊群體類型的比例變化復(fù)制動(dòng)態(tài)的關(guān)系用一個(gè)坐標(biāo)平面圖表示，可得到下圖3：

從圖 3中A、B、C和D四個(gè)區(qū)域我們可發(fā)現(xiàn)，傳統(tǒng)銀行和影子銀行的合作博弈過程中，最終會(huì)趨向（0，0）和（1，1）這兩個(gè)進(jìn)化穩(wěn)定策略。同時(shí)，若傳統(tǒng)銀行與影子銀行是處于 B區(qū)域時(shí)，二者將收斂到進(jìn)化穩(wěn)定策略（1，1），即采用“合作”策略；而傳統(tǒng)銀行與影子銀行在C區(qū)域時(shí)，二者將收斂到進(jìn)化穩(wěn)定策略（0，0），即采用“不合作”策略，當(dāng)他們處在A和D 兩個(gè)區(qū)域時(shí)，二者是否選擇“合作”是不確定的。傳統(tǒng)銀行和影子銀行能夠選擇“合作”策略由雙方合作后的收益增加量與成本決定。想要增加B區(qū)域的面積，提高傳統(tǒng)銀行與影子銀行趨向納什均衡（合作、合作），有兩種方法。一是在傳統(tǒng)銀行與影子合作時(shí)他們的收益增加量πc和Cc不變時(shí)，讓二者的合作成本Cc和CY越小；二是當(dāng)雙方的初始合作成本Cc和CY一定時(shí)，提高雙方獲得的合作收益增加量πc和πY。

進(jìn)化博弈理論范文第5篇

Research on Enterprise Independent

Innovation Risk Compensation System Evolution

Based on Evolutionary Game

ZHAO Shi1，2， XIE Kefan1

（1. School of Management， Wuhan University of Technology， Wuhan 430070；

2. Shanghai Precision and Gravels Logisitics Co.， LTD， Shanghai 201700）

Abstract： On the basis of three major entities behavioral analysis in enterprise independent innovation risk compensation system which is at an early stage of development in China， this paper structures enterprise independent innovation risk compensation system evolution model with evolutionary game theory and system dynamics theory. Then it analyzes the evolutionary stability of enterprise independent innovation risk compensation system by example simulation， and based on it， analyzes the effects of risk compensation policy， independent innovation will and risksharing will on the enterprise independent innovation risk compensation system evolution， proves the availability and necessity of enterprise independent innovation risk compensation policy， reveals the evolutionary mechanism of enterprise independent innovation risk compensation system， and proposes the policy proposals of carrying out the risk compensation policy and propaganda policy at the same time.

Key words： risk compensation； system dynamics； enterprise independent innovation； evolutionary game

1引言

隨著知識(shí)經(jīng)濟(jì)時(shí)代的不斷發(fā)展，創(chuàng)新能力已經(jīng)成為了企業(yè)重要的核心競(jìng)爭(zhēng)力，而我國政府也認(rèn)識(shí)到企業(yè)自主創(chuàng)新是國家經(jīng)濟(jì)持續(xù)高速發(fā)展的重要基礎(chǔ)。自政府提出構(gòu)建以企業(yè)為核心的技術(shù)創(chuàng)新支撐平臺(tái)以來，我國企業(yè)在全國以及區(qū)域性企業(yè)自主創(chuàng)新支撐平臺(tái)的支持下，得到了長足的發(fā)展；但與發(fā)達(dá)國家相比，我國企業(yè)在自主創(chuàng)新能力和自主創(chuàng)新績效上仍然存在較大差距。究其原因，從客觀而言是創(chuàng)新環(huán)境不完善和創(chuàng)新資源不充足，從主觀而言則是自主創(chuàng)新的高風(fēng)險(xiǎn)阻礙了企業(yè)的自主創(chuàng)新意愿。因此，降低企業(yè)自主創(chuàng)新風(fēng)險(xiǎn)，減少企業(yè)自主創(chuàng)新的阻滯力是提高企業(yè)自主創(chuàng)新源動(dòng)力的關(guān)鍵，也是促進(jìn)我國企業(yè)自主創(chuàng)新不可忽視的重點(diǎn)。

企業(yè)自主創(chuàng)新風(fēng)險(xiǎn)防范機(jī)制主要由三個(gè)維度構(gòu)成：企業(yè)承擔(dān)、社會(huì)分?jǐn)偤驼a(bǔ)償。企業(yè)承擔(dān)是指企業(yè)作為自主創(chuàng)新的核心主體，是風(fēng)險(xiǎn)防范措施的決策者和實(shí)施者，也是風(fēng)險(xiǎn)損失的最終承擔(dān)者。技術(shù)創(chuàng)新風(fēng)險(xiǎn)的減少和防范與組織策略有重要的關(guān)系[1]，很多關(guān)鍵的策略可以用于技術(shù)創(chuàng)新風(fēng)險(xiǎn)的防范和管理，以促使技術(shù)創(chuàng)新項(xiàng)目達(dá)到利益最大化[2]，尋求社會(huì)分?jǐn)傋鳛橐环N有償?shù)娘L(fēng)險(xiǎn)防范渠道，是企業(yè)防范自主創(chuàng)新風(fēng)險(xiǎn)的一個(gè)重要策略。然而因自主創(chuàng)新風(fēng)險(xiǎn)過高而引起的風(fēng)險(xiǎn)分?jǐn)偲跫s締結(jié)障礙阻礙了社會(huì)風(fēng)險(xiǎn)分?jǐn)倷C(jī)制的運(yùn)行，因而，政府補(bǔ)償在企業(yè)自主創(chuàng)新風(fēng)險(xiǎn)補(bǔ)償機(jī)制中起著重要的促進(jìn)和調(diào)節(jié)作用。

我國對(duì)于企業(yè)自主創(chuàng)新風(fēng)險(xiǎn)補(bǔ)償?shù)难芯吭从?0世紀(jì)80年代，最初的補(bǔ)償方式為設(shè)立經(jīng)營風(fēng)險(xiǎn)準(zhǔn)備金或經(jīng)營風(fēng)險(xiǎn)基金。林躍武認(rèn)為企業(yè)技術(shù)創(chuàng)新風(fēng)險(xiǎn)客觀存在，且嚴(yán)重阻礙了企業(yè)的技術(shù)創(chuàng)新，建立風(fēng)險(xiǎn)補(bǔ)償體系十分必要[3]。企業(yè)技術(shù)創(chuàng)新風(fēng)險(xiǎn)補(bǔ)償體系是國家和各級(jí)政府部門為了健全和完善技術(shù)創(chuàng)新活動(dòng)的外部環(huán)境，促進(jìn)技術(shù)創(chuàng)新活動(dòng)，在考慮到技術(shù)創(chuàng)新活動(dòng)本身的高投入與高風(fēng)險(xiǎn)特點(diǎn)的基礎(chǔ)上，遵循風(fēng)險(xiǎn)與收益對(duì)等的原則，對(duì)參與技術(shù)創(chuàng)新活動(dòng)的主體，包括企業(yè)、科技保險(xiǎn)公司、貸款銀行、擔(dān)保機(jī)構(gòu)及風(fēng)險(xiǎn)投資公司所進(jìn)行的一種全面、系統(tǒng)、規(guī)范的補(bǔ)償機(jī)制與制度安排[4]。由此可見，我國對(duì)于企業(yè)風(fēng)險(xiǎn)補(bǔ)償?shù)难芯恐饕杏谡a(bǔ)償，而國外學(xué)者則對(duì)于政府直接投入企業(yè)技術(shù)創(chuàng)新項(xiàng)目存在異議，認(rèn)為企業(yè)風(fēng)險(xiǎn)補(bǔ)償應(yīng)基于企業(yè)或聯(lián)盟的內(nèi)部機(jī)制。例如：針對(duì)聯(lián)盟項(xiàng)目利益分配問題的風(fēng)險(xiǎn)補(bǔ)償[5]，以高質(zhì)量的產(chǎn)品組合策略開展企業(yè)風(fēng)險(xiǎn)補(bǔ)償[6]，利率波動(dòng)引起的企業(yè)風(fēng)險(xiǎn)補(bǔ)償[7]，企業(yè)人力資源的風(fēng)險(xiǎn)補(bǔ)償問題[8]等等。

系統(tǒng)的運(yùn)作基礎(chǔ)主要是系統(tǒng)內(nèi)主體的決策變化，而系統(tǒng)的進(jìn)化過程就是系統(tǒng)內(nèi)主體通過不斷的分析、決策、學(xué)習(xí)和博弈不斷進(jìn)化的過程，因此，進(jìn)化博弈理論是開展系統(tǒng)進(jìn)化分析的有效工具。龔健等運(yùn)用進(jìn)化博弈模型分析了企業(yè)海外R&D戰(zhàn)略聯(lián)盟的進(jìn)化過程[9]，于斌斌則運(yùn)用進(jìn)化博弈理論研究了產(chǎn)業(yè)集群產(chǎn)業(yè)鏈中企業(yè)的進(jìn)化過程[10]。

2企業(yè)自主創(chuàng)新風(fēng)險(xiǎn)補(bǔ)償系統(tǒng)的主體及假設(shè)

企業(yè)自主創(chuàng)新風(fēng)險(xiǎn)補(bǔ)償系統(tǒng)主要涉及三方行為主體：自主創(chuàng)新企業(yè)、政府和社會(huì)風(fēng)險(xiǎn)分?jǐn)偨M織。雖然社會(huì)風(fēng)險(xiǎn)分?jǐn)偨M織包含了保險(xiǎn)公司、銀行、信貸擔(dān)保公司、風(fēng)險(xiǎn)投資公司等不同類型的主體，但他們?cè)谂c政府的博弈過程中存在較高的相似性和一致性，在企業(yè)自主創(chuàng)新風(fēng)險(xiǎn)補(bǔ)償政策中也屬于同一類被調(diào)節(jié)對(duì)象，因而將其共同視為一方主體。三方主體在企業(yè)自主創(chuàng)新風(fēng)險(xiǎn)補(bǔ)償系統(tǒng)中，以實(shí)現(xiàn)自身利益最大化為目標(biāo)進(jìn)行動(dòng)態(tài)決策，并通過各自的決策相互影響、相互作用，構(gòu)成動(dòng)態(tài)博弈關(guān)系，而企業(yè)自主創(chuàng)新風(fēng)險(xiǎn)補(bǔ)償系統(tǒng)即是基于這種動(dòng)態(tài)博弈關(guān)系運(yùn)作[11]。

為了使復(fù)雜的企業(yè)自主創(chuàng)新風(fēng)險(xiǎn)補(bǔ)償過程簡(jiǎn)單化，以便于運(yùn)用模型進(jìn)行分析，基于企業(yè)自主創(chuàng)新風(fēng)險(xiǎn)補(bǔ)償體系中各方主體行為的特點(diǎn)和我國社會(huì)經(jīng)濟(jì)情況，對(duì)主體作出如下假設(shè)：

（1）假設(shè)企業(yè)自主創(chuàng)新風(fēng)險(xiǎn)補(bǔ)償系統(tǒng)中的三方主體均有兩種策略選擇：政府可選擇推行風(fēng)險(xiǎn)補(bǔ)償政策和不推行風(fēng)險(xiǎn)補(bǔ)償政策；企業(yè)可選擇開展自主創(chuàng)新和不開展自主創(chuàng)新；社會(huì)風(fēng)險(xiǎn)分?jǐn)偨M織可選擇分?jǐn)傦L(fēng)險(xiǎn)和不分?jǐn)傦L(fēng)險(xiǎn)。

（2）主體中的“政府”為風(fēng)險(xiǎn)補(bǔ)償?shù)膶?shí)施主體，可以是中央政府，也可以是地方政府，政策調(diào)整范圍與政府管轄范圍一致，其決策基于政策覆蓋的全部區(qū)域。其決策為實(shí)時(shí)決策，而非定期決策，即政府可以根據(jù)自主創(chuàng)新風(fēng)險(xiǎn)補(bǔ)償?shù)陌l(fā)展現(xiàn)狀隨時(shí)作出決策，并立即推行政策的實(shí)施，不考慮政策有效期和政策延遲情況。該假設(shè)主要用于保證博弈過程連續(xù)性。

（3）政府的風(fēng)險(xiǎn)補(bǔ)償行為主要包括兩類：直接補(bǔ)償和間接補(bǔ)償。對(duì)直接從事創(chuàng)新活動(dòng)的企業(yè)的補(bǔ)償是直接補(bǔ)償，對(duì)社會(huì)風(fēng)險(xiǎn)分?jǐn)偨M織的補(bǔ)償是間接補(bǔ)償。兩種補(bǔ)償政策屬于同一個(gè)政策系統(tǒng)，即政府一旦決定開展風(fēng)險(xiǎn)補(bǔ)償，則兩種補(bǔ)償方式同時(shí)進(jìn)行。風(fēng)險(xiǎn)補(bǔ)償強(qiáng)度為定值，風(fēng)險(xiǎn)補(bǔ)償?shù)念~度只受到風(fēng)險(xiǎn)發(fā)生概率的影響。所有風(fēng)險(xiǎn)補(bǔ)償均為風(fēng)險(xiǎn)損失補(bǔ)償（事后補(bǔ)償），即只有當(dāng)企業(yè)開展自主創(chuàng)新項(xiàng)目發(fā)生損失，或社會(huì)風(fēng)險(xiǎn)分?jǐn)偨M織分?jǐn)偲髽I(yè)自主創(chuàng)新風(fēng)險(xiǎn)發(fā)生損失時(shí)，補(bǔ)償政策才生效。假設(shè)政府有充足的資金進(jìn)行補(bǔ)償，但在決策時(shí)，充分考慮補(bǔ)償?shù)某杀?，即服從?jīng)濟(jì)人假設(shè)。此外，在博弈過程中，政府獲得的所有社會(huì)效益全部轉(zhuǎn)化為經(jīng)濟(jì)收益，以經(jīng)濟(jì)指標(biāo)表現(xiàn)。

（4）假設(shè)自主創(chuàng)新企業(yè)的風(fēng)險(xiǎn)偏好為風(fēng)險(xiǎn)中性，政府的風(fēng)險(xiǎn)補(bǔ)償政策對(duì)其具有正效應(yīng)，且為了有效防范自主創(chuàng)新風(fēng)險(xiǎn)，企業(yè)具有分?jǐn)傋灾鲃?chuàng)新風(fēng)險(xiǎn)的意愿。此外，假設(shè)自主創(chuàng)新企業(yè)具有獨(dú)立投資和開展自主創(chuàng)新項(xiàng)目的能力，而自主創(chuàng)新結(jié)果只有成功和失敗兩種，即一旦發(fā)生風(fēng)險(xiǎn)損失則視為自主創(chuàng)新項(xiàng)目失敗，企業(yè)無法獲取風(fēng)險(xiǎn)收益[12]。

（5）假設(shè)社會(huì)風(fēng)險(xiǎn)分?jǐn)偨M織為政策覆蓋區(qū)域內(nèi)的大中型風(fēng)險(xiǎn)分?jǐn)偨M織，具有分?jǐn)偲髽I(yè)自主創(chuàng)新風(fēng)險(xiǎn)的能力。社會(huì)風(fēng)險(xiǎn)分?jǐn)偨M織的風(fēng)險(xiǎn)偏好也為風(fēng)險(xiǎn)中性，政府的風(fēng)險(xiǎn)補(bǔ)償政策對(duì)其具有正效應(yīng)。

為了便于進(jìn)行進(jìn)化博弈分析，基于以上假設(shè)前提，對(duì)博弈分析過程中設(shè)計(jì)的一些基本變量做出如下假設(shè)：

（1）假設(shè)若自主創(chuàng)新企業(yè)進(jìn)行自主創(chuàng)新，其全部投入總額為Cy，項(xiàng)目成功時(shí)獲取的收益為πy。自主創(chuàng)新項(xiàng)目失敗（發(fā)生風(fēng)險(xiǎn)損失）的概率為p，成功并獲取收益的概率為1-p。若企業(yè)不開展自主創(chuàng)新，則會(huì)因失去市場(chǎng)競(jìng)爭(zhēng)優(yōu)勢(shì)造成經(jīng)營收益下降，從而遭受損失，該損失與產(chǎn)業(yè)整體的技術(shù)創(chuàng)新競(jìng)爭(zhēng)力有關(guān)，而產(chǎn)業(yè)整體的技術(shù)創(chuàng)新競(jìng)爭(zhēng)力主要受到政府補(bǔ)償和社會(huì)風(fēng)險(xiǎn)分?jǐn)偟挠绊懀蚨?，該損失可以根據(jù)是否有政府補(bǔ)償和社會(huì)風(fēng)險(xiǎn)分?jǐn)偡譃樗念?。由于政府補(bǔ)償只是一種輔作用，而社會(huì)風(fēng)險(xiǎn)分?jǐn)倿槠髽I(yè)自主創(chuàng)新風(fēng)險(xiǎn)防范的主要力量，所以社會(huì)風(fēng)險(xiǎn)分?jǐn)傆绊憦?qiáng)于政府補(bǔ)償影響，從而產(chǎn)生的損失分別為：政府補(bǔ)償且社會(huì)分?jǐn)倳r(shí)為Lyza，有社會(huì)分?jǐn)偀o政府補(bǔ)償時(shí)為Lya，有政府補(bǔ)償無社會(huì)分?jǐn)倳r(shí)為Lyzd，兩者皆無時(shí)為Lyd，且Lyza>Lya>Lyzd>Lyd。

（2）假設(shè)若社會(huì)風(fēng)險(xiǎn)分?jǐn)偨M織開展社會(huì)風(fēng)險(xiǎn)分?jǐn)倶I(yè)務(wù)，則固定成本為Cx，當(dāng)自主創(chuàng)新項(xiàng)目失敗時(shí)，其分擔(dān)的風(fēng)險(xiǎn)損失為s。分?jǐn)傦L(fēng)險(xiǎn)所獲得的收益與政府補(bǔ)償相關(guān)，當(dāng)有政府補(bǔ)償時(shí)，風(fēng)險(xiǎn)分?jǐn)偸找孑^高，為Δπxa；當(dāng)無政府補(bǔ)償時(shí)，風(fēng)險(xiǎn)分?jǐn)偸找孑^低，為Δπxd。若社會(huì)風(fēng)險(xiǎn)分?jǐn)偨M織不開展社會(huì)風(fēng)險(xiǎn)分?jǐn)倶I(yè)務(wù)，而企業(yè)存在分?jǐn)傦L(fēng)險(xiǎn)的需求，則社會(huì)風(fēng)險(xiǎn)分?jǐn)偨M織會(huì)因?yàn)閬G失市場(chǎng)份額而產(chǎn)生損失，這一損失與企業(yè)的風(fēng)險(xiǎn)分?jǐn)傂枨髲?qiáng)度和社會(huì)風(fēng)險(xiǎn)分?jǐn)偨M織的整體風(fēng)險(xiǎn)分?jǐn)偰芰τ嘘P(guān)，當(dāng)政府進(jìn)行補(bǔ)償時(shí)，企業(yè)自主創(chuàng)新意愿較強(qiáng)，風(fēng)險(xiǎn)分?jǐn)傂枨筝^大，且社會(huì)風(fēng)險(xiǎn)分?jǐn)偨M織受到政府補(bǔ)償后，整體分?jǐn)偰芰μ岣?，因而不開展社會(huì)風(fēng)險(xiǎn)分?jǐn)倶I(yè)務(wù)的損失較大為Lxa，反之，當(dāng)政府不進(jìn)行補(bǔ)償時(shí)，損失較小為Lx。

（3）假設(shè)政府推行和運(yùn)作補(bǔ)償政策的費(fèi)用是Cz，當(dāng)發(fā)生風(fēng)險(xiǎn)損失時(shí)，對(duì)企業(yè)的直接補(bǔ)償為O1，對(duì)社會(huì)風(fēng)險(xiǎn)分?jǐn)偨M織的風(fēng)險(xiǎn)損失補(bǔ)償為O2。當(dāng)政府開展風(fēng)險(xiǎn)補(bǔ)償時(shí)，企業(yè)開展技術(shù)創(chuàng)新所產(chǎn)生的社會(huì)效益，在有社會(huì)風(fēng)險(xiǎn)分?jǐn)倵l件下為Δπza，在無社會(huì)風(fēng)險(xiǎn)分?jǐn)倵l件下為Δπzd；當(dāng)政府不開展風(fēng)險(xiǎn)補(bǔ)償時(shí)，企業(yè)開展技術(shù)創(chuàng)新所產(chǎn)生的社會(huì)效益，在有社會(huì)風(fēng)險(xiǎn)分?jǐn)倵l件下為Δπ0a，在無社會(huì)風(fēng)險(xiǎn)分?jǐn)倵l件下為Δπ0d，且Δπza>Δπ0a>Δπzd>Δπ0d。

（4）假設(shè)在系統(tǒng)運(yùn)作過程中政府選擇補(bǔ)償策略的概率為z，選擇不補(bǔ)償策略的概率為1-z；企業(yè)選擇自主創(chuàng)新策略的概率為y，選擇不創(chuàng)新策略的概率為1-y；社會(huì)風(fēng)險(xiǎn)分?jǐn)偨M織選擇分?jǐn)偟母怕蕿閤，選擇不分?jǐn)偛呗缘母怕蕿?-x。

（5）以上所有假設(shè)變量均為正實(shí)數(shù)，其中0

3企業(yè)自主創(chuàng)新風(fēng)險(xiǎn)補(bǔ)償系統(tǒng)進(jìn)化模型的構(gòu)建

基于進(jìn)化博弈思想，在企業(yè)自主創(chuàng)新風(fēng)險(xiǎn)補(bǔ)償系統(tǒng)中，各方主體的策略選擇決策基礎(chǔ)主要是其所選策略的效用，因而基于系統(tǒng)中各方主體的策略選擇和各方利益機(jī)制構(gòu)建博弈效用矩陣，如表1所示。表1企業(yè)自主創(chuàng)新風(fēng)險(xiǎn)補(bǔ)償?shù)牟┺男в镁仃?/p>

自主創(chuàng)新企業(yè)創(chuàng)新（y）不創(chuàng)新（1-y）政府補(bǔ)償（z）社會(huì)風(fēng)險(xiǎn)

分?jǐn)偨M織分?jǐn)偅▁）（Δπza-Cz-p（O1+O2），Δπxa+pO2-Cx-ps，（1-p）πy+pO1-Cy+ps）（-Cz，-Cx，-Lyza）不分?jǐn)偅?-x）（Δπzd-Cz-pO1，-Lxa，（1-p）πy+pO1-Cy）（-Cz，0，-Lyzd）不補(bǔ)償（1-z）社會(huì)風(fēng)險(xiǎn)

分?jǐn)偨M織分?jǐn)偅▁）（Δπ0a，Δπxd-Cx-ps，（1-p）πy-Cy+ps）（0，-Cx，-Lya）不分?jǐn)偅?-x）（Δπ0d，-Lx，（1-p）πy-Cy）（0，0，-Lyd）注：表格中效用順序?yàn)檎в?、社?huì)風(fēng)險(xiǎn)分?jǐn)偨M織效用、企業(yè)效用

基于企業(yè)自主創(chuàng)新風(fēng)險(xiǎn)補(bǔ)償博弈效用矩陣可以構(gòu)建各方主體的效用模型如下：

（1）政府的效用模型

設(shè)政府選擇補(bǔ)償策略時(shí)效用為uz1，選擇不補(bǔ)償策略時(shí)效用為uz2，可得：

uz1=xyΔπza-xypO2+yΔπzd-ypO1-Cz-xyΔπzd（1）

uz2=xyΔπ0a-xyΔπ0d+yΔπ0d（2）

（2）社會(huì)風(fēng)險(xiǎn)分?jǐn)偨M織的效用模型

設(shè)社會(huì)風(fēng)險(xiǎn)分?jǐn)偨M織選擇分?jǐn)偛呗詴r(shí)效用為ux1，選擇不分?jǐn)偛呗詴r(shí)效用為ux2，可得：

ux1=zy（Δπxa-Δπxd）+zypO2+yΔπxd-yps-Cx （3）

ux2=zy（Lx-Lxa）-yLx（4）

（3）企業(yè)的效用模型

設(shè)企業(yè)選擇創(chuàng)新策略時(shí)效用為uy1，選擇不創(chuàng)新策略時(shí)效用為uy2，可得：

uy1=zpO1+xps+（1-p）πy-Cy（5）

uy2=zxLyzd-zxLyza-zLyzd-xLya+xzLya-Lyd+zLyd+xLyd-xzLyd （6）

為了進(jìn)一步分析三方主體的進(jìn)化博弈過程，根據(jù)進(jìn)化博弈理論，構(gòu)建三方主體動(dòng)態(tài)復(fù)制方程[13]得：

dxdt=x（ux1-ux）=x（x-1）（ux2-ux1）=x（x-1）[zy（Lx-Lxa）-yLx-zy（Δπxa-Δπxd）-zypO2-yΔπxd+yps+Cx]（7）

dydt=y（uy1-uy）=y（y-1）（uy2-uy1）=y（y-1）[zxLyzd-zxLyza-zLyzd-xLya+xzLya-Lyd+zLyd+xLyd-xzLyd-zpO1+xps+（1-p）πy-Cy] （8）

dzdt=z（uz1-uz）=z（z-1）（uz2-uz1）=z（z-1）[xyΔπ0a-xyΔπ0d+yΔπ0d-xyΔπza-xypO2-yΔπzd+ypO1+Cz +xyΔπzd] （9）

為了進(jìn)一步分析企業(yè)自主創(chuàng)新風(fēng)險(xiǎn)補(bǔ)償系統(tǒng)的進(jìn)化機(jī)理，將進(jìn)化博弈理論與系統(tǒng)動(dòng)力學(xué)理論結(jié)合，基于系統(tǒng)中各方主體的博弈效用模型和動(dòng)態(tài)復(fù)制方程，運(yùn)用Vensim軟件，構(gòu)建如圖1所示的企業(yè)自主創(chuàng)新風(fēng)險(xiǎn)補(bǔ)償系統(tǒng)流圖。

4企業(yè)自主創(chuàng)新風(fēng)險(xiǎn)補(bǔ)償?shù)南到y(tǒng)進(jìn)化分析

為了對(duì)企業(yè)自主創(chuàng)新風(fēng)險(xiǎn)補(bǔ)償?shù)南到y(tǒng)進(jìn)化機(jī)理進(jìn)行分析，并驗(yàn)證企業(yè)自主創(chuàng)新風(fēng)險(xiǎn)補(bǔ)償系統(tǒng)進(jìn)化模型的有效性，本文以武漢市企業(yè)自主創(chuàng)新風(fēng)險(xiǎn)補(bǔ)償系統(tǒng)為算例，進(jìn)行模擬計(jì)算分析。

為了保證算例參數(shù)設(shè)計(jì)的一般性，有效規(guī)避進(jìn)化博弈中的特殊穩(wěn)定點(diǎn)，基于進(jìn)化穩(wěn)定理論，算例參數(shù)應(yīng)符合以下條件：

Cy-（1-p）πy

基于以上參數(shù)設(shè)計(jì)條件和一般企業(yè)技術(shù)創(chuàng)新數(shù)據(jù)設(shè)計(jì)算例參數(shù)如表2所示。表2參數(shù)值表

參數(shù)名稱參數(shù)值參數(shù)名稱參數(shù)值參數(shù)名稱參數(shù)值參數(shù)名稱參數(shù)值Δπza10Δπxa8Lya25O22Δπzd6Δπxd6Lyd15p 06Cz2Cx4Lyza3s 5Δπ0a4Lx2Lyzd2πy5Δπ0d2Lxa3O13Cy4注：以上參數(shù)除損失概率p外，其他參數(shù)單位均為百萬

首先，對(duì)系統(tǒng)的進(jìn)化穩(wěn)定性進(jìn)行分析，取x、y、z的初始值為（03，03，02）和（04，04，05）分別進(jìn)行模擬，得到如圖2、圖3所示的模擬計(jì)算結(jié)果。由圖2和圖3可知，企業(yè)自主創(chuàng)新風(fēng)險(xiǎn)補(bǔ)償系統(tǒng)有兩個(gè)進(jìn)化穩(wěn)定點(diǎn)：（1，1，1）和（0，0，0）。當(dāng)三個(gè)主體選擇補(bǔ)償、創(chuàng)新和分?jǐn)偛呗缘某跏几怕蚀笥谝欢ㄖ禃r(shí)，系統(tǒng)最終將穩(wěn)定于（1，1，1）點(diǎn)，即穩(wěn)定于（分?jǐn)?，?chuàng)新，補(bǔ)償）策略組合；反之，當(dāng)三個(gè)主體選擇補(bǔ)償、創(chuàng)新和分?jǐn)偛呗缘某跏几怕市∮谝欢ㄖ禃r(shí)，系統(tǒng)最終將穩(wěn)定于（0，0，0）點(diǎn)，即穩(wěn)定于（不分?jǐn)偅粍?chuàng)新，不補(bǔ)償）策略組合。

然后，分析政府補(bǔ)償政策對(duì)企業(yè)自主創(chuàng)新風(fēng)險(xiǎn)補(bǔ)償系統(tǒng)進(jìn)化的影響。在不考慮政府補(bǔ)償政策的情況下，三方系統(tǒng)變?yōu)閮煞较到y(tǒng)，根據(jù)進(jìn)化博弈穩(wěn)定性分析可得：

當(dāng)CxLxa+Δπxd-ps

當(dāng)0

當(dāng)Cy-（1-p）πyLya+ps

當(dāng)0

為了分析政府補(bǔ)償?shù)淖饔?，依?jù)以上進(jìn)化博弈分析結(jié)果，取（x，y）初始值為（02，03），使系統(tǒng)在政府補(bǔ)償概率初始值為0時(shí)的進(jìn)化穩(wěn)定點(diǎn)為（0，0）。然后，取政府補(bǔ)償概率為02，04，06，08分別進(jìn)行系統(tǒng)模擬計(jì)算，得到如圖3所示的系統(tǒng)進(jìn)化結(jié)果比較圖。

基于以上模擬結(jié)果可知，政府補(bǔ)償政策對(duì)企業(yè)自主創(chuàng)新風(fēng)險(xiǎn)補(bǔ)償系統(tǒng)具有推動(dòng)性作用，隨著政府補(bǔ)償初始概率的增大，企業(yè)和社會(huì)風(fēng)險(xiǎn)分?jǐn)偨M織的進(jìn)化穩(wěn)定點(diǎn)從（0，0）轉(zhuǎn)向（1，1），該結(jié)果說明，政府的風(fēng)險(xiǎn)補(bǔ)償政策有利于促進(jìn)企業(yè)自主創(chuàng)新行為和社會(huì)風(fēng)險(xiǎn)分?jǐn)偨M織對(duì)企業(yè)自主創(chuàng)新風(fēng)險(xiǎn)的分?jǐn)?，只要政府?jiān)持推行企業(yè)自主創(chuàng)新風(fēng)險(xiǎn)補(bǔ)償政策，最終企業(yè)和社會(huì)風(fēng)險(xiǎn)分?jǐn)偨M織會(huì)選擇（創(chuàng)新，分?jǐn)偅┎呗越M合。

第三，分析社會(huì)風(fēng)險(xiǎn)分?jǐn)偨M織的風(fēng)險(xiǎn)分?jǐn)傄庠笇?duì)企業(yè)自主創(chuàng)新風(fēng)險(xiǎn)補(bǔ)償系統(tǒng)進(jìn)化的影響。取系統(tǒng)初始值為（03，04，04）和（06，04，04）分別進(jìn)行模擬計(jì)算，得到如圖4所示的進(jìn)化結(jié)果比較圖。

如圖4所示，當(dāng)社會(huì)風(fēng)險(xiǎn)分?jǐn)偨M織的分?jǐn)傄庠冈鰪?qiáng)，企業(yè)的創(chuàng)新意愿和政府的補(bǔ)償意愿會(huì)提高得更快，系統(tǒng)會(huì)更快達(dá)到進(jìn)化穩(wěn)定點(diǎn)（1，1，1）。該結(jié)果說明，社會(huì)風(fēng)險(xiǎn)分?jǐn)偨M織風(fēng)險(xiǎn)分?jǐn)傄庠傅奶岣哂兄谠鰪?qiáng)企業(yè)的自主創(chuàng)新意愿和政府的風(fēng)險(xiǎn)補(bǔ)償意愿，促使系統(tǒng)快速向有效的穩(wěn)定點(diǎn)進(jìn)化。

第四，分析企業(yè)自主創(chuàng)新意愿對(duì)企業(yè)自主創(chuàng)新風(fēng)險(xiǎn)補(bǔ)償系統(tǒng)進(jìn)化的影響。取系統(tǒng)初始值為（04，03，04）和（04，06，04）分別進(jìn)行模擬計(jì)算，得到如圖5所示的進(jìn)化結(jié)果比較圖。

如圖5所示，當(dāng)企業(yè)的自主創(chuàng)新意愿增強(qiáng)，社會(huì)風(fēng)險(xiǎn)分?jǐn)偨M織的風(fēng)險(xiǎn)分?jǐn)傄庠负驼难a(bǔ)償意愿會(huì)提高得更快，系統(tǒng)會(huì)更快地達(dá)到進(jìn)化穩(wěn)定點(diǎn)（1，1，1）。該結(jié)果說明，企業(yè)的自主創(chuàng)新意愿的提高有助于增強(qiáng)社會(huì)風(fēng)險(xiǎn)分?jǐn)偨M織的風(fēng)險(xiǎn)分?jǐn)傄庠负驼娘L(fēng)險(xiǎn)補(bǔ)償意愿，促使系統(tǒng)快速向有效的穩(wěn)定點(diǎn)進(jìn)化。

5結(jié)論

通過企業(yè)自主創(chuàng)新風(fēng)險(xiǎn)補(bǔ)償?shù)南到y(tǒng)進(jìn)化分析可以得到以下結(jié)論：

（1）政府推行企業(yè)自主創(chuàng)新風(fēng)險(xiǎn)補(bǔ)償政策有助于提高企業(yè)的自主創(chuàng)新意愿，促進(jìn)社會(huì)風(fēng)險(xiǎn)分?jǐn)偨M織主動(dòng)分?jǐn)偲髽I(yè)自主創(chuàng)新風(fēng)險(xiǎn)，進(jìn)而促進(jìn)區(qū)域企業(yè)自主創(chuàng)新，推動(dòng)區(qū)域的科技和經(jīng)濟(jì)發(fā)展。

（2）扶持區(qū)域社會(huì)風(fēng)險(xiǎn)分?jǐn)偨M織有助于提高區(qū)域企業(yè)自主創(chuàng)新能力。政府通過扶持區(qū)域社會(huì)風(fēng)險(xiǎn)分?jǐn)偨M織，提高其風(fēng)險(xiǎn)分?jǐn)偰芰惋L(fēng)險(xiǎn)分?jǐn)傄庠?，從而通過有償?shù)纳鐣?huì)風(fēng)險(xiǎn)分?jǐn)傒o助企業(yè)進(jìn)行自主創(chuàng)新風(fēng)險(xiǎn)防范，提高區(qū)域企業(yè)自主創(chuàng)新能力和意愿。

進(jìn)化博弈理論

進(jìn)化博弈理論范文第1篇

進(jìn)化博弈理論范文第2篇

進(jìn)化博弈理論范文第3篇

進(jìn)化博弈理論范文第4篇

進(jìn)化博弈理論范文第5篇

AI文章写作

熱門文章排行更多

相關(guān)期刊更多

生物進(jìn)化

前沿科學(xué)

科學(xué)世界

精品文章排行更多

在线服务