前言:想要寫出一篇令人眼前一亮的文章嗎?我們特意為您整理了5篇博弈論的基本原理范文,相信會(huì)為您的寫作帶來(lái)幫助,發(fā)現(xiàn)更多的寫作思路和靈感。
關(guān)鍵詞:獨(dú)立董事;博弈
一、引言
獨(dú)立董事指具有完全獨(dú)立意志,代表全體股東和公司整體利益董事會(huì)成員。我國(guó)絕大部分上市公司按照證監(jiān)會(huì)的要求,在公司董事會(huì)中引入了兩名以上的獨(dú)立董事。經(jīng)過(guò)近幾年的運(yùn)行實(shí)踐,業(yè)界普遍認(rèn)為,雖然獨(dú)立董事在一定程度上改善了上市公司治理結(jié)構(gòu),但獨(dú)立董事的作用沒(méi)有充分的發(fā)揮。獨(dú)立董事缺席董事會(huì)會(huì)議、對(duì)公司的重大交易聽(tīng)之任之、做重大經(jīng)營(yíng)決策時(shí)“搭便車”等現(xiàn)象普遍存在,有關(guān)實(shí)證研究表明,我國(guó)獨(dú)立董事與公司業(yè)績(jī)只有非常微弱的正相關(guān)關(guān)系。獨(dú)立董事的作用不能充分發(fā)揮,固然有其各方面主觀或客觀的原因,但獨(dú)立董事在與被監(jiān)督對(duì)象――大股東與經(jīng)營(yíng)者博弈中處于劣勢(shì)則是問(wèn)題產(chǎn)生的根源。本文運(yùn)用博弈論的基本原理,剖析了獨(dú)立董事制度失效的原因,提出通過(guò)完善獨(dú)立董事制度,改善博弈雙方的信息和支付,并由此改變博弈雙方的行動(dòng)和戰(zhàn)略,充分發(fā)揮獨(dú)立董事的作用。
二、分析方法
博弈論是研究多個(gè)決策主體的戰(zhàn)略選擇問(wèn)題的理論,其中的核心概念是納什均衡。通過(guò)對(duì)納什均衡的分析,揭示了一項(xiàng)制度充分發(fā)揮作用的前提條件,即制度安排所涉及的戰(zhàn)略是行為者最優(yōu)戰(zhàn)略的組合,也就是一種納什均衡。
從博弈論的角度來(lái)看,獨(dú)立董事制度的引入恰恰是資產(chǎn)所有者(股東)與資產(chǎn)經(jīng)營(yíng)者(公司高層管理人員)博弈的結(jié)果。原有董事會(huì)的失靈,破壞了原有的均衡狀態(tài),需要引入獨(dú)立董事制度,建立起新的均衡關(guān)系,克服董事會(huì)失靈,解決公司“內(nèi)部人控制”問(wèn)題。
三、模型分析
本文用博弈論的基本原理,建立獨(dú)立董事與股東之間以及獨(dú)立董事與經(jīng)營(yíng)者之間兩個(gè)博弈模型,對(duì)獨(dú)立董事的博弈行為進(jìn)行分析。
(一)獨(dú)立董事與大股東的博弈
大股東與獨(dú)立董事的博弈分為兩個(gè)階段:第一階段發(fā)生在上市公司在聘用獨(dú)立董事時(shí),第二階段則發(fā)生在獨(dú)立董事被聘用后。因?yàn)樯鲜泄颈仨毱赣锚?dú)立董事,所以本文對(duì)第一階段的博弈不做分析,著重分析博弈的第二階段。
在此階段,大股東和獨(dú)立董事的行動(dòng)策略是共同知識(shí),所以博弈屬于完全信息博弈,又雙方的行動(dòng)存在時(shí)間上的先后,因此博弈屬于動(dòng)態(tài)博弈,即大股東和獨(dú)立董事在此階段的博弈屬于完全信息動(dòng)態(tài)博弈。
基本假設(shè):一是獨(dú)立董事和大股東都是理論上的理性人,都追求自身效用的最大化。二是博弈雙方獲取的信息是對(duì)稱的。三是博弈雙方的收益包括經(jīng)濟(jì)和聲譽(yù)兩個(gè)方面。四是大股東可能存在違規(guī)與合規(guī)兩種行為,即其戰(zhàn)略空間為(違規(guī),合規(guī)),獨(dú)立董事在觀察到大股東的行動(dòng)以后可能會(huì)對(duì)這種行為選擇發(fā)表獨(dú)立意見(jiàn)或不發(fā)表對(duì)立意見(jiàn),即其戰(zhàn)略空間為(發(fā)表,不發(fā)表),獨(dú)立董事選擇行動(dòng)后博弈結(jié)束。五是大股東選擇違規(guī)的情況下,獨(dú)立董事如選擇發(fā)表意見(jiàn),會(huì)受到來(lái)自管理層的壓力如更換獨(dú)立董事等,這是給獨(dú)立董事帶來(lái)的損失Ip。同時(shí)大股東也會(huì)有一個(gè)聲譽(yù)損失Lr,這時(shí)雙方的支付函數(shù)為(L-Lr,I-Ip);若獨(dú)立董事選擇不發(fā)表意見(jiàn),這時(shí)大股東與獨(dú)立董事可能分別獲得額外收益Ld和Id,但雙方的合謀可能受到監(jiān)管當(dāng)局的查處,假設(shè)合謀受到查處的概率為r,這時(shí)雙方的物質(zhì)損失和聲譽(yù)損失分別為L(zhǎng)c,Lr和Ic,Ir,此時(shí)雙方支付函數(shù)為:(L+Ld-r(Lr+Lc),I+Id-r(Ir+Ic)),在大股東選擇合規(guī)情況下,雙方的支付函數(shù)為(L,I)。具體的博弈樹(shù),如圖1所示:
根據(jù)圖1的博弈樹(shù),本文采用逆歸納法對(duì)此模型求解:在此博弈的第二階段,獨(dú)立董事是否會(huì)對(duì)大股東的違規(guī)行為發(fā)表意見(jiàn)取決于其收益,根據(jù)理性人的假設(shè),獨(dú)立董事會(huì)選擇使自己獲得最大收益的戰(zhàn)略。由上圖可見(jiàn),如果獨(dú)立董事選擇發(fā)表意見(jiàn),其效用為I-Ip,如果選擇不發(fā)表意見(jiàn),則其效用為I+Id-r(Ir+Ic)?,F(xiàn)實(shí)情況中,我國(guó)對(duì)于獨(dú)立董事與大股東之間的合謀缺乏完善的查處機(jī)制,即r非常??;另一方面,獨(dú)立董事選擇不發(fā)表意見(jiàn)后,其所獲得的額外收益Id非常大,顯然有I+Id-r(Ir+Ic)1-Ip>I-Ip,即不發(fā)表獨(dú)立意見(jiàn)成為獨(dú)立董事在該階段的最優(yōu)策略。在博弈的第一階段,大股東同樣作為一個(gè)理性人,預(yù)測(cè)到獨(dú)立董事在第二階段會(huì)選擇不發(fā)表,其行為選擇取決于L與L+Ld-r(Lr+Lc)的大小,根據(jù)前面分析,顯然有Ld-r(Lr+Lc)>0。因此,此博弈出現(xiàn)惟一的一個(gè)子博弈精練納什均衡(違規(guī),不發(fā)表),即“雙方合謀”。由上面的分析可以看到,獨(dú)立董事能否發(fā)表獨(dú)立意見(jiàn)是大股東與獨(dú)立董事之間基于收益與成本上的理性選擇,是一套制度安排的結(jié)果。如果加大違規(guī)成本,降低合謀收益,將促使雙方的博弈均衡點(diǎn)離開(kāi)“合謀”,從而促使獨(dú)立董事發(fā)表獨(dú)立意見(jiàn)。
(二)獨(dú)立董事與經(jīng)營(yíng)者的博弈
在此博弈模型中,參與人是獨(dú)立董事和經(jīng)營(yíng)者。經(jīng)營(yíng)者的戰(zhàn)略空間是(合作,不合作),獨(dú)立董事的戰(zhàn)略空間是(積極作為,消極作為)。假定獨(dú)立董事積極作為的成本是C,消極作為的成本是0;經(jīng)營(yíng)者合作的成本是YC,不合作的成本是NC。
在不同條件下,參與者的收益情況設(shè)定如下:在經(jīng)營(yíng)者合作條件下,獨(dú)立董事積極作為的收益是R1,消極作為的收益是0;在經(jīng)營(yíng)者不合作條件下,獨(dú)立董事積極作為的收益是R2,消極作為的收益是0。其中獨(dú)立董事充分發(fā)揮效用的概率是P,經(jīng)營(yíng)者合作的概率是Q,即在此處引入“混合戰(zhàn)略”的概念。
當(dāng)獨(dú)立董事選擇積極作為時(shí),其收益Ud1=(R1-C)×Q+(R2-C)×(1-Q)=(R1-R2)×Q+R2-C;當(dāng)獨(dú)立董事選擇消極作為時(shí),其收益Ud2=0×Q+0×(1-Q)=0。顯而易見(jiàn):Ud1Ud2時(shí),Q(C-R2)/(R1-R2);Ud1Ud2時(shí),Q(C-R2)/(R1-R2);Ud1=Ud2時(shí),Q=(C-R2)/(R1-R2)。
當(dāng)經(jīng)營(yíng)者選擇合作時(shí),其收益Uj1=(R1-YC)×P-YC×(1-P);當(dāng)經(jīng)營(yíng)者選擇不合作時(shí),其收益Uj2=(R2-NC)×P+0×(1-P)=(R2-NC)×P。同樣有:Uj1Uj2時(shí),PYC/(R1-R2+NC);Uj1Uj2時(shí),PYC/(R1-R2+NC);Uj1=Uj2時(shí),P=YC/(R1-R2+NC)。
綜合以上分析,如果經(jīng)營(yíng)者合作的概率小于(C-R2)/(R1-R2),獨(dú)立董事積極作為的期望收益小于消極作為的期望收益,這將導(dǎo)致獨(dú)立董事消極作為;如果經(jīng)營(yíng)者合作的概率大于(C-R2)/(R1-R2),則獨(dú)立董事積極作為的期望收益大于消極作為的期望收益,這將導(dǎo)致獨(dú)立董事積極作為;如果經(jīng)營(yíng)者合作的概率等于(C-R2)/(R1-R2),獨(dú)立董事積極作為的期望收益等于消極作為的期望收益,此時(shí),獨(dú)立董事在選擇積極作為或消極作為是無(wú)偏好的。
如果獨(dú)立董事積極作為的概率小于YC/(R1-R2+NC),經(jīng)營(yíng)者合作的期望收益小于不合作的期望收益,經(jīng)營(yíng)者將選擇不合作;如果獨(dú)立董事積極作為的概率大于YC/(R1-R2+NC),經(jīng)營(yíng)者合作的期望收益大于不合作的期望收益,經(jīng)營(yíng)者將選擇合作;如果獨(dú)立董事充分發(fā)揮效用的概率等于YC/(R1-R2+NC),經(jīng)營(yíng)者合作的期望收益等于不合作的期望收益,此時(shí),經(jīng)營(yíng)者在選擇合作或不合作上是無(wú)偏好的。
四、結(jié)論及政策建議
(一)結(jié)論
通過(guò)分析,得出兩個(gè)結(jié)論:一是在現(xiàn)有的公司法人治理結(jié)構(gòu)下,由上市公司選聘獨(dú)立董事難以真正發(fā)揮獨(dú)立董事的監(jiān)督作用,獨(dú)立董事未能有效地監(jiān)督和制約上市公司的行為。二是獨(dú)立董事與大股東合謀問(wèn)題,在現(xiàn)有監(jiān)督體制下無(wú)法得到有效解決。
通過(guò)對(duì)獨(dú)立董事與經(jīng)營(yíng)者的博弈模型的分析,可以發(fā)現(xiàn)此博弈的納什均衡與獨(dú)立董事積極作為的成本C,合作及不合作條件下預(yù)期收益(R1或R2),以及經(jīng)營(yíng)者選擇合作或不合作的策略成本(YC或NC)有關(guān)。換言之,博弈的結(jié)果能否達(dá)到預(yù)期目標(biāo)不但取決于獨(dú)立董事、經(jīng)營(yíng)者各自的支付成本,很大程度上還取決于(合作、不合作)條件下兩種預(yù)期收益的差額(R1-R2)。因此,在進(jìn)行獨(dú)立董事制度的構(gòu)建時(shí),對(duì)于上述因素應(yīng)給予足夠的重視,創(chuàng)造實(shí)現(xiàn)納什均衡的條件,以使制度的效用充分發(fā)揮。
(二)政策建議
首先,必須改變獨(dú)立董事的聘任方法。將獨(dú)立董事的聘用決定權(quán)交給證監(jiān)會(huì),其行為將與上市公司無(wú)關(guān),有效行使監(jiān)督職責(zé)是證監(jiān)會(huì)聘用獨(dú)立董事的唯一標(biāo)準(zhǔn)。從獨(dú)立董事的角度看,盡責(zé)行為付出的成本小于回報(bào),會(huì)最大限度地履行職責(zé),以期得到證監(jiān)會(huì)的信任和繼續(xù)得到聘用。
其次,完善獨(dú)立董事的激勵(lì)機(jī)制,刺激獨(dú)立董事積極履行職責(zé),多做貢獻(xiàn)。一是聲譽(yù)激勵(lì)。獨(dú)立董事發(fā)揮作用的動(dòng)力來(lái)源于其維持自身聲譽(yù)的努力,在上市公司中表現(xiàn)出應(yīng)有的獨(dú)立性和客觀性,無(wú)形中將極大地保護(hù)和提升他們的聲譽(yù),并由此產(chǎn)生相應(yīng)的收益,在一定程度上避免獨(dú)立董事與執(zhí)行董事之間的“合謀”。二是薪酬激勵(lì)。采取給予報(bào)酬和持股計(jì)劃以促使獨(dú)立董事更加積極認(rèn)真地投入工作,獨(dú)立董事在其從事的領(lǐng)域乃至社會(huì)上具有較高的知名度和良好的聲譽(yù),必須有相對(duì)固定的薪酬以其心理上得到平衡。三是權(quán)利激勵(lì)。授予獨(dú)立董事必要的控制權(quán),如提名、審計(jì)、監(jiān)督、評(píng)價(jià)等。獨(dú)立董事必須具有監(jiān)督權(quán)、審核權(quán)、否決權(quán)。
參考文獻(xiàn):
1、張維迎.博弈論與信息經(jīng)濟(jì)學(xué)[M].上海人民出版社,1996.
2、施錫銓.博弈論[M].上海財(cái)經(jīng)大版社,2000.
3、孟明.獨(dú)立董事的激勵(lì)機(jī)制[J].企業(yè)改革與管理,2003(11).
4、張凡.關(guān)于獨(dú)立董事制度幾個(gè)問(wèn)題的認(rèn)識(shí)[J].管理世界,2007(2).
5、胡金焱,丁士祥.我國(guó)上市公司獨(dú)立董事制度的博弈分析[J].山東大學(xué)學(xué)報(bào)社會(huì)科學(xué)版,2003(3).
6、林凌,常誠(chéng).獨(dú)立董事制度研究[J].證券市場(chǎng)導(dǎo)報(bào),2000(9).
7、何問(wèn)陶,王金全.我國(guó)獨(dú)立董事制度的實(shí)證分析[J].財(cái)貿(mào)經(jīng)濟(jì),2002(9).
8、饒玉蕾,李永紅.獨(dú)立董事制度失效的博弈分析[J].湖南財(cái)經(jīng)高等??茖W(xué)校學(xué)報(bào),2003(5).
9、譚勁松.獨(dú)立董事與公司治理:基于我國(guó)上市公司的研究[M].中國(guó)財(cái)政經(jīng)濟(jì)出版社,2003.
關(guān)鍵詞:入行論;博弈論;思想;辯證
《入行論》全稱入菩薩行論,是印度那爛陀寺寂天菩薩[1]所著,所作年份不詳,該論典是是大乘佛教諸多典籍中較為重要的論著,正如索達(dá)吉堪布在《入行論廣釋》中說(shuō):“《入菩薩行論》是修學(xué)大乘佛法者不可缺少的論典。在藏傳佛教各派中,每一個(gè)正規(guī)寺院里的修行人,都會(huì)傳講聽(tīng)習(xí)此論;而且已形成一種普遍觀念,認(rèn)為如果要做真實(shí)的修行人,必須精通《入菩薩行論》 ”[1]。佛學(xué)中將論著分為四類:言簡(jiǎn)而義深、言繁而義淺、言簡(jiǎn)而義淺、言繁而義深。其中最佳的當(dāng)屬言簡(jiǎn)而義深的一類,而《入行論》正是屬于這一類論著,其中所闡述的內(nèi)容精辟而深刻,運(yùn)用了諸多比喻,系統(tǒng)的示解了大乘佛法修行者所要修行的步驟及方法。九世紀(jì)初,《入菩薩行》傳入藏地,歷代高僧大德廣泛弘揚(yáng),至今也留下了二十余部注疏,使其成為地區(qū)膾炙人口的一部寶典,也成為了藏傳佛教中修行者的必修論典。這部論典中所闡述的價(jià)值觀,也是佛教教育者們的價(jià)值觀,是以利他菩提心為主,不單講不能偷盜邪、要尊師重道、知禮義廉恥、回報(bào)社會(huì)、尊老愛(ài)幼,更甚者講到除人類外的所有有生之物,都要營(yíng)造無(wú)害、和諧,這種思想也就必然對(duì)后人起到了影響。
博弈論(Game theory)又稱之為對(duì)策論、游戲論,現(xiàn)在已發(fā)展成為現(xiàn)代數(shù)學(xué)的一個(gè)分支,被當(dāng)作運(yùn)籌學(xué)的一個(gè)重要研究對(duì)象和方法。1928年馮?諾依曼證明了博弈論的基本原理,從而宣告了博弈論的正式誕生。1944年,馮?諾依曼和摩根斯坦共著的劃時(shí)代巨著《博弈論與經(jīng)濟(jì)行為》,開(kāi)啟了博弈論思想的系統(tǒng)化研究浪潮。然而,這一論著并非最早提出博弈的著作,其實(shí)早在戰(zhàn)國(guó)時(shí)期,孫武所作的《孫子兵法》,可以說(shuō)是最早的一部講述博弈的著作。隨之便出現(xiàn)了諸多研究博弈,以博弈思想為基石創(chuàng)作諸多方方面面的著作,也成為了風(fēng)靡一時(shí)的青少年讀物,更甚者以此為自己的價(jià)值觀,出現(xiàn)了諸多效仿的事跡。但大風(fēng)大浪過(guò)后,回頭審視這一行徑,才恍然發(fā)現(xiàn)博弈論帶來(lái)的不完全只有利益,更多的是磨滅了傳統(tǒng)思想中正面和積極、人性化的部分,這點(diǎn)值得研究和考慮。
一、《入行論》所闡述的主要思想
《入行論》一書的創(chuàng)作背景具有特殊性和局限性,其特殊性表現(xiàn)在,它是作于一個(gè)佛法盛傳的那爛陀寺,而且作者又是一位得道修行者,其局限性在于作者是出家人,又置身寺院中,從科學(xué)理論的角度而言,是具有一定的局限性的。而論著中主要講大乘深觀和廣行法,主要以廣行法為主,講解如何修心、修行應(yīng)當(dāng)持有怎樣的心態(tài)等。這部論著分為十品,第一品講發(fā)菩提心的利益,第二品講懺悔罪業(yè),第三品講受持菩提心,這三品就是為了“未生者當(dāng)生”,沒(méi)有生起菩提心的令生起菩提心。第四品講不放逸,第五品講正知正見(jiàn),第六品講安忍,這三品是為了“已生勿退失”,相續(xù)中已經(jīng)產(chǎn)生了菩提心,但這也是很容易退轉(zhuǎn)的,這三品是為了令生起的菩提心不退轉(zhuǎn)。第七品講精進(jìn),第八品講靜慮(禪定),第九品講智慧品,第十品講回向品,這四品是講“輾轉(zhuǎn)益增長(zhǎng)”,為了已經(jīng)具有的菩提心能夠增長(zhǎng),甚至圓滿。整部《入行論》就是為了未生的菩提心能夠生起,已經(jīng)生起的不退失,而能夠增長(zhǎng)[2]。其中以諸多比喻形象而生動(dòng)的喻說(shuō)了善惡取舍,正如《入行論》中將人身比作過(guò)河之乘舟,將最終的和諧當(dāng)做彼岸,為得到這種人與人、人與自然的和諧而只為利他。
二、博弈論所涵蓋的主要思想
博弈思想簡(jiǎn)單概括就是二人在平等的對(duì)局中各自利用對(duì)方的策略變換自己的對(duì)抗策略,達(dá)到取勝的意義。也就是二人對(duì)局如何占優(yōu)。以博弈中的要素:參與者、各自的策略、得失(或者支付矩陣)、次序等達(dá)到均衡。理性的參與者為了使自己的利益最大或者損失最小并結(jié)合對(duì)方的處境等指導(dǎo)作出決策達(dá)到均衡。甚至犧牲他人的利益,將自己的利益最大化。
正如其中典型的海盜分金、囚徒困境等等舉例,大致將可以涵蓋和解釋其內(nèi)在的思想角度。在軍事戰(zhàn)略、游戲、統(tǒng)籌等學(xué)科,這一理論無(wú)疑是極具指導(dǎo)價(jià)值的,但在倫理人情中,尤其是東方文化中是否可行,這一論點(diǎn)值得探討和研究。
三、兩者的辯證關(guān)系
《入行論》的菩提思想與博弈思想,兩者即統(tǒng)一又對(duì)立,其統(tǒng)一點(diǎn)在于,兩者最終都是致力于求得最大的功利,這點(diǎn)是完全相同的。二者又有著對(duì)立的一面,因?yàn)槠刑嵝牟粌H為了今生得到功利,還致力于來(lái)世,所做一切都是為了得到和諧、善果,甚至為得到和諧不惜失去生命的大愛(ài)。而博弈論則不同在于它不承認(rèn)來(lái)世,所以只致力于眼前的現(xiàn)世今生,所求的是物質(zhì)上的利益,甚至是將自己的利益建立在別人的損失之上,甚至認(rèn)為任何別人的付出都是“有原因”的,極度機(jī)械化的價(jià)值觀,不利于處理倫理、友情等問(wèn)題,因?yàn)橛行r(shí)候人與動(dòng)物的區(qū)別正在于此,在于貢獻(xiàn)和無(wú)私付出,在于“利他”。
注釋:
[1]寂天菩薩:印度南方賢疆國(guó)王太子,原名寂鎧,出家來(lái)到那爛陀寺后,依當(dāng)時(shí)寺內(nèi)五百班智達(dá)之首的勝天為親教師出家,法名寂天。
參考文獻(xiàn):
[1] 索達(dá)吉堪布著. 《入行論廣釋》[Z] . 智悲佛網(wǎng)電子版記述.2013:2.
在我國(guó)旅游業(yè)高速發(fā)展的今天,作為旅游業(yè)的三大之柱之一的酒店業(yè)也取得了很大的成績(jī),但在發(fā)展的過(guò)程中也存在一些問(wèn)題,如各星級(jí)酒店發(fā)展的不平衡,酒店內(nèi)部管理體制問(wèn)題,基層員工的離職率較高等,本文以酒店業(yè)為背景,運(yùn)用了博弈論的基本原理,建立數(shù)學(xué)模型,應(yīng)用動(dòng)態(tài)博弈模型研究來(lái)員工與經(jīng)理的多階段博弈問(wèn)題,討論了酒店發(fā)展過(guò)程中的員工的離職問(wèn)題,談到了如何才能降低離職率,同時(shí)也給出了優(yōu)化酒店管理的合理化的建議。
一、模型中數(shù)據(jù)參數(shù)的假定
在酒店里,作為酒店的管理者,作為股東的人,他要對(duì)員工的日常工作情況進(jìn)行監(jiān)督和管理,下面是他和員工在工作中的一些參數(shù)的假定設(shè)置。
1.酒店經(jīng)理一旦進(jìn)行監(jiān)督就能發(fā)現(xiàn)酒店員工是否努力。2.假設(shè)酒店員工工作努力就不會(huì)離職,所以也無(wú)需考慮經(jīng)理是否會(huì)進(jìn)行教育,當(dāng)經(jīng)理不監(jiān)督時(shí)也不存在教育與離職的問(wèn)題,即沒(méi)有博弈樹(shù)下面的分支了。3.當(dāng)員工工作不努力時(shí),客人們可以能會(huì)將酒店員工的不努力行為擴(kuò)散給其他人,這樣酒店經(jīng)理的聲譽(yù)會(huì)損失,設(shè)為。4.經(jīng)理進(jìn)行酒店日常的管理工作,股東賦予他的管理經(jīng)費(fèi)為M,這也是工資的一部分,經(jīng)理的監(jiān)督成本,酒店員工的努力成本為,F(xiàn)為經(jīng)理不教育時(shí)對(duì)不努力的員工的罰金,(注意這里教育則不罰款了)假設(shè)員工離職向經(jīng)理交事先勞動(dòng)合同上的違約金為,這個(gè)可以對(duì)員工起到一定的約束作用。5.經(jīng)理不教育不努力員工時(shí),經(jīng)理教育不努力的員工時(shí),教育成本為J。經(jīng)理出于短期效益,對(duì)于不努力的員工,他希望罰款,而董事會(huì)的股東們則更希望他通過(guò)教育,讓他們接受愛(ài)崗敬業(yè),接受企業(yè)文化的教育,增強(qiáng)團(tuán)隊(duì)凝聚力,這有利于酒店長(zhǎng)遠(yuǎn)的發(fā)展,所以本節(jié)后面有一個(gè)股東對(duì)經(jīng)理的監(jiān)督與否的問(wèn)題。6.員工將要離職時(shí)對(duì)外界有個(gè)期望值R,當(dāng)期望高時(shí),對(duì)他是一種離職的誘因。7.當(dāng)員工工作不努力時(shí),經(jīng)理自身的聲譽(yù)損失為;經(jīng)理一旦監(jiān)督,發(fā)現(xiàn)了員工不努力時(shí),酒店員工聲譽(yù)損失為;員工努力時(shí),其聲譽(yù)得益為;當(dāng)經(jīng)理通過(guò)教育后員工不離職了,則經(jīng)理的聲譽(yù)損失為。這里要說(shuō)明一下,聲譽(yù)損失再這里主要表現(xiàn)的是一種量變關(guān)系,當(dāng)然我們也可以把賦予它一定的實(shí)際意義,比如經(jīng)理的聲譽(yù)損失可以在股東召開(kāi)股東大會(huì)在季度獎(jiǎng)、年終獎(jiǎng)時(shí)給予體現(xiàn),而員工聲譽(yù)損失、聲譽(yù)得益也可以由經(jīng)理對(duì)他的努力情況進(jìn)行評(píng)價(jià)后,在他的獎(jiǎng)金中設(shè)置給予一定的份額來(lái)體現(xiàn)。8.設(shè)經(jīng)理監(jiān)督的概率為,不監(jiān)督的概率為1-,員工工作努力的概率為,員工工作不努力的概率為1-,經(jīng)理不教育的概率為,經(jīng)理教育的概率為1-,員工離職的概率為,員工不離職的概率為1-。9.設(shè)最底層經(jīng)理與員工的期望收益分別為11、12,上一層經(jīng)理與員工的期望收益分別為21、22
該模型的博弈樹(shù)如圖1所示,樹(shù)中顯示了經(jīng)理與員工在多個(gè)階段的動(dòng)態(tài)博弈,根據(jù)假定條件與博弈樹(shù)可以確定圖1中各參與人在結(jié)點(diǎn)①-⑧的收益值,即有:
二、博弈模型的求解
采用逆向歸納法求此動(dòng)態(tài)博弈的均衡解,即從博弈樹(shù)的最低層開(kāi)始,組成考察每層的經(jīng)理與酒店員工的期望收益,具體過(guò)程如下:
1)從最底層考察酒店員工離職與經(jīng)理不教育的情況,分別求出酒店經(jīng)理與員工的期望收益,用11、12表示,涉及到?jīng)Q策點(diǎn)②、③、④、⑤
則這個(gè)階段經(jīng)理的期望收益
(1)
則員工的期望收益
(2)
對(duì)式(1)、(2)求一階求導(dǎo),并?。?/p>
從而得在這一階段二者的均衡解為
(3)
2)在討論了上面這個(gè)階段的情況后,再考察酒店員工是否努力及經(jīng)理是否監(jiān)督這一層次,涉及決策結(jié)點(diǎn)①、⑥、⑦、⑧,用21、22分別表示本階段經(jīng)理和酒店員工的期望收益。
本階段中,在決策點(diǎn)處
對(duì)于經(jīng)理
(4)
對(duì)于員工
(5)
對(duì)(4)、(5)求一階條件,并取
從而均衡解為:
(6)
三、對(duì)上述的均衡結(jié)果分析
上面通過(guò)數(shù)據(jù)的假定,求出了在各個(gè)階段經(jīng)理與員工之間的均衡策略,即最底層的考察酒店員工離職與經(jīng)理不教育的情況,分別求出酒店經(jīng)理與員工的期望收益,當(dāng)討論了上面這個(gè)階段的情況后,再考察酒店員工是否努力及經(jīng)理是否監(jiān)督這一層次,分別求出了本階段經(jīng)理和酒店員工的期望收益,然后依次求導(dǎo)后,得出了下面的均衡概率,下面對(duì)上述結(jié)果給予分析。
由上述求解過(guò)程可得模型的均衡解為:
(7)
1)均衡條件下為經(jīng)理監(jiān)督的概率,由可知:
①酒店員工努力成本C2越高,經(jīng)理監(jiān)督的概率越大,因?yàn)榫频陠T工的努力成本越高,酒店員工不努力的概率越大,因此經(jīng)理為促使酒店員工努力就需提高其監(jiān)督概率。
②酒店員工努力的聲譽(yù)得益越大,酒店員工努力可以得到承認(rèn),那么酒店員工越敬業(yè),即使經(jīng)理不監(jiān)督,酒店員工仍然努力,所以,此時(shí)經(jīng)理監(jiān)督的概率就越小。
③1*2越大,不努力酒店員工的損失越大,酒店員工為了避免這種損失就需要努力工作,在這種環(huán)境下,可降低其經(jīng)理監(jiān)督概率。
2)是酒店員工努力的概率,由可知:
①C1越大,越小,因?yàn)榻?jīng)理的監(jiān)督成本越高,造成經(jīng)理監(jiān)督概率越小,導(dǎo)致酒店員工越會(huì)降低其努力積極性。
②越大,這表明經(jīng)理在第一階段的收益越大,而這個(gè)收益與不努力酒店員工在這個(gè)階段的損失相關(guān),也就是說(shuō)越大時(shí)不努力酒店員工的損失越大,為了避免這種較大的損失,酒店員工努力的概率越大,即越大。
③M越大,股東賦予經(jīng)理的管理費(fèi)用越多,經(jīng)理越會(huì)加強(qiáng)監(jiān)督,執(zhí)行股東的想法,員工自然會(huì)努力工作了。
3)為經(jīng)理不教育不努力員工的概率,由可知:
①J越大,越大,當(dāng)教育不努力的員工成本太高時(shí),經(jīng)理顯然越不會(huì)去教育員工了,而會(huì)選擇罰款。②越大時(shí),越小,員工意識(shí)到不努力帶來(lái)的聲譽(yù)損失太大,有可能被解雇的危險(xiǎn),必然會(huì)努力工作,自然就不會(huì)發(fā)展到下一步需要經(jīng)理去罰款了。③R越大,越小,當(dāng)員工對(duì)外界有一個(gè)較大的期望時(shí),此時(shí)員工是最容易離職的,那么此時(shí)若經(jīng)理只是簡(jiǎn)單的罰款,只會(huì)加速員工的離職,因此只能是教育了,教育的概率加大了,不教育的概率變小了。④越大,越大,這是因?yàn)槲覀兛梢越柚竺婺P蛶?lái)的股東情況,當(dāng)員工因離職要交的違約金越多時(shí),員工因不愿意交這部分違約金,而會(huì)努力工作,則經(jīng)理高忱無(wú)憂,不教育的可能性是顯然增大了。
4)為酒店員工離職的概率,由可知:
關(guān)鍵詞:演化博弈;品牌;價(jià)值體驗(yàn);自主創(chuàng)新
中圖分類號(hào):F713.50 文獻(xiàn)標(biāo)識(shí):A 文章編號(hào):1674-9448 (2013) 04-0061-10
An Evolutionary Game Model about Independent Innovation Based on Experience of Brand Value
GUO Ben-hai1,2 LIU Si-feng2(1. School of Management, Jiangsu University, Jiangsu Zhenjiang 212013, China,2. School of Economics and Management, Nanjing University of Aeronautics and Astronautics, Jiangsu Nanjing 211100, China)
Abstract: From a market perspective, enterprise independent innovation must adhere to category innovation and brand strategy as the core, create new category different from competitors’ or even the opposite one and make consumers get more experience of brand value. This is not only the respect for the generalized virtual value demand, but also the mark of enterprise market success by independent innovation. The enterprise independent innovation based on brand value experience is a comprehensive system which Includes activities such as concept innovation, technology innovation and service innovation and so on. Whether enterprise will devote to this complicated and high-risk innovation activities not only depends on the interests of the enterprise itself, but also is affected by the policy environment and competitors. Facing the dilemma and incentives of enterprise brand building, the bounded rationality and incomplete information evolutionary game theory are applied to analyse the strategies and earnings of main game parties during the enterprise innovation process on brand value experience. An “enterprise-enterprise” and “enterprise-government” evolutionary game model is established to solve and seek evolutionary stable strategy.
Keywords: evolutionary game, erand, value experience, independent innovation
一、引 言
美國(guó)著名未來(lái)學(xué)家阿爾文?托夫勒曾指出,體驗(yàn)經(jīng)濟(jì)將逐漸成為繼農(nóng)業(yè)經(jīng)濟(jì)、工業(yè)經(jīng)濟(jì)、服務(wù)經(jīng)濟(jì)之后的一種經(jīng)濟(jì)形態(tài)[1]?,F(xiàn)時(shí)代經(jīng)濟(jì)社會(huì)生活與過(guò)去相比,發(fā)生的顯著變化是大批只具有虛擬價(jià)值的商品涌入商品大家族[2],虛擬價(jià)值在本質(zhì)上是社會(huì)心理需求對(duì)商品價(jià)值的再造[3]。作為經(jīng)濟(jì)活動(dòng)微觀主體的企業(yè),必須在提高提供顧客體驗(yàn)價(jià)值的過(guò)程中獲取競(jìng)爭(zhēng)優(yōu)勢(shì);以品牌價(jià)值體驗(yàn)為導(dǎo)向的自主創(chuàng)新活動(dòng),將會(huì)是企業(yè)發(fā)展的不竭動(dòng)力。中國(guó)企業(yè)之所以難出國(guó)際知名品牌,缺少的就是在消費(fèi)者心中的品牌價(jià)值認(rèn)知度;自主品牌產(chǎn)品少、品牌價(jià)值偏低,是我國(guó)企業(yè)自主品牌建設(shè)的基本現(xiàn)狀。提升消費(fèi)者的品牌價(jià)值體驗(yàn)度和認(rèn)知度,已經(jīng)成為擺在中國(guó)企業(yè)面前的當(dāng)務(wù)之急問(wèn)題。
理論界對(duì)自主知識(shí)產(chǎn)權(quán)品牌建設(shè)及演化博弈問(wèn)題做了多方面研究。張明立[4]從消費(fèi)者―品牌關(guān)系中的廣義虛擬價(jià)值角度探索品牌形象對(duì)品牌忠誠(chéng)的作用機(jī)制;劉明珍 [5]通過(guò)數(shù)據(jù)研究方法,提出從內(nèi)在機(jī)制、建立法規(guī)、統(tǒng)一內(nèi)外資企業(yè)所得稅等方面支持我國(guó)企業(yè)自主知識(shí)產(chǎn)權(quán)產(chǎn)品發(fā)展的政策建議;黃永春,楊晨 [6]以品牌競(jìng)爭(zhēng)理論為基礎(chǔ),從外顯性與潛力性構(gòu)面探究了企業(yè)自主知識(shí)產(chǎn)權(quán)名牌競(jìng)爭(zhēng)力的構(gòu)成要素;范秀成 [7]從服務(wù)的過(guò)程屬性出發(fā),闡述了服務(wù)企業(yè)品牌建設(shè)的焦點(diǎn)應(yīng)該是顧客體驗(yàn),并提出通過(guò)塑造顧客體驗(yàn)來(lái)創(chuàng)建服務(wù)品牌的策略。
對(duì)演化博弈論發(fā)展具有開(kāi)創(chuàng)性貢獻(xiàn)的是 Smith [8]與Price [9],他們提出的“演化穩(wěn)定策略”成為演化博弈論的基本概。近年來(lái),演化博弈研究出現(xiàn)了一些新動(dòng)向。如L.A. Bach,T.Helvikc,F(xiàn).B.Christiansen [10]研究了演化穩(wěn)定策略(ESS)的分歧問(wèn)題;David K. Levine,Wolfgang Pesendorfer [11]對(duì)有一方模仿情況下的合作演化博弈問(wèn)題進(jìn)行了相關(guān)研究;韓少春等 [12]在演化博弈論的基礎(chǔ)上,分析輿論傳播的羊群效應(yīng)問(wèn)題。在演化博弈應(yīng)用領(lǐng)域,郭本海、方志耕 [13]運(yùn)用演化博弈的基本原理,分析了中國(guó)節(jié)能政策實(shí)施中中央與地方的演化博弈策略,提出“中央―地方”演化博弈的三個(gè)階段;阮愛(ài)清、劉思峰 [14]運(yùn)用演化博弈模型分析了產(chǎn)業(yè)集群的種子、核和集群三種狀態(tài)及不同階段的收益狀況,建立了產(chǎn)業(yè)集群成長(zhǎng)的演化模型;周德群 [15]基于非對(duì)稱主體的進(jìn)化博弈方法,探討了不同規(guī)模的企業(yè)在新興產(chǎn)業(yè)進(jìn)入問(wèn)題上的對(duì)策;謝非 [16]應(yīng)用進(jìn)化博弈論的方法從風(fēng)險(xiǎn)投資者和風(fēng)險(xiǎn)企業(yè)的角度,結(jié)合風(fēng)險(xiǎn)資本的時(shí)間價(jià)值,對(duì)風(fēng)險(xiǎn)投資退出方式進(jìn)行了研究;劉偉兵、王先甲 [17]將強(qiáng)化學(xué)習(xí)引入到進(jìn)化博弈中,建立了進(jìn)化博弈中的多人強(qiáng)化學(xué)習(xí)模型。
本文在已有研究基礎(chǔ)上,從顧客的品牌價(jià)值體驗(yàn)入手,分析企業(yè)創(chuàng)新過(guò)程中各方利益主體的博弈關(guān)系以及品牌價(jià)值體驗(yàn)與企業(yè)自主創(chuàng)新的作用機(jī)理;構(gòu)建了“企業(yè)―企業(yè)”及“企業(yè)―政府”為博弈雙方、以提升品牌價(jià)值體驗(yàn)為基本目的的自主創(chuàng)新演化博弈模型,通過(guò)模型求解,闡釋各方主體的演化穩(wěn)定策略。
二、提升品牌價(jià)值體驗(yàn)的自主創(chuàng)新博弈關(guān)系分析
演化博弈理論源于生物進(jìn)化論,其基本思想是,在具有一定規(guī)模的博弈群體中,博弈方進(jìn)行著反復(fù)的博弈活動(dòng);相對(duì)于靜態(tài)均衡和比較靜態(tài)均衡,演化博弈強(qiáng)調(diào)動(dòng)態(tài)均衡。演化博弈以有限理性和學(xué)習(xí)能力代替了傳統(tǒng)博弈論關(guān)于主體完全理性的假定, 即博弈雙方不可能在每一次博弈中都能找到最優(yōu)的均衡點(diǎn);演化博弈以一種動(dòng)態(tài)的框架來(lái)分析系統(tǒng)均衡及達(dá)到均衡的過(guò)程,從而更準(zhǔn)確地描述系統(tǒng)的發(fā)展變化。演化博弈的核心概念是“演化穩(wěn)定策略”( Evolutionary Stable Strategy, ESS ) 和“復(fù)制動(dòng)態(tài)”(Replicator Dynamics)。
以提升顧客品牌價(jià)值體驗(yàn)為根本訴求的企業(yè)自主創(chuàng)新活動(dòng),既要考慮到創(chuàng)新的不確定性、外部經(jīng)濟(jì)性等風(fēng)險(xiǎn),又要深度理解并充分尊重市場(chǎng)需求,這個(gè)過(guò)程實(shí)際上是不同企業(yè)、政府部門、消費(fèi)者和社會(huì)公眾等主體間的復(fù)雜博弈。其中,不同企業(yè)的策略選擇、政府的政策設(shè)計(jì)與選擇將在很大程度上影響著博弈態(tài)勢(shì),企業(yè)與企業(yè)之間、企業(yè)與政府之間的博弈占據(jù)主導(dǎo)地位。在不同的政策體系下,各方博弈主體的收益預(yù)期會(huì)有所不同,相應(yīng)的博弈策略也不斷調(diào)整。一方面,企業(yè)將根據(jù)政策特點(diǎn)及競(jìng)爭(zhēng)對(duì)手的策略采取相應(yīng)的行動(dòng),決定是否全力置身于自主創(chuàng)新和自主品牌建設(shè);或者根據(jù)已選擇的創(chuàng)新模式以及政府的政策作用效力估測(cè)收益趨勢(shì),對(duì)已有創(chuàng)新模式做出相應(yīng)調(diào)整。另一方面,政府根據(jù)政策執(zhí)行的情況評(píng)估政策效力、判斷品牌建設(shè)未來(lái)發(fā)展趨勢(shì),并對(duì)現(xiàn)有政策做出相應(yīng)的調(diào)整。
(一)損益變量選取
(1)影響企業(yè)自主創(chuàng)新的損益變量
初始收益M:企業(yè)在不創(chuàng)新且不“搭便車”情況下所獲得的經(jīng)營(yíng)利潤(rùn);
自主創(chuàng)新邊際收益V:企業(yè)因自主創(chuàng)新而獲得的直接收益;
自主創(chuàng)新衍生收益E0:企業(yè)因自主創(chuàng)新而獲得的間接收益;
創(chuàng)新基礎(chǔ)設(shè)施投入G:政府在創(chuàng)新基礎(chǔ)設(shè)施建設(shè)上的投入,以減輕企業(yè)基礎(chǔ)性成本負(fù)擔(dān);
“搭便車”收益E:不從事創(chuàng)新的企業(yè)“搭便車”獲得包括初始受益在內(nèi)的收入,令 ,E=M+ηV;η∈(0,1);
創(chuàng)新直接成本I0:企業(yè)自主創(chuàng)新所發(fā)生的直接支出;
“搭便車”成本H:不從事創(chuàng)新的企業(yè)“搭便車”所產(chǎn)生的必要費(fèi)用;
懲罰費(fèi)用C0:“搭便車”可能被查處而遭受的懲罰,令C0=βI(β為懲罰系數(shù),I為從事創(chuàng)新的企業(yè)在某個(gè)方面的創(chuàng)新投入);
(一)損益變量選取
1.影響企業(yè)申請(qǐng)知識(shí)產(chǎn)權(quán)保護(hù)的損益變量
初始收益M:企業(yè)在不創(chuàng)新且不“搭便車”情況下所獲得的經(jīng)營(yíng)利潤(rùn);
自主創(chuàng)新邊際收益V:企業(yè)因自主創(chuàng)新而獲得的直接收益;
品牌溢出價(jià)值B0:自主創(chuàng)新提高了產(chǎn)品知名度和品牌價(jià)值體驗(yàn)度,企業(yè)因此而獲利,可令B0=λM0=λ(M+V)0,λ為品牌價(jià)值溢出率,λ∈(0,1);
讓渡收益O:企業(yè)通過(guò)知識(shí)產(chǎn)權(quán)買賣、轉(zhuǎn)讓而獲得的收益;
政府激勵(lì)G0:企業(yè)積極申請(qǐng)知識(shí)產(chǎn)權(quán)保護(hù)而獲得的來(lái)自政府的獎(jiǎng)勵(lì)收益;
賠償收益P:申請(qǐng)了知識(shí)產(chǎn)權(quán)保護(hù)的企業(yè)獲得的來(lái)自“搭便車”侵權(quán)企業(yè)的賠償;
保護(hù)成本K:企業(yè)實(shí)施知識(shí)產(chǎn)權(quán)保護(hù)產(chǎn)生的成本費(fèi)用;
知識(shí)產(chǎn)權(quán)溢出損失B1:因企業(yè)不申請(qǐng)知識(shí)產(chǎn)權(quán)保護(hù)或政府不監(jiān)督,企業(yè)被侵權(quán)而導(dǎo)致利潤(rùn)減少;
品牌價(jià)值折損B2:因企業(yè)品牌建設(shè)不力或政府監(jiān)督弱化,品牌價(jià)值折損導(dǎo)致企業(yè)收益相應(yīng)減少。
2.影響政府監(jiān)督的損益變量
行政收費(fèi)Y:政府向申請(qǐng)知識(shí)產(chǎn)權(quán)保護(hù)的企業(yè)收取的費(fèi)用;
衍生收益W:政府因在知識(shí)產(chǎn)權(quán)保護(hù)上的有力作為(監(jiān)督)而無(wú)形收益,如政府形象及區(qū)域形象改進(jìn)等;
罰沒(méi)收入P:政府依法對(duì)“搭便車”企業(yè)實(shí)施罰沒(méi)懲戒而獲得的收益;
獎(jiǎng)勵(lì)支出G0:政府對(duì)積極申請(qǐng)知識(shí)產(chǎn)權(quán)保護(hù)的企業(yè)給予的獎(jiǎng)勵(lì);
監(jiān)督成本C:政府實(shí)施監(jiān)督過(guò)程中消耗的人、財(cái)、物成本;
衍生損失W’:政府因在知識(shí)產(chǎn)權(quán)保護(hù)上不作為可能帶來(lái)的負(fù)面影響,如區(qū)域形象受損、投資環(huán)境質(zhì)量下降等。
(二)收益函數(shù)構(gòu)建
1.支付函數(shù)構(gòu)建
假定:政府知識(shí)產(chǎn)權(quán)保護(hù)上采取“監(jiān)督”策略的概率為p,則不監(jiān)督(或監(jiān)督力度不力)的概率為(1-p);企業(yè)申請(qǐng)知識(shí)產(chǎn)權(quán)保護(hù)的概率為q,則不申請(qǐng)知識(shí)產(chǎn)權(quán)保護(hù)的概率為(1-q)。令企業(yè)申請(qǐng)知識(shí)產(chǎn)權(quán)保護(hù)的情形為F1,不申請(qǐng)知識(shí)產(chǎn)權(quán)保護(hù)的情形為F2;政府部門進(jìn)行監(jiān)督的情形為G1,不進(jìn)行監(jiān)督的情形為G2。雙方的收益矩陣如表2所示。
五、結(jié)束語(yǔ)
解決我國(guó)企業(yè)自主品牌產(chǎn)品少、品牌價(jià)值偏低的問(wèn)題,是一個(gè)系統(tǒng)工程,企業(yè)、政府、消費(fèi)者以及社會(huì)公眾皆在其中扮演著重要角色;以企業(yè)為基本主體、以政府為重要推動(dòng)力量、以提高顧客品牌價(jià)值體驗(yàn)程度為根本訴求的自主創(chuàng)新,是解決這一系統(tǒng)性問(wèn)題的關(guān)鍵。 圍繞這一問(wèn)題而展開(kāi)的“企業(yè)-企業(yè)”間及“企業(yè)-政府”間演化博弈,實(shí)質(zhì)上是有效構(gòu)建科學(xué)調(diào)控機(jī)制,促使具有競(jìng)合關(guān)系的不同企業(yè)與政府一起構(gòu)成策略互動(dòng)體,以演化穩(wěn)定策略順利推進(jìn)基于品牌價(jià)值體驗(yàn)的企業(yè)自主創(chuàng)新活動(dòng)。
參考文獻(xiàn):
[1] 阿爾文?托夫勒著.未來(lái)的沖擊[M].蔡伸章譯.北京:中信出版社, 2006.
[2] 林左鳴.虛擬價(jià)值的人類活動(dòng)論依據(jù)[J].北京大學(xué)學(xué)報(bào)(哲學(xué)社科版),2006(2):43-50.
[3] 吳秀生.虛擬價(jià)值:價(jià)值規(guī)律的新視野[J].廣義虛擬經(jīng)濟(jì),2011(4):36-45.
[4] 張明立,任淑霞,王偉.基于廣義虛擬價(jià)值的品牌形象對(duì)品牌忠誠(chéng)影響機(jī)制研究[J].廣義虛擬經(jīng)濟(jì)研究,2011(3):38-46.
[5] 劉明珍.中國(guó)企業(yè)自主知識(shí)產(chǎn)權(quán)和知名品牌發(fā)展研究[J].中國(guó)軟科學(xué),2006(3):123-130.
[6] 黃永春,楊晨.企業(yè)自主知識(shí)產(chǎn)權(quán)品牌的競(jìng)爭(zhēng)效應(yīng)的理論分析[J].科技管理研究,2007(4):27-33.
[7] 范秀成.顧客體驗(yàn)驅(qū)動(dòng)的服務(wù)品牌建設(shè)[J].南開(kāi)管理評(píng)論,2001(6):123-131.
[8] Maynard Smith J. The Theory of Games and the Evolution of Animal Conflict[J].Journal of Theory Biology,1973, (47).
[9] Maynard Smith J, Price G R. The Logic of Animal Conflicts [J]. Nature, 1974 (246):15-18.
[10] L.A. Bach, T. Helvikc, F.B.Christiansen. The evolution of n-player cooperation-threshold games and ESS bifurcations [J].Journal of Theoretical Biology,2006, 238.
[11] David K. Levine, Wolfgang Pesendorfer. The evolution of cooperation through imitation [J]. Games and Economic Behavior,2007,58.
[12] 韓少春,劉云,張彥超 等.基于動(dòng)態(tài)演化博弈論的輿論傳播羊群效應(yīng)[J].系統(tǒng)工程學(xué)報(bào), 2011(2):275-281
[13] GUO Benhai, FANG Zhigeng.A study of evolutionary game between central government and the local in energy conservation policy implementation[C]. 2011 IEEE International Conference, 2011(9):874-879.
[14] 阮愛(ài)清,劉思峰.基于進(jìn)化博弈模型的產(chǎn)業(yè)集群成長(zhǎng)研究[J].科學(xué)學(xué)與科學(xué)技術(shù)管理, 2008(2):91-95.
[15] 許肖瑜,周德群.基于進(jìn)化博弈的新興產(chǎn)業(yè)進(jìn)入問(wèn)題研究[J].技術(shù)與創(chuàng)新管理, 2008(11):600―606.
[關(guān)鍵詞]博弈論;理性人假定;公共知識(shí);社會(huì)科學(xué)方法論
[中圖分類號(hào)]C3
[文獻(xiàn)標(biāo)識(shí)碼]A
[文章編號(hào)]1671-511X(2012)04-0020-03
博弈論是研究理性人的互動(dòng)的理論,或者說(shuō)研究交互決策的理論。1928年,馮·諾依曼證明了博弈論的基本原理,宣告了博弈論的正式誕生。1944年,馮·諾依曼和摩根斯坦合著的《博弈論與經(jīng)濟(jì)行為》將二人博弈推廣到n人博弈結(jié)構(gòu)并將博弈論系統(tǒng)應(yīng)用于經(jīng)濟(jì)領(lǐng)域,奠定了這一學(xué)科的基礎(chǔ)和理論體系。1950-1951年,約翰·納什利用不動(dòng)點(diǎn)定理證明了均衡點(diǎn)的存在,為博弈論的一般化奠定了堅(jiān)定的基礎(chǔ)。塞爾頓、哈桑尼、謝林、奧曼等人的研究也大大推動(dòng)了博弈論的發(fā)展。因此,盡管博弈論是一門新生的學(xué)科,但是它今天已經(jīng)發(fā)展成為有較完善的理論體系的科學(xué)。
今天,博弈論已經(jīng)成為社會(huì)科學(xué)的通用方法論。盡管它是演繹科學(xué),對(duì)社會(huì)現(xiàn)象有強(qiáng)大的解釋力,然而,由于其理想主體的假定使得其演繹出的理論解與實(shí)際博弈結(jié)果存在差異。許多實(shí)驗(yàn)經(jīng)濟(jì)學(xué)家通過(guò)博弈實(shí)驗(yàn)研究實(shí)際中人們的博弈過(guò)程,分析博弈論的演繹解與博弈實(shí)驗(yàn)結(jié)果之間的差異。如2002年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)就頒發(fā)給了丹尼爾·卡尼曼和邁農(nóng)·史密斯,他們是實(shí)驗(yàn)經(jīng)濟(jì)學(xué)的先驅(qū)。今天在西方學(xué)術(shù)界通過(guò)實(shí)驗(yàn)來(lái)驗(yàn)證博弈的理論結(jié)果已經(jīng)成為一種潮流。本文下面設(shè)計(jì)并進(jìn)行了一個(gè)博弈實(shí)驗(yàn),通過(guò)分析實(shí)驗(yàn)結(jié)果與理論解的差異,分析博弈論作為社會(huì)科學(xué)方法論的局限性,并提出改進(jìn)的可能路徑。
一、博弈實(shí)驗(yàn)及結(jié)果分析
1 實(shí)驗(yàn)描述
我們?cè)O(shè)計(jì)了如下的一個(gè)博弈實(shí)驗(yàn)。該實(shí)驗(yàn)的參與人是南京大學(xué)選修文化素質(zhì)課“邏輯與科學(xué)方法基礎(chǔ)”的大學(xué)生,他們是二三年級(jí)的學(xué)生,文理科學(xué)生均有。
該實(shí)驗(yàn)是以試題的形式進(jìn)行的,該試題作為期末試卷中的最后一道題。該題目為:
在0-100之間選擇一個(gè)數(shù)字,規(guī)則是:若你選擇的數(shù)字“是或最接近”在座同學(xué)所選擇的數(shù)字的平均數(shù)的2/3(即在座同學(xué)所選數(shù)的總和除以總?cè)藬?shù)之后所得數(shù)字的2/3,如:若平均數(shù)為90,你應(yīng)當(dāng)選2/3×90=60),你將獲勝。請(qǐng)給出你選擇的理由。
實(shí)驗(yàn)說(shuō)明:
(1)實(shí)驗(yàn)參與者即參加考試的學(xué)生,事前不知道這是一個(gè)實(shí)驗(yàn);
(2)該課程教師以講座的形式給實(shí)驗(yàn)參與者傳授過(guò)博弈論知識(shí),但沒(méi)有提到所進(jìn)行的博弈;
(3)因?yàn)椋?),他們中的大多數(shù)掌握“博弈”、“公共知識(shí)”等概念;
(4)試卷是保密的,沒(méi)有任何學(xué)生預(yù)先知道考試內(nèi)容,考試過(guò)程中學(xué)生間無(wú)任何交流;
(5)該博弈的理論解(即納什均衡)為0或1。
2 實(shí)驗(yàn)結(jié)果
對(duì)于考試中的每個(gè)學(xué)生,在這個(gè)博弈實(shí)驗(yàn)中他能夠獲勝的關(guān)鍵是,他要準(zhǔn)確猜測(cè)他人是如何選擇的,一旦他猜測(cè)正確,他將他猜測(cè)的平均數(shù)乘以2/3便是獲勝答案。
共有176人參加了考試。排除掉5個(gè)不明確的選擇,供分析的實(shí)際選擇數(shù)為171個(gè)(其中3個(gè)選擇非整數(shù))。實(shí)驗(yàn)結(jié)果為(按照數(shù)字大小排序):
“0”:46人;“1”:14人;“5”:1人;“9”:1人;“10”:4人;“12”:1人;“15”:3人;“20”:3人;“22”:18人;“22.44”:1人;“24”:1人;“25”:3人;“28”:2人;“29”:1人;“30”:4人;“32”:2人;“33”:24人;“100/3”:1人;“34”:4人;“35”:1人;“36”:2人;“38”:3人;“39”:1人;“40”:6人;“43”:1人;“44”:5人,“45”:3人;“47”:1人;“50”:3人;“58”:1人;“59”:1人;“60”:2人;“66”:1人;“67”:3人;“”:1人;“72”:1人;“75”:1人。
3 結(jié)果分析
在這些所選擇的數(shù)字中,最大的數(shù)字為75,最小的數(shù)字為0。171個(gè)數(shù)字相加后的平均數(shù)為21.91,本博弈勝出解:21.84×2/3=14.61。
這個(gè)博弈中,0和1是均衡解(下一部分將分析),它們是“理論解”。在該實(shí)驗(yàn)中,0是所選最多的數(shù)字,共有46人選擇,比例為26.9%;選1的為14人,比例為8.2%。兩者相加共有60人,比例為35.1%。
從上述數(shù)據(jù)可以看出,在這場(chǎng)博弈中,“實(shí)驗(yàn)解”為14.61,最接近該數(shù)的是14或15,這和“理論解”的“0”或“1”不同。在本實(shí)驗(yàn)中,沒(méi)有人選擇14,而選擇15的有3人,這3人是該實(shí)驗(yàn)的勝出者。
若按照區(qū)間來(lái)統(tǒng)計(jì),實(shí)驗(yàn)結(jié)果的分布情況見(jiàn)表1。本博弈實(shí)驗(yàn)的“實(shí)驗(yàn)解”14.61落在11-20之間。若我們把11-20看成是勝出區(qū)間,則有7人勝出。
對(duì)于這些選擇,有以下值得注意的幾點(diǎn):
第一,67以上的選擇都是不理性的,因?yàn)閰⒓涌荚嚨膶W(xué)生數(shù)為150-200之間,這是公共知識(shí),即使所有的學(xué)生都選擇100,勝出的數(shù)字都不會(huì)超過(guò)67。但是還有3位學(xué)生選擇了大于67的數(shù)字,其中選擇的最大數(shù)為75。他們?cè)诮o出這些選擇時(shí)沒(méi)有給出理由。
第二,分析學(xué)生所給出這些選擇的理由,可以看出,絕大部分選擇者在進(jìn)行他們的選擇時(shí)考慮到了他人的選擇以及他人的推理。不同的人對(duì)他人的假定不同,所進(jìn)行推理的步驟也不同。如選擇67的學(xué)生假定了他人都選擇100,因而選擇67是最優(yōu)選擇;再比如選擇30-40之間的數(shù)字的同學(xué),其理由大體上有兩個(gè):或者認(rèn)為平均數(shù)集中在50-60之間,其2/3就集中在35-40之間;或者認(rèn)為都選100的話,66.7是最優(yōu)選擇,都選擇66.7的話,44是最優(yōu)選擇,而都選44的話,33是最優(yōu)選擇。
第三,有三個(gè)區(qū)間處的選擇比例較高:0-10間為38.6%,21-30間為17.6%,31-40間為25.7%。從所給理由可看出,不同區(qū)間的選擇者考慮群體的互動(dòng)推理的步驟存在差別,如0-10區(qū)間的選擇者考慮他人的推理步驟比31-40區(qū)間的選擇者多些。
第四,值得注意的是,11-20區(qū)間里的選擇較少(事實(shí)上是,在這個(gè)博弈中所選擇的數(shù)字落在這個(gè)區(qū)間是最有可能勝出的)。原因可能是,一旦選擇者進(jìn)行了多步的互動(dòng)推理,他們便能夠?qū)⑦@樣的推理進(jìn)行下去,從而將選擇向理論解0或1靠近。
第五,有一些“智慧的”選擇者,他們知道理論解,但他們知道存在不完全理性的選擇,因而他們沒(méi)有選擇理論解。盡管他們的選擇沒(méi)有勝出,他們的推理是有智慧的。這里,本文選擇了其中2個(gè)。一位選擇22的學(xué)生是這樣給出他所選擇的理由的:“作為理性人,我不會(huì)選擇大于2/3×100的數(shù),因?yàn)榧词顾腥硕歼x擇最大數(shù),平均數(shù)的2/3也不會(huì)超過(guò)2/3×100。如果大家和我一樣理智,那么大家都不會(huì)選擇大于2/3×100,那么我不會(huì)選擇大于100×2/3×2/3。因?yàn)樗麄冞x擇最大的他們可能會(huì)選的數(shù),平均數(shù)的2/3也不會(huì)超過(guò)2/3×2/3×100。依此類推,如果全班都充分理智,那么全班最終都會(huì)選擇1,然而我不認(rèn)為班里的人都是足夠理智,故平均數(shù)的2/3會(huì)大于1。根據(jù)兩次游戲,平均數(shù)的2/3在20~30。如果是我,我會(huì)選擇靠近20的數(shù),那我就22吧?!币粋€(gè)選擇10的學(xué)生的理由是:“如果其他人都是隨機(jī)選擇,那么平均數(shù)最后可能接近于50,50×2/3≈33。但是,如果所有人都選擇接近33的數(shù),那么33為平均數(shù),33×2/3≈22……如此推理應(yīng)該為1。但是并非所有人均是理性、均會(huì)如此計(jì)算。我對(duì)南大有信心,所以,我將數(shù)字選得接近1一點(diǎn),選10?!?/p>
第六,有一些選擇是沒(méi)有考慮到他人的選擇。如有這樣一些理由:“大家都認(rèn)為60是及格分,所以我選擇59”,“58是我的幸運(yùn)數(shù)字”,等等。
二、博弈的理論解分析
本實(shí)驗(yàn)是一個(gè)多人完全信息靜態(tài)博弈:參與者同時(shí)選擇行動(dòng),然后根據(jù)所有參與者的選擇,每個(gè)參與者得到各自的結(jié)果,每一參與者的收益函數(shù)在所有參與者之間是公共知識(shí)。
在這個(gè)實(shí)驗(yàn)中,參加考試的176位學(xué)生是參與者,每個(gè)考生同時(shí)對(duì)0-100之間的數(shù)字進(jìn)行選擇行動(dòng),即每個(gè)參與者的策略空間Si∈(0,100),即有101種可能的策略。根據(jù)所有考生的選擇,每個(gè)考生最后得出自己的結(jié)果,對(duì)每個(gè)考生來(lái)說(shuō),結(jié)果無(wú)非就是,自己的選擇是“大家所選數(shù)字的平均數(shù)的2/3”,勝出;要么與“大家所選數(shù)字的平均數(shù)的2/3”不一致,失敗。
我們假定該博弈的參與人都是絕對(duì)理性人(事實(shí)上,這個(gè)要求在實(shí)際中難以達(dá)到,這也是本文要得到的一個(gè)結(jié)論)。
我們來(lái)分析絕對(duì)理性人的推理過(guò)程。
在這個(gè)博弈中策略組合有176×101種,每種策略組合下,每個(gè)人的收益是公共知識(shí)。如:如所有人都選100,平均數(shù)為100,此時(shí)每人都失敗,勝出結(jié)果是100×2/3=67;如175人都選100,有一個(gè)人選擇了67,那么選100的人失敗,而選擇67的人勝出……所以這些是理性參與人的公共知識(shí)。
我們看到,任何人都不應(yīng)該選67或以上,或者選擇67或以上是非理性的,因?yàn)樗x擇的數(shù)字的最大平均數(shù)為100,此時(shí)勝出的數(shù)字為67,因此選擇67以上而獲勝的可能性是沒(méi)有。因此,作為理性人他們都不會(huì)選擇67或以上。
每個(gè)人都不會(huì)選擇67或以上,這本身也是公共知識(shí)。在這樣的公共知識(shí)的前提下,45以上的選擇都是不合理的,因?yàn)閷?duì)每個(gè)人而言,只有在他人都選擇67以上,我選擇45或以上才是合理的(67的2/3約為45)。
每個(gè)人都不會(huì)選擇45或以上,這本身也是公共知識(shí)。于是,每個(gè)人都認(rèn)為不應(yīng)該選擇30或以上。
……
結(jié)論是:每個(gè)人選擇0或1是合理的,它們是該博弈的理論解。
事實(shí)上,每個(gè)人選擇0或都選擇1是納什均衡:對(duì)每個(gè)人而言,在其他人不改變選擇的情況下,當(dāng)下的選擇是最優(yōu)的。
在所有人均選擇0的情況下,因?yàn)閷?duì)于每個(gè)人而言,若所有人都選擇0的話,0便成為平均數(shù),該數(shù)的2/3還是0。這樣,他選擇0是最優(yōu)選擇:在他人不改變選擇的情況下,他改變選擇將失敗。因此這點(diǎn)構(gòu)成納什均衡。
在所有人均選擇1的情況下,同樣,對(duì)于每個(gè)人而言,在其他人選擇1的情況下,平均數(shù)1的2/3為0.67,此時(shí)1最接近該數(shù)。因此,他選擇1是最優(yōu)選擇,并且若他改變了他的選擇他將失敗。因此,這點(diǎn)也構(gòu)成納什均衡。
當(dāng)然,面對(duì)多個(gè)納什均衡,作為理性的參與人作何選擇才能勝出呢?具體到這個(gè)博弈中,每個(gè)人要考慮的是,他選擇0還是選擇1才能勝出呢?
他會(huì)這樣思考:沒(méi)有理由認(rèn)為其中一個(gè)比另外一個(gè)更有可能勝出,這樣,選擇0或1勝出的概率為50%,但是,他人能夠與我有同樣的想法。既然如此,期望平均數(shù)應(yīng)該為0.5×1+0.5×0=0.5。于是,0.5的2/3接近0。因此,選擇0是最優(yōu)選擇。
從上面的分析可見(jiàn),盡管0和1是納什均衡點(diǎn),但選擇。是最優(yōu)選擇。
三、改進(jìn)博弈論的可能路徑
本文已經(jīng)表明,上述博弈是一個(gè)完全信息靜態(tài)博弈,然而,本實(shí)驗(yàn)的實(shí)驗(yàn)解(14.61)與理論解(0或1)之間發(fā)生偏離。本文認(rèn)為,有兩個(gè)主要原因:
第一,博弈論中所假定的理想主體與實(shí)際中的決策主體不相符合。理想的博弈參與人是絕對(duì)理性人;他們能夠進(jìn)行任何有窮步驟的推理,能夠分析所有有窮可能的情況,并且他們的推理、分析是在瞬時(shí)完成的,而實(shí)際博弈中人們是有界理性的。在我們的博弈實(shí)驗(yàn)中若參與者是理想主體,他們能夠做本文上一部分那樣的分析,他們應(yīng)當(dāng)知道0和1是均衡解,也能夠預(yù)測(cè)O是最有可能實(shí)現(xiàn)的結(jié)果。本實(shí)驗(yàn)表明,并不是所有人都能夠做出這樣分析的。并且,在實(shí)際中存在完全非理性的選擇,如本實(shí)驗(yàn)中選擇大于67的3人,這不是完全偶然現(xiàn)象。