博弈论的研究特点十篇

发布时间：2024-04-29 16:50:56

博弈论的研究特点篇1

关键词：博弈论；博弈实验；局限性；方法论意义

中图分类号：B017文献标识码：a文章编号：1006-723X（2013）03-0024-05

一、博弈实验的历史发展

博弈论是研究理性人互动的理论，或者说是交互决策的理论。其最初的思想产生于20世纪初，而真正获得发展是在50年代以后。从1928年冯·诺依曼证明博弈论的基本原理，宣告其正式诞生至今，博弈论已发展成为一门具有较完善的理论体系的具有工具性质的演绎性学科，对社会、经济等诸多现象都具有强大的解释力。正是由于博弈论这种“解析性的”强大解释力，往往又被普通大众神圣化为万能药方，似乎它应该也可以解决所有的理论映射到的决策问题。然而现实中它的预测结果和现实情况有很大的差别，这使人对博弈论产生了质疑。博弈论学者们为了解释和解决这个问题，做了一系列的研究，其中实验是最重要的研究方法。

最早的博弈实验产生于经济学实验。而最早的真正意义上的博弈实验则产生于20世纪50年代。1950年，约翰·纳什（Johnnash）利用不动点定理证明了均衡点的存在，并将博弈论引进议价行为模型，进行了纯议价博弈实验。1951年，莫斯特勒（mosteller）和挪杰（nogee）用实验研究了在不确定条件下的个人偏好（选择）问题。1952年，美尔文·爵烁和莫莱尔·弗莱尔（melvinDresherandmerrillFlood）进行了著名的“囚徒困境”实验。1957年，托马斯·谢林（thomasSchelling）进行了信息对称下的博弈实验，发现暗示可能产生明显的在协商中起重要作用的因素。

20世纪60年代，Suppesandarkigson（1960）进行了一系列的实验。他们的实验不是直接去检验博弈论假定，而是进行关于策略环境的研究，以验证在博弈情形下简单学习理论的预期力量。其中，比较有代表性的是1962年拉弗（Lave）、1965年拉伯帕特（Rapuport）和查姆（Chammab）进行的实验。拉弗等人的实验研究发现，在“囚徒困境”的一次性实验（非重复性实验）中，存在一定程度合作的稳定性，而且这种合作稳定性的概率在大于0与小于100%之间。事实上，很多实验是被用来解析对合作稳定性产生影响的因素的。

20世纪70年代，博弈论本身继续发展。而进入20世纪80年代之后，实验博弈论自身开始慢慢得到更多研究者的重视。这一时期，考尔曼（a·Coleman）则对一次性“囚徒困境”博弈的实验提出质疑，认为许多被人们当作一次性博弈进行分析的实验，实际上都是各种类型的重复性博弈（非一次性博弈），但在具体分析时却被人们用一次性博弈的规则来解释有关问题。因此，考尔曼曾于1983年列举了多达1500项实验工作，结果是多数情况下证实了纳什均衡策略行为的存在，尤其是单一纳什均衡在单阶段标准型博弈中的解释力量。

20世纪90年代，对公共地悲剧博弈的实验研究得到实质发展。1990年，Gardner等人为讨论公共地悲剧问题设计了一种共享机制进行多时段（20～30时段）的实验。其间，道斯（R·Dawes）则对公共地悲剧和公共利益捐助问题进行了n个人的囚徒难题的实验室模拟，也得到了与考尔曼类似的结果。

在博弈论实验中，真正对理性人假定提出挑战的是最后通牒博弈及其实验。最早的实验始于德国柏林洪堡大学，1982年，德国经济学家Gth、Schmittberger和Schwarz等人设计了最后通牒博弈实验。1988年，为了进一步区分提议者慷慨方案背后的动机是担心被拒绝还是纯粹的利他主义，Forsythe等人也进行了实验，只是对最后通牒博弈的分配规则做了一个变化。随后在1994年，Forsythe等人在他们原有实验基础上又进一步做了独裁者博弈实验。同年，Hoffman等人进行了双向蒙蔽实验，证明了独裁者在蒙蔽的条件下分出的钱更少。此后，许多学者对此都相继做了实验研究，在这方面的实验研究成果相当丰富，但是无一例外的是，实验的结果都不完全符合于理论解。最后通牒博弈实验显示参与者并不是追求利益最大化的绝对理性者。

另一个较有代表性的博弈实验是选美博弈实验。尽管此类博弈实验的研究出现较晚，但也在实验博弈论中占有重要的位置。其思想来源于1936年凯恩斯（Keynes）对股票市场所做的一种类比。后来，nagel（1995）、Ho、Camerer、weigelt（1998）将其设计成一个简单的选美比赛博弈：“n个参与者同时在〔0，100〕中选择一个数字Xi，计算所有数字的平均数再乘以一个小于1的系数p（比如说p=0.7），将得到的数值（即平均数的70%）与每个参与者的选择相比，最接近的参与者就获得一笔支付”，并对其做了实验研究。之后，豪、凯莫勒与维格尔特（Ho、Camererandweigelt，1998）也做了类似的实验。他们的实验结果显示，大多数参与者估计的平均数是50，因而会选择35，又或者估计其他人也会考虑到这一步而选择245。他们的实验结果与nagel等人的实验结果一致，均偏离了博弈论的预测解。选美博弈的实验结果从另一个层面质疑了绝对理性假定，说明参与者并不具备无限的推理能力，而且博弈结构及参与者的理性也并不是参与者之间的公共知识。

可以说博弈实验从产生至今，已取得了丰富的成果，对博弈论的研究起了很重要的作用。它的产生对博弈论来讲，具有重要的方法论意义。

二、博弈实验产生的原因分析

博弈实验的产生既是博弈论研究发展的需要，也是因为博弈实验自身的方法论价值。

首先，博弈实验的产生源于博弈论自身存在的问题。博弈论的魅力在于它的普适性和数理精确性，在于它能够演绎推出所有参与者均衡的推荐解，得知参与者如何行动才是合理的。只要其他参与者都按照均衡解行动，那么参与者的任何背离都不会产生额外的支付。但是实际上这种预测几乎不可能达到。博弈论的逻辑无矛盾性使得问题的矛头直接指向了其理论假定，直接涉及博弈论的基础。因此，博弈论研究者们显示出极大的热情要去使理论至少与一些现象相衔接。但是当他们投入极大的精力去发现这种衔接性时，却发现传统理论分析方法并不能提供多少帮助，这种冲突始终存在。这就迫切需要一种超出传统的理论分析方法的方法、用证据辅佐理论的方法。而这种既可验证理论又可分析改进理论的方法就是实验方法。通过实验可以给博弈论的理论研究提供大量的信息、数据证据。而这些正是构筑博弈论的肥沃土壤。

其次，从科学方法论的角度来看，任何一个理论都会遵循一个历史发展的规律，从不完善到完善，从理论到验证，最终服务于实践。其中，实验是验证理论、寻找问题、改善理论或者证伪一个理论的重要手段。博弈实验亦是如此。这一规律是任何科学，甚至于数学这样的基础学科都必须遵循的历史规律，从科学发展的初期就被认识到了。“例如在《关于两门新科学的对话》中，萨尔维亚蒂推演出落体定律后，辛普利西奥要求用实验验证这种关系。伽利略通过萨尔维亚蒂回答说，‘作为一个科学家，你提出的要求是十分合理的；因为这是把数学证明应用于自然现象的那些科学的习惯，并且这样做也是正当的。’”[1]（p54）像物理学在亚里士多德前后，大多都是理论分析推演得出的，但是随着理论发展的需要，开始大量地引入实验，并且最终从实验室中发展到付诸实践，进而又推动了技术的发展一样。博弈论也会经历这样一个理论发展的历史过程。利用实验方法研究博弈问题其实早在博弈论发展初期就已经有了。只是初期研究者的实验具有科学确证的感觉，希望用实验验证理论。但是实验结果却对博弈论提出了质疑。因此后来的实验不仅用于验证博弈理论，也用于发现新的理论内容和影响因素。

再者，实验自身具有其他任何方法都无法取代的优势。根据实验的定义，一个实验是对一个现象的仔细计划和完全可复制的观察。实验的目的是作为理论的试验台。根据此定义，博弈实验就是相对于特定的性能、为学习策略行为的一般原则的实验。这种实验往往是通过精心设计的用货币诱发真人被试的可控实验室实验。其尽可能复制真实的现场环境，从而直接检验受试者如何进行有效决策。在实验中，博弈通常以最纯化、简化的抽象形式给出。实验对象（参与者）做一个简单的决定，并且知道他们的决定和其他实验对象的决定如何共同决定货币支付。在实际实验中，实验对象会根据他们的表现获得货币或筹码奖励。这就使得研究者可以通过人为的方式控制待检验的因素，直接的检测最核心的影响因子。

最后，博弈论家们自身的渴望和需求也是产生博弈实验的重要原因。任何学者，面对外界的质疑，都不可能无动于衷。对一个理论的认可，是对这个理论研究者的最大褒奖。如果一个理论被怀疑，那么无疑是理论研究者所面对的最大的问题和否定。学者可以对这种质疑无动于衷，但是他的理论势必要接受历史和实践的检验，一旦被证伪，终究被淘汰。因此，任何学者提出理论，不仅是要推出自己的研究成果，要大众分享这个成果，更希望其能被实践支持，服务于现实世界的需要。所以，不管是为了验证理论、改进理论，还是为了面对现实的偏见，以摆脱这种遭受现实偏见的痛苦，都需要实验，毕竟实验例证得出的结论能给人一种可信的感觉。在证据面前，理论才更具有说服力和解释力。所以说博弈实验的产生亦是博弈论研究者主观上的强烈诉求。

三、博弈实验的特征

博弈实验的主要特征有三个：“人”的主体性、可控制性和可复制性。“人”的主体性是博弈实验特有的显著特征，决定了博弈实验在方法论中的基础地位，而可控制性和可复制性则是实验的共有特征。

“人”的主体性是指博弈实验的研究主体是真实的“人”。正如引用Sugden对实验经济学的定义一样，博弈论也是“有人在其中的理论”。在博弈实验中，研究者将具有自身背景、情绪状态等等的真人放入实验室，让他们在里面面对真实的决策，通常又以真实的货币或筹码作为奖励，使得研究者的焦点从均衡直接转移到参与者本身的决策行为上。尽管真实的“人”更难以把握，受到的干扰更多，但是对于博弈论的本质和研究主体来看，博弈实验的这种性质使得它在方法论意义上具有独特的作用。研究真实的“人”的实验对观察人在博弈中的真实反应和选择以及均衡的收敛有很重要的作用。这是任何计算机模拟和理论解析方法所不具备的优势。同时，“人”涉及所有与人相关的内容，使得博弈实验的研究内容比其他实验更具有广泛性。其研究对象尽管是真实的“人”的策略均衡问题，但是实际上涉及的内容可以涵盖行为、心理等诸多内容。博弈实验研究的博弈模型可以应用于任何“人”的策略问题，不仅可以用于经济学，也可以用于其他社会科学。而且博弈实验在研究均衡的过程中，不仅涉及人的理性问题，也涉及人的偏好、心理、文化等诸多因素问题。因此比其他实验研究的内容更为广泛，实用性更强。

可控制性是指对实验条件的操纵，是对复杂的博弈模型的高度简化。研究者在简化了的实验室环境中，可以有意识地投入某些刺激变量或改变其间的组合，使得对参与者的行为特征及其结果的精确测量成为可能，进而能对相关的博弈理论或背景做出有效验证和评估。博弈论基于严格的假定，往往又是简化的博弈模型，那么问题的关键就在于这个假定可靠么？如何检验这个假定和博弈模型的预测结果？当例证与理论不一致时，就一定是理论有误么？答案肯定不是靠演绎分析就能回答是与否的。而主要的问题在于不清楚到底有哪些因素，这些因素之间的关系及究竟是哪些因素在实际发挥影响。由于博弈论研究的主体是“人”，博弈预测敏感地依赖于参与者的选择。这些问题的回答必须将其中所有的影响因素抽象为变量，进而控制这些变量，建立实验模型，从而通过实验结果验证回答上述所有的问题。实验的可控制性是实验能否成功的关键。博弈实验主要是“实验室实验”（laboratoryexperiment），而并非“现场实验”（spotexperiment）。“实验室实验”比“现场实验”更容易控制，成本低廉且可靠性高。尽管实验环境比“现场实验”中的环境简单得多，但是更具有定向性和针对性，是对最核心、最基础的理论部分的验证。正如著名经济学家普洛特（CRplott）所回答的那样，“一个理论若经受不住简单实验，则更无理由相信它能与更为复杂的自然环境相吻合。”[2]

可复制性是指其他研究者是否能够重新进行同样一个实验，并由此证实某个单独发现。实验设计和实验数据都是公开的，往往都具有相对固定的模式和程序，任何人都可以重复类似的实验。同时可以根据需要改进某些实验细节或变量，在原来的实验基础上寻求新的发现。这些实验所得数据都是高度可比较的。这样一来，就可以展开一种理论与证据的对话，这种对话可以促成一连串的证据链条或者理论思想，产生发展理论所需的累积性的证据资料库。如果某种结果或者结论可以在各个独立的实验中反复得到，那么这种结论相对就是可靠的，在这种结论之上的理论会让我们更有信心，同时，这些数据是高度可比较的，所以说，实验正是由于这种可复制性，使得博弈论体系内的实验不是零散无关联的。相反，是互相联系、互相推动的。博弈实验的证据可以形成一个强大的网络，无地域性地供所有的研究者使用。这种证据链的比较性可以使其更容易发现博弈问题和核心影响因子，找出核心的问题症结，以促进新的理论发展。可重复性还可以给参与者学习的机会，使得实验者研究参与者的学习问题。此外，或许只有可重复性才能研究博弈均衡的收敛条件和实际可能情况。

四、博弈实验的方法论意义

博弈实验对研究博弈论具有不可替代的方法论意义。一是因为博弈实验自身的优势。二是因为博弈论自身的局限。

简单地说，运用博弈实验具有三大显著优势：一是可以以最简单的博弈形式，检验最核心的理论问题。这种简化、纯化看似简单，往往只需假定规则就可以做出预测。但是，正是这种抽象简化，提取的假定、变量都是明确的。一旦预测有误，就可立马知道哪些假定不符，而结果通常会提示给研究者一个能使预测更准确的替代性变量或假定。二是实验为博弈论提供了一个检验场所，是检验理论预言是否有效及其有效性范围的工具。为检验理论和发展新理论提供了有用的信息资料和数据。三是运用实验的方法不仅可以回答“是什么”的问题，还能回答“为什么”的问题。一般说，无论是观测法还是调查法，都只能回答“是什么”的问题，而实验方法则在此之上还具有可以回答“为什么”的优势。因为博弈实验是可以设计的，我们可以根据要探讨的现象，设计适当的博弈模型，进行相应的模型实验。可以通过变量控制，来分析影响博弈的因素及其相互关系。

而博弈论自身的缺陷及其传统研究方法的不足，使得博弈论研究方法必须有所改进和发展。从科学的意义上讲，博弈实验正是这样一种通过有目的地调整变量、动因及其组合，以研究博弈论的研究方法，对博弈论具有方法论上的意义。这种方法论上的意义主要体现在其特有的实验优势上。而这些优势主要来源于其自身的实验特征，这些特征是其他任何研究方法所不具备的。正是博弈实验的三个特征，使得其具有重要的方法论意义。其研究内容可以为几乎所有涉及“人”的问题提供参考。博弈研究者可以通过对博弈模型的简化和纯化处理，用可以控制的实验室环境来模仿真正的博弈环境，研究人们的决策行为。通过博弈实验，可以进行理论检验。检测观察值与理论预期值的符合情况，同时保证这种符合不是随机造成的。寻找博弈论预测失败的原因及其影响因素和解决的办法，建立检验性的规律作为博弈论新理论的基础。同时，可以进行环境比较，通过改变实验的环境，观察改变前后的结果，比较不同环境对结果的影响。使研究者在相当广泛的范围内取得对个体决策行为特征的精确把握，获得诸多假定的有效检验，在多种变量间寻求经验规律。在博弈理论与现实之间的鸿沟上架起一座新的也是较为可靠的桥梁。因此，博弈实验对博弈论来讲，具有其他的研究方法无法比拟和超越的方法论意义。

博弈论自身的缺陷需要博弈实验来进行分析研究。博弈实验的结果不仅对博弈理论提出了挑战，实验自身也为博弈理论提供了检验和完善的平台。博弈实验不仅为检验博弈理论及发展新理论提供有用的数据，也是检验博弈论预测结果是否有效及其有效性范围的工具。作为一种科学研究方法，博弈实验具有其他任何研究方法都无法取代的方法论地位。在世界、理论和实验之间，理论总是渴望能够正确描述世界，世界也渴望能够通过理论来推动人类的认识。但是，两者之间的鸿沟使得人们必须寻求一种途径或者桥梁。而实验正是联结两者的这个途径和桥梁。尽管实验不是真实的世界，也不可能做到完全的复制，但是实验结果却能帮助研究者逼近世界的最真实状态。这些博弈实验的贡献和作用已经从取得的成果中得到肯定。

博弈论不仅需要实验，更需要由实验提供的完整的方法论体系。实验是一个累积的过程。开始时是由研究者针对某个特定的问题进行的独立实验，之后是效仿者进行的一系列类似的实验。以此会出现针对各种问题的实验系列。这些实验类型和实验系列之间错综交叉，彼此联系。各个实验的证据彼此辅证。作为博弈论研究者，要想深入地探讨博弈论问题，实验是必需的研究方法和手段。同时，对实验的研究，最终的目的是实现对博弈理论的完美解释。而达到这个目标的必经之路必定是理论与实验的完美结合。因此，对博弈研究者来说，不管是夯实某些理论或放弃某些理论，抑或是最终承认其局限性，博弈实验都是必需的方法和手段，而能够形成这些博弈实验所组成的方法论体系更是博弈论成熟的表现和标志，在博弈论研究道路上具有极其重要的方法论意义。

[参考文献][1]约翰·洛西.科学哲学历史导论[m].邱仁宗，金吾伦，林夏水等译.武汉：华中工学院出版社，1982.

[2]plott，C.R.anUpdatedReviewofindustrialorganization：applicationsofexperimentalmethods，inR.ScmalenseeandR.D.willig，eds，Handbookofindustrialorganization，Vol，2.amsterdam：north-Holland，1989，pp.1109-1176.

[3]plott，C.R.willeconomicsBecaomeanexperimentalScience？SoutherneconomicJournal，1991（57）：901-919

[4]annamariaFiore（2009）experimentaleconomics：Somemethodologicalnotes，mpRapaperno.12498，posted04.January2009/22：49

[5]ColinCamerer.BehavioralGametheory：experimentsonStrategicinteraction，princetonUniversitypress，princeton，nJ，2001.

[6]BinmoreK.whyexperimentineconomics.theeconomicsJournal，February1999.

[7]BinmoreK.Justplaying：GametheSocialContract[C].mitpress，1998.

[8]BinmoreK.（1987）.modelingrationalplayers，iandii.economicsandphilosophy，vols.3and4，1987，pp.179-214and9-55.

[9]Coleman，a.Gametheoryandexperimentalwork，pergamonpress，London，1983.

[10]Rubinsteina.atheorist’sviewofexperiments[J].europeaneconomicReview，2001，（4）：615-628.

[11]DanielFriedman，ShyamSunder.experimentalmethods—aprimerforeconomists[C].CambridgeUniversitypress，1994.

[12]JohnHey.experimentaleconomicsandDeception：aComment[J].Journalofeconomicpsychology，1998，（19）：397-401.

[13]Harrison，C.R.Johna.ListFieldexperiments[J].JournalofeconomicLiterature，2004，42（4）：1009-1055

[14]J.Kagel，a.e.Roth.Handbookofexperimentaleconomics[C].princetonUniversitypress，1995.

[15]Schotter，andrew，Yale.m.Bramimsteon.economicSearch：anexperimentalStudy[J].economicinquiry，1981，（1）：1-25.

[16]Roth，a.e.ontheearlyHistoryofexperimentaleconomics，JournaloftheHistoryofeconomicthought，15，Fall，1993.

[17]alvina.e.Roth.Laboratoryexperimentionineconomics，amethodologicaloverview，economicJournal，98（393），December，1988.

[18]Smith，V.L.theory，experimentsandeconomics，Journalofpersoectives（winter），151-161，1989.

[19]高鸿桢.博弈论为什么需要实验[J].中国经济问题，2008，（5）.

[20]蔡志明.经济学中的实验方法与技术[J].华东师范大学学报（哲学社会科学版），1997，（3）.

[21]CF巴斯特尔布.经济学中的试验方法Ⅰ[a].新帕尔格雷夫经济学大辞典（中文版）[m].北京：经济科学出版社，1996.

[22]弗农·史密斯.经济学中的试验方法Ⅱ[a].新帕尔格雷夫经济学大辞典（中文版）[m].北京：经济科学出版社，1996.

[23]科林·凯莫勒，乔治·罗文斯坦，马修·拉宾.行为经济学新进展[m].贺京同，等译.北京：中国人民大学出版社，2010.

[24]科林·凯莫勒.行为博弈[m].北京：中国人民大学出版社，2006.

[25]约翰·海.微观经济学前沿问题[m].北京：中国税务出版社，2000.

[26]高鸿桢.实验经济学导论[m].北京：中国统计出版社，2003.

博弈论的研究特点篇2

摘要：博弈论在新闻传播研究中具有方法论、学科拓展的重要意义。近年来，虽然博弈论在理论研究中取得了一定的成果，但质和量上还存在较大的发展空间。新闻理论界对博弈论的理解存在狭义、广义与日常通俗语义基础上的三个层面水平。我们可从哲学意义、方法论意义和建构意义三方面，认识博弈论在新闻传播学研究中运用的可能性。

关键词：新闻传播学博弈论方法

问题的由来

新闻传播学比之其他社会人文学科，方法论的研究尚未深入，本文所要论及的新闻传播学研究中的博弈论方法，就表现得比较典型。

将博弈论与新闻传播学相交叉的思路，在上个世纪80年代社会科学方法论讨论最热烈的时候，新闻理论界尚无人提到。后来新闻学与文化学、新闻学与心理学、新闻学与美学、新闻学与社会学等的研究，开始陆续出现。但新闻理论界在新闻交叉边缘学科研究过程中，一直没有很好地重视新闻传播博弈学的研究。作者在1997年复旦大学新闻学院做访问学者一段时间，涉猎了一些有关博弈论的论著，产生了新闻学、传播学与博弈论之间关系的简单联想。这种联想主要是对新闻文化学建构来讲的，从新闻文化的外延角度来看，新闻传播的竞争生态研究，不能缺少博弈论的思想。

上个世纪90年代之后，有关博弈论的书籍开始增多，后来出现了普及性的博弈论读物，这些书籍大都将社会生活、经济领域、历史经验等方面内容，与各种博弈类型相类比，说明博弈论的道理，但也带来某些副作用，即博弈论的庸俗化。在这样一种背景下，“博弈”一词在新闻报刊、文章论著中出现的频率比较高。新闻传播与博弈的关系，真正被新闻传播理论界重视，是在2004年第八次传播学研讨会上，会上提出“传播即博弈”的观点，并存在争议。2008年10月，孙光海、陈立生的《传媒博弈论》由三联书店出版，有论者认为这是我国第一部把博弈论引入传媒领域的成功力作。

从新闻传播理论界涉及新闻传播与博弈论关系的话题，或在文章论著中有意识地使用“博弈”概念来看，可以分为以下三种情况：

一是狭义基础上的理解。仅仅从传媒市场竞争的角度，来研究新闻传播的博弈。如《传媒博弈论》一书，“将四大主流门户网站、两家中央重点新闻网站、四大城市的13家都市报作为研究对象，对各大媒体平时新闻报道及当时的社会背景和特定环境进行分析，从新闻到版面到受众再到发行，通过大量案例剖析与实战推演，总结出各大媒体在不同环境下，针对不同的竞争对手以及竞争对手采取的策略，从而制定最佳策略。内容包括网络媒体博弈、都市报博弈、网络媒体与传统媒体博弈、热点新闻与冷门新闻、大新闻与小新闻博弈等”。当然，从最严格意义上来看，该书许多内容还停留在下文所提及的第三种认识上。但就分析比较到位的有关传媒博弈的内容来看，完全是从社会主义市场经济的媒体之间竞争策略着眼，探求媒体的生存之道。

二是广义基础上的理解。从博弈论的广义思想出发，来探讨新闻传播领域中，如何把握新闻活动的规律，有学者称之为“大博弈的思维观”。实事求是地说，新闻传播理论界在这方面的论述还较少。人们由于对博弈论的跨学科性质意义尚不十分了解，所以对这种广义理解还持较为消极的态度。传播与博弈是两个概念，但并不意味着传播不能用博弈观点去研究。小约翰将博弈论研究归入人际传播理论，说明他已经把博弈论纳入到传播学视野了，不存在谨慎与否的问题。小约翰在《人类传播理论》的前面部分特别提到传播学的学科边界问题，即所有社会科学理论都存在传播的问题，传播学强调传播的双向性，恰好说明了与博弈论的紧密联系。另一位讨论者强调：“用博弈论解释一般传播现象的做法不可取。”这是基于“传播即博弈”这一命题而得出的观点。应该说“传播即博弈”是不对的，但“传播之中有博弈”，“博弈之中有传播”，在一般的传播现象中存在部分博弈现象，也是不争的事实。而且，我们注意到，在正常的新闻传播过程中，传受双方理性的情况还是较为普遍的。那种强调博弈论研究对象必须是理性的，从而认定传播学一般现象无法以博弈论进行解释，不尽妥当。我们知道，传播模式研究的前提，也要求理性的状态。

三是日常通俗语义基础上的理解。一般是指事物之间相互影响、制约，或传统哲学所说的作用与反作用意义层面，来使用“博弈”概念。诚然，博弈论研究确实离不开这些因素，但所有事物间的这些因素，不一定都是博弈论所讲的博弈。也有在互动反馈意义层面，来理解博弈的，比起前者进了一层，然而也不十分确切。如诸多文章中的“不同文化与黄色新闻的博弈”、“媒体道德与新闻价值的博弈”、“新闻规律与媒体利益的博弈”、“隐私权与新闻自由的博弈”、“政府与新闻界的博弈”、“博弈海量信息”等。其中有些文章也道出了某些新闻传播博弈行为，但存在将博弈论泛化的情况。如有论者把主观上的意识与客观上的行为看做一组博弈现象，把社会上普遍存在的观念或做法与某一具体的观念或行为看做一组博弈现象，这都是与博弈论不相契合的。我们只能说是直觉地使用了博弈这一名词，而没有从博弈论的理论角度去进行规范的研究。

本文的重点不在于专门提倡新闻传播学研究的博弈论方法，而是力图客观地思考博弈论方法在新闻传播学研究中，究竟能否作为一种研究视角，起到对新闻传播学研究的建构作用，甚至形成新闻传播博弈论这一新闻传播学的分支学科。

博弈论在新闻传播学研究中的可能性德国著名数学家哥德尔1931年提出不完备性定理：第一不完备性定理———任意一个包含算术系统在内的形式系统中，都存在一个命题，它在这个系统中既不能被证明也不能被否定。第二不完备性定理———任意一个包含算术系统的形式系统自身不能证明它本身的无矛盾性。这个定律虽然是针对数学来说的，但是其革命意义远远涉及科学哲学、逻辑学，而这种情况也注定要影响社会科学研究领域。诚然，新闻传播研究中，也不能将博弈论看做是无所不能的理论。我们研究博弈论在新闻传播研究领域的运用可能性，目的主要是运用其基本思想，扩展研究视域，在新闻传播领域内最合适的地方，找到双方的契合点，从新的角度描述新闻传播现象与活动的规律，调整我们的传播行为，使社会信息资源得到有效的配置。

博弈论最基本的思想，其一，在同一活动中，某事物的行为效果如何，有赖于它事物的行为。其二，是均衡概念。其三，假设人是理性的。理性的人，指行动者具有一定的逻辑推理能力，进行决策选择策略的目的就是自身利益的最大化。现实生活中，人们在作决策时可能往往是有限理性。其四，博弈论是竞争与合作的游戏，一般有协议契约。根据以上的简单概括，随之需要思考的问题就是，新闻传播现象与活动过程中，有没有相类似的情况？其一，在同一新闻传播活动中，双方各自的行为要视对方的行为而定？其二，均衡概念在新闻传播过程中能否实现？其三，新闻传播活动的行为主体是不是理性的？情况允许的话，自己的利益最大化是否是追求的目标？其四，竞争与合作的契约关系，在新闻传播过程中能否建立？答案是倾向积极的。

有了上述基本思考，我再从更大一些的方面来探讨运用博弈论的可能性：

哲学意义。马克思主义强经济基础决定上层建筑、意识形态，即经济的因素在社会生活、交往关系中的普遍性、基础性。虽然，马克思主义承认社会历史的发展有着诸多的因素，正如恩格斯所说的“平行四边形”合力作用，但归根结底的因素是生产力与生产关系的矛盾对立统一。

博弈论之所以在经济领域呈现出活跃的情况，人们之所以在各类社会活动、人际关系中发现博弈的因素，是因为人们在生产劳动过程中结成的各种交往关系所决定的。新闻传播现象与活动，归根结底是由交往关系决定的。因此，博弈论在新闻传播研究领域的运用也具有一定的广泛性。

我国社会主义市场经济建立之后，包括新闻传播业在内的文化产业，亟须建立一套新型的适应这一体制状况的文化产业伦理。目前可以定义为在保证社会效益的前提下，力求社会效益与经济效益的双赢，这就和博弈论中核心理论之一的“均衡”概念相暗合。每一次新闻传播策划、新闻报道活动或具体的新闻传播行为，都存在博弈论的问题，因为在某一次传播活动中的传播者之间、传受之间等，都有一个行为对策选择的问题，在现实环境中不可能不追求利益的最大化。如果不追求个体局部利益的最大化，可能追求的就是整体国家民族利益的最大化，如我国文化产业的双赢策略，即博弈论的“均衡”。公益与私利、赢利的矛盾，在社会主义初级阶段会一直存在，博弈的均衡可达到社会发展的和谐。

社会科学理论范式也有一个工具理性与价值理性的统一问题。

方法论意义。我们知道，博弈论最初作为应用数学的一个分支，是运筹学下面的对策论。后来应用于经济领域。在西方发达国家，作为西方经济学前沿领域的博弈论，已逐渐变为一种占主流地位的基本分析工具，人们十分重视其方法论意义。

从中国的传统文化来说，经史子集弈的思想无处不在。过去曾有学者提出这样的观点，自然科学最基础的学科是数学，而社会科学的基础可以是博弈论。我们不能说它完全正确，但是至少应该承认有其一定的合理性。

从广义的角度看，传播用学派的传播模式研究，实际上相当于博弈模型。在我国较为流行的英国人丹尼斯·麦奎尔、瑞典人斯文·温德尔合著的《大众传播模式论》中，许多传播模型十分典型地体现出这种情况。该书第一版介绍了35个传播模式，第二版介绍了66个传播模式。除了个别早期线性模式外，在控制论的反馈概念出现之后，传播模式越往后越具有博弈的性质，甚至可以这样说，研究当代传播模式离开了博弈的思维，其研究是存在欠缺的，虽然其模式可能并不能完完全全解决实际中的所有问题。

理论建构意义。新闻学传播学以及中国化的新闻传播学，从它们的发生与发展的历史来看，是建立在众多人文社会科学基础上产生发展起来的。在自然科学、社会科学日益融合的时代，在需要破除自然与社会科学鸿沟的时代，谁也不能断然否定新闻传播学领域可以不要博弈论的参与。作为与社会实践互动频繁、联系紧密的社会科学之一的新闻传播学，从来不存在其他学科的不可逾越的障碍。

由于受经济学的影响，人们思考博弈论在新闻传播研究领域的运用时，可能认为仅仅反映在传媒的经营管理上。这种狭义的理解，导致产生了博弈论不适合一般新闻传播理论研究的观点。作者认为，新闻传播研究中重视运用博弈论，并不是要求新闻传播理论“范式”像经济学那样转向博弈论，并把它作为核心的理论分析工具，而是在理论体系建构中，对博弈论方法给予足够的重视，将其中合理的内容，吸纳到基础理论中来。更重要的是，将博弈思维作为指导理论研究的一个窗口，扩展新闻传播理论空间。当然，也可以建立新闻传播学下面的二级学科“新闻传播博弈理论”，进行专门的新闻传播学新领域探索。

结语

新闻传播研究对博弈论产生兴趣已有多年，但是博弈论在新闻传播研究领域被吸纳与运用的情况并不尽如人意，原因是新闻传播理论界对博弈论尚不太熟悉，对博弈论的理解也参差不齐，甚至还存在部分抵触心理，致使研究成果的质与量不甚理想。新闻传播研究需要理论创新，对理论与实践中出现的新情况、新问题提出新的解决路径。研究新闻传播博弈论，对理论研究者提出了知识更新的更高要求。

自然科学与人文社会科学、人文科学与社会科学、社会科学内部之间没有不可逾越的鸿沟。博弈论无论在广义、狭义还是方法应用上，在新闻传播研究领域都有用武之地，关键在于我们的观念。

参考文献：

1.肯尼斯·赫文［美］、托德·多纳著：《社会科学研究的思维要素》，重庆大学出版社，2008年版。

2.施锡铨著：《博弈论》，上海财经大学出版社，2000年版。

3.罗伯特·吉本斯［美］著、高峰译：《博弈论基础》，中国社会科学出版社，1999年版。

博弈论的研究特点篇3

【关键词】唯物辩证法经典博弈论演化博弈论经济学革命

一、博弈论与辩证法

1.辩证法要义

辩证法，源出希腊文，含义是进行谈话、进行论战。这一术语在哲学史上曾在各种不同的意义上被使用，其历史发展经历了古代的朴素辩证法、以黑格尔为代表的唯心辩证法、马克思主义的唯物辩证法等三个阶段。19世纪中叶，马克思和恩格斯在概括革命实践经验和自然科学新成果的基础上，批判地继承了黑格尔的唯心主义辩证法，创立了唯物主义辩证法，他们认为，世界“是一幅由种种联系和相互作用无穷无尽地交织起来的画面”，唯物辩证法就是对这一生动画面的概括和反映。从内容上看，唯物辩证法作为科学的理论体系包括对立统一（矛盾）、质量互变、否定之否定三大基本规律，以及本质与现象、内容与形式、原因和结果、必然性和偶然性、可能性和现实性五对基本范畴。总体上看，唯物辩证法是对客观物质世界普遍联系和永恒发展这一基本特征的揭示和反映，既是一种世界观又是一种方法论。

2.博弈论的内涵及其发展阶段

博弈论作为数学的一个分支，本身不涉及经济问题。这种理论是一种分析工具，它研究怎样以数学模型模拟决策者之间的冲突与合作。由于冲突与合作的结果依赖于所有人所作的选择，每个决策者都企图预测其他人可能的抉择，以确定自己的最佳决策。如何合理地进行这些相互依存的战略策划便是博弈论的主题。

博弈论的发展经历了以下三个阶段：

一是思想萌芽阶段。1838年古诺简单双寡头垄断博弈、1883年伯特兰和1925年艾奇沃奇思研究了两个寡头的产量与价格垄断、2000多年前中国著名军事家孙武的后代孙膑利用博弈论方法帮助田忌赛马取胜等等都属于早期博弈论的萌芽，其特点是零星的、片断的研究，带有很大的偶然性，很不系统。

二是经典博弈论形成阶段。1944年冯·诺依曼和摩根斯坦的《博弈论与经济行为》一书中提出的标准型、扩展型和合作型博弈模型解的概念和分析方法，奠定了这门学科的理论基础；1950年和1951年纳时发表了《n人博弈的均衡点》和《非合作博弈》两篇关于非合作博弈的文章、1950年tucker定义了“囚徒困境”；60年代，泽尔滕将纳什均衡的概念引入了动态分析，提出了“精炼纳什均衡”概念、海萨尼则把不完全信息引入了博弈论的研究；80年代，克瑞普斯和威尔逊研究了动态不完全信息博弈。总体来说，经典博弈论主要关注纳什均衡的形成，以及当纳什均衡存在多重性时，如何通过不断地精炼来寻找最终的结局。

三是博弈论在当前的发展阶段。20世纪90年代以来，演化博弈论、博弈学习理论、行为博弈等研究成为博弈论的最新发展，主要从博弈论的角度探索正式和非正式制度的形成与演变、通过实验来检验和修正有关经济人的行为理论等问题。

二、博弈论对西方经济学的改良

首先，传统西方经济学对寡头市场和垄断竞争市场和市场失灵问题的研究是苍白无力的，这使得传统西方经济学解释现实的能力并不像其宣扬的那样完美。博弈论作为工具在西方经济学中的应用正好弥补了传统西方经济学的这一缺陷。正如克雷普斯在《博弈论与经济模型》一书中所作的评价：“我认为博弈论最成功之处在于使一望而知的直觉认识规范化，从而使人们了解这类直觉认识怎样应用于新的形势，以及在较为复杂的形势下怎样获得这种直觉认识。”“博弈论提出的问题正是那些‘在理论上难以解释’的合乎情理的直观行为，非合作博弈理论只是应用数学理论提供了分析这类行为的简单工具。”

其次，“博弈论在经济学获得巨大成功的主要原因，是它提供了模拟和分析动态性竞争互动的技术手段。”互动结构是一种社会结构，长期以来，经济学家一直试图理解个人行为与社会结构之间的关系。美国经济学家H·培顿·扬在《个人策略与社会结构——制度的演化理论》一书中认为：“经济制度和行为模式可以被解释为很多个人决策的产物或者说结果……那么，有哪些特征能将‘演化’的观点与经济学中的古典观点区别开来呢？一个是符合均衡的状态，另一个是符合理性的状态。”H·培顿·扬是演化博弈论领域的领军人物，他的上述这段引文清楚地表明了新古典研究传统的两大缺陷：一是没有动态分析，尤其是没有关于复杂情况下的动态分析；二是脱离现实太远的强经济人假定。演化博弈论将经济运行理解为一个动态演化的过程，并认为经济人并不是强理性的，而是适应性理性的。在动态演化的过程中，经济人通过不断的学习来提高理性程度，进而实现最优决策，这无疑推动了西方经济学的发展。

上面我们从两个方面分析了博弈论给西方经济学带来的变化，但不能据此就认为博弈论给西方经济学带来了革命。第一，博弈论并没有从整个体系上改革西方经济学，只是对其进行修修补补，将西方经济学原本不能解决或解决不好的问题给予改良。第二，新兴起的演化博弈论虽然为西方经济学的动态演化分析提供了工具，但随着研究的深入也对西方经济学提出了挑战。“随着一组新的分析工具特别是博弈论和信息经济学的出现和越来越明显的经验证据表明，瓦尔拉斯模型存在缺陷，经济学教学和实践的方式正在发生改变。经济参与人不再单纯与自然或是其他环境参数打交道，而是有策略地与其他经济人交往。”经典博弈论（如非合作博弈论中的完全信息条件下的静动态博弈和不完全信息条件下的静动态博弈）为经济人的互动决策建立了模型，从而部分解决了上述问题。然而，非合作博弈论在基本模式上依然遵循均衡模式，只不过将范围从瓦尔拉斯的单个经济人拓展到相互影响的两个人或多人之间的均衡。经济社会运行是一个不断从均衡走向非均衡，又从非均衡走向均衡的动态演变过程。这与瓦尔拉斯传统所宣扬的一般均衡是不相容的。如果说以非合作博弈理论为代表的经典博弈论还能在某种程度上对西方经济学进行补充的话，当演化博弈论兴起以后，瓦尔拉斯传统就再也无法自圆其说了。但由于西方经济学本身固有的辩护性，它不会允许新理论去触动传统理论的核心，与上述引文出自同一本书的一段话清楚地表明了这一点，“在许多经济学家和其他学科学者贡献的基础上，本书提出了关于个人行为与经济制度如何相互作用产生总体效果，以及两者随着时间的推移如何变化的理论。”根据上面的分析，我们不难看出博弈论改良了西方经济学，但却没给其带来革命。一方面，博弈论本身体现着辩证思维，其与传统西方经济学形而上学的方法论相比，更符合真实世界的运行，因而能在一定意义上给西方经济学带来改变，使其科学性稍稍加强；但另一方面，博弈论又囿于西方经济学本身的辩护性，作为一个工具它的应用被限制在一定的范围内，无法给西方经济学带来革命。只有将马克思唯物辩证法与博弈论相结合，使其具有唯物辩证法所具有的革命性，才有可能为经济学带来一场革命。

三、改造博弈论的设想及借鉴意义

我们设想可以从以下几个方面对博弈论进行批判性的吸收和改造，以便为马克思经济学的发展所用。

1.“社会生活在本质上是实践的。凡是把理论导致神秘主义的神秘东西，都能在人的实践中以及对这个实践的理解中得到合理的解决。”演化博弈论之所以在当前蓬勃发展且应用前景广泛，其根本原因在于其突破了经济人的超理性假定，如果再向前走几步，其科学性会大大增强，指望西方经济学家来完成这项工作是不可能的，只有马克思和马克思经济学者有这样的革命性。从这个意义上说，演化博弈论中学习着的人正在向马克思实践的人靠近，也为马克思经济学的发展提供了新的工具。

2.将马克思生产力与生产关系辩证统一原理与演化博弈论关于经济社会动态演变的理论分析结合起来。马克思生产力与生产关系辩证统一原理是唯物辩证法在人类社会历史发展中的应用。马克思主义哲学认为，生产力与生产关系、经济基础与上层建筑之间的矛盾是社会基本矛盾，它们的运动形成社会发展的基本规律，同时也构成社会发展的根本动力，社会是在对立统一、否定之否定的螺旋式发展中上升的。这一原理体现在马克思经济学中就是资本主义制度自身的发展造就了替代自己的新的共产主义制度，同时，每一制度下的各种上层建筑又由构成其经济基础决定的。演化博弈论主张用从均衡到非均衡、再由非均衡到均衡动态演变方法来分析社会制度的形成、驻存和演变，这一点与马克思的分析有着相通之处，可以用马克思的思想对其进行改造。

3.利用西方社会科学正以博弈论为基本分析工具走向融合之路的契机，可以在改造后的博弈论框架下批判吸收西方相关社会科学发展的成果。近年来，西方社会科学各学科在大量地应用博弈论对本学科进行改写和发展，呈现出各社会科学统一的趋势，跨学科研究方兴未艾。如果能将博弈论这种分析工具融入马克思的分析中，那么将为马克思理论批判吸收西方社会科学的最新研究成果提供一个平台。

参考文献：

[1]马克思恩格斯选集（中文第二版）：733.

[2][美]戴维·m．克雷普斯著，邓方译.博弈论与经济模型.商务印书馆，2006：94.

[3][美]戴维·m．克雷普斯著，邓方译.博弈论与经济模型.商务印书馆，2006：45.

[4][美]H·培顿·扬著，王勇译.个人策略与社会结构——制度的演化理论.上海三联书店、上海人民出版社，2004：4.

[5][美]萨缪·鲍尔斯著，江艇、洪福海、周业安译，微观经济学：行为，制度和演化.中国人民大学出版社，2006：6.

[6]马克思恩格斯选集（中文第二版）（第一卷）：58.

[7]马克思恩格斯选集（中文第二版）（第1—4卷）.北京：人民出版社，1995.

[8]梁树发.马克思主义哲学原理.北京：中国人民大学出版社，2003.

[9]李建平.《资本论》第一卷辩证法探索.北京：社会科学文献出版社，2006.

[10]李云峰.马克思学说中人的概念.北京：人民出版社，2007.

[11]杨耕，陈志良，马俊峰.马克思主义哲学研究.北京：中国人民大学出版社，2000.

博弈论的研究特点篇4

引言

一、两个简单的例子

1.1老鹰（Hawk）与鸽子(Dove)博弈

1.2系统选择博弈

二、进化博弈理论的产生及其发展

2.1理性的由来及其缺陷

2.2心理学研究成果及有限理性概念的提出

2.3进化博弈理论的产生及其发展

三、进化博弈理论的基本内容

3.1进化博弈理论基本模型分类

3.2进化博弈理论基本均衡概念-----进化稳定策略

3.3进化博弈理论基本动态概念----模仿者动态

四、进化博弈理论的应用

五、传统方法的缺陷及进化博弈理论研究方法的现实性

5.1新古典经济学均衡分析法的缺陷

5.2经典博弈理论的策略互动分析法及其缺陷

5.3进化博弈理论局部动态分析方法的现实性

5.3.1局部动态分析法的均衡观

5.3.2局部动态法的时间观

5.3.3局部动态法的均衡选择观

5.3.4局部动态法的特殊性

六、结论

参考文献

摘要

本文从两个简单的博弈例子出发，以通俗的语言全面介绍了进化博弈理论的理性基础及其形成、发展、基本内容和部分应用，在此基础上文章进一步比较了新古典经济学、经典博弈理论①及进化博弈理论在研究方法上的不同之处，并特别强调了进化博弈理论局部动态法的均衡观、时间观、均衡选择观及方法上的特殊性。进化博弈理论的局部动态分析方法既是经济学研究方法的一次创新又是经济学直面现实的有力武器。

关键词：沉默互动；社会互动；进化稳定策略；模仿者动态；均衡分析法；局部动态法

引言

为什么同样一项经济制度在某个地方对经济发展有积极的推动作用而在另一个地方对经济发展却起着消极的阻碍作用？为什么能够有效降低交易费用的中介在一些地方会出现而在另一些地方却不能出现？为什么同样的管理方法在一个地方显示出高效率而在另一地方却不具有效率？诸如此类的问题，新古典经济学利用均衡分析法都无法给出令人满意的答案。均衡分析法的最大缺陷是把经济系统中参与人看作是互不联系的单个人（仅研究单个生产者或消费者的行为），不能把其所考察的问题放在一定的环境中去，该方法完全忽略了制度环境、社会环境及人文环境等对参与人行为的影响，单纯考察某个条件与结果之间的一一对应关系。因而，无法对现实中出现的诸多现象给予合理的解释。博弈理论尽管把参与人之间行为互动关系纳入到了模型之中，但依然没能跳出新古典均衡分析法的基本框架，并且由于其对理性赋予更强的假定，使得该理论更加脱离现实。进化博弈理论则一反常规，从一种全新的视角来考察经济及社会问题，它所提供的局部动态研究方法是从更现实的社会人出发，把其所考察的问题都置于一定的环境中进行更全面的分析，因而，其结论更接近于现实且具有较强的说服力。进化博弈理论属于经济学的前沿理论，该理论从其理论框架建立到现在仅仅只有近三十年的历史，但其在经济学、社会学、生态学等领域却得到了广泛的应用，近年来已经成为主流经济的研究方法之一。在我国由于历史原因，对经济学的研究起步较晚，特别对进化博弈这样的前沿理论更是知者甚少，本文的主要目的是以通俗的语言介绍进化博弈理论的相关内容及其应用，让读者对该理论有一个全面的了解。

本文的结构如下：第一部分给出进化博弈理论的两个典型的例子；第二部分对进化博弈理论的产生及其发展进行阐述；第三部分对进化博弈理论的基本内容进行简要的介绍；第四部分概述进化博弈理论的有关应用；第五部分论述传统的经济学研究方法的缺陷及进化博弈理论研究方法的现实性；第六部分对进化博弈理论的发展及理论前景进行简要的说明。

一、两个简单的例子

为了下文说明的方便，本文先给出进化博弈理论中两个具有代表性的例子，在此基础上再进一步给出该理论的基本内容及其研究方法的基本特点。

1.1老鹰（Hawk）与鸽子(Dove)博弈

假定一个生态环境中有老鹰与鸽子两种动物，它们为了生存需要争夺有限的资源（如食物或生存空间等）而竞争。老鹰一般比较凶悍，必要时在斗争中直到重伤。鸽子一般比较温驯，竞争时在强敌面前常常退缩。竞争中获胜者得到了生存资源就可以更好地繁衍后代，重伤者则不利于其后代生长，即会减少其后代的数量。如果群体中老鹰与鸽子相遇并竞争资源，那么老鹰就会轻而易举地获得全部资源，而鸽子由于害怕强敌退出争夺，从而不能获得任何资源（当然不会受伤）；如果群体中两个鸽子相遇并竞争生存资源，由于它们均胆小怕事不愿意战斗，结果平分资源；如果群体中两个老鹰相遇并竞争有限的生存资源，由于它们都非常勇猛而相互残杀，直到双方受到重伤而精疲力竭，结果虽然双方都获得部分生存资源但损失惨重，入不敷出。假定竞争中得到全部资源为50个单位（该数字也可以表示为生物的适应度、繁殖成活率或后代数量）；得不到资源则表示其适应度为零；双方重伤则用来表示。于是老鹰、鸽子两种动物进行的资源竞争可以用一个对称博弈来描述，博弈的支付矩阵如下：

操作依赖于该群体的初始状态。如果初始时，该宿舍有多于4人使用操作系统，那么该宿舍所有学生最终都会使用该操作系统；否则所有学生最终会使用操作系统。

二、进化博弈理论的产生及其发展

进化博弈理论是经济学研究方法的一次创新，该理论从否定传统理论赖以成立的基础----理性人假定出发而建立起来一个新的分析框架，它结合了生态学、社会学、心理学及经济学的最新发展成果，从有限理性的社会人出发来分析参与人的资源配置行为。

2.1理性的由来及其缺陷

经济学自从古希腊哲学中分离出来并成为一门系统的学问，是在亚当•斯密1776年发表《国富论》之后。以斯密为代表的古典经济学关注的核心是资源的稀缺程度如何能被人类经济活动所减少，他们关注的重点不是资源配置问题而是国民财富的增长及国别差异的原因。1890年马歇尔《经济学原理》的出版，标志着新古典经济学的成形，马歇尔之后，新古典经济学关注的核心逐渐转向在给定稀缺程度下资源的最优配置问题。稀缺资源的配置是需要人的参与，也就是说经济学研究的问题演变为关于经济中参与人如何把稀缺的资源配置到效率最高地方去的问题，强调个体行为在资源配置中的作用。经济中参与人的决策行为是通过高度复杂的思维活动作出的，为了更好地从微观个体行为来解释资源配置问题，新古典经济学借用了哲学中“理性”概念对复杂的人类行为过程进行了抽象的假定。然而，理性一词用于经济学时却对其含义的理解与哲学中对其含义的理解已经有了明显的区别。哲学中的理性是指人类所特有的用以探索自然和社会奥秘的认知能力，当代伟大的哲学家康德在其著作《纯理性批判》一书中指出，人类理性即认知能力并不是万能的，而是有限的。经济学中的理性则是指一种行为方式，具体地说即是经济中参与人对其所处世界的各种状态及不同状态对自己支付的意义都具有完全信息，并且在既定的条件下每个参与人都具有选择使自己获得最大效用或最大利润的能力。

经济学家认为理性是至高无上的，人们凭借理性就可以完全地认识自然与社会。经济学中对理性的含义经过这样的处理以后，就使得经济学能够充分运用数学理论发展的成果来进行分析。为了应用数学工具并更好地处理经济问题，传统经济学家们从偏好，信念及理性三个方面来界定经济主体的特征，其中信念就是个体认为不同结果将会出现的基于个体所获信息之上的条件概率。偏好则是基于不同结果的信念之上的序。理性是根据上述偏好及信念，个体获得最优决策的程度以及个体根据已经获得的信息来修正其信念的能力。这三个特征使得经济学研究的对象由现实人转向了理想化的对象，经济学越来越偏离了现实。

由理性概念而引致的缺陷首先表现在理性人具有无限的信息收集及处理能力的均衡观，认为经济系统常常处于均衡状态，非均衡只是一种暂时的现象，当受到外生因素扰动而使系统偏离均衡状态时，系统会以线性的方式回归均衡，这种机械式线性反应的均衡观来源于牛顿力学，由此而得出的比较静态分析法完全忽视了系统受到非线性扰动及连续因素的影响。其次表现在由全知全能的理性人而引致的均衡跳跃观，认为经济系统达到均衡或者从一个均衡到另一个均衡是不需要时间的，认为时间是可逆的，即经济变量与物理学的变量一样，只要条件相同系统的均衡也就相同，市场和经济对于过去的记忆是短暂的或者是没有的。这种应用经典牛顿力学分析方法来分析高度复杂的参与人经济行为使得其预测效果大打折扣。最后表现在其比较静态分析方法上，传统经济学的最基本分析方法----比较静态分析法赖以成立的基础是假定经济系统只受到外界一个个相互独立、互不重叠的冲击的影响，或者当一个因素的影响消除之后，下一因素才开始对经济系统产生影响。我们知道现实世界是普遍联系的，各种因素之间不可能相互独立，系统中任何一个因素的变动都会引起其他因素的变动，这些因素之间相互作用的时间可能很短也可能很长，各因素对最终目标会产生不同程度的影响。比较静态法却只见局部不见整体，企图通过比较不同均衡来找出系统达到均衡的条件，因此得不出符合现实的结论，其研究方法上的局限性大大降低了其理论的现实意义。

2.2心理学研究成果及有限理性概念的提出

随着经济学家对理论研究的深入，特别近来实验经济学的迅速发展，主流经济学赖以成立的基础“理性人”假定及其基本的比较静态均衡分析法越来越受到了人们的质疑。相继出现了许多其他的研究方法，其中在经济学中影响最大的就是心理学的研究方法。心理学应用于经济分析有着非常曲折的历史。事实上，斯密、马歇尔、庇古、费雪尔和凯恩斯等一批古典经济学家都仔细地分析了偏好和信念的心理学基础。但从1940’s开始，一方面受到萨缪尔森及希克斯等新一派基于理性假定经济学家的影响，心理分析在经济学中的地位慢慢地被降低了；另一方面理性模型也遇到了许多如allais(1952)悖论等难以给出合理解释的经济现象。于是1960’s开始，许多微观经济学家再次运用心理学研究方法来解释现实中的异常现象，宏观经济学也把经验法则和适应性预期纳入到其模型之中，正是在这一时期心理学家Simon(1957)提出了其著名的“有限理性”概念。然而，1970’s初随着RobertLucas等人提出的理性预期理论、Selten、Kreps等倡导的强调正确信念及贝叶斯修正的博弈理论及Stiglitz、Spence等研究的信息经济学理论相继成为主流经济学的一部分，经济学界再一次掀起了排除渗透在经济学领域中心理学研究方法的热潮，心理的研究方法在经济学界几乎无立足之地，严格理性假定席卷整个经济学界。行为经济学的发起者amostversky在经济学界根本找不到志趣相投者。1970’s末期，随着心理学家amostversky与Kahneman合作发表了一系列应用心理分析方法来研究经济学问题的原创性文章，如1974年他们在Science发表的Judgmentunderuncertainty:Heuristicsandbiases，1979年他们合作在econometrica发表prospecttheory:ananalysisofdecisionunderrisk，慢慢消除了经济学界中存在的对心理学分析方法的偏见，此后应用心理分析方法来解释经济现象的文献见诸于各种经济学期刊之中，心理分析方法也渐渐地成为了主流经济学的研究方法之一。

进入1980’s，随着经典博弈理论、生态理论及心理学理论研究的深入发展，特别是心理学家西蒙把其在心理学领域研究的成果直接应用经济分析并因此获得了诺贝尔经济学奖，极大地激励着经济及社会学家从现实人行为出发来解释经济及社会现象。心理学研究表明人类认知过程首先表现为人们通过一种“感知秩序”进行学习活动，并形成分散的非同质的知识，其中“感知秩序”是指人的理解力、知识和人类行动之间的关系；其次表现为个体通过学习所达到的理性程度的有限性，组织学习个体学习行为的整合而形成的多层次“理性结构”，个体理性便会在一个累积性的组织或制度环境中得到塑造和提高并发挥作用，在这个过程中，个体学习行为总会受到组织、习惯和文化等制度性的限制和影响。西蒙认为人类并不是完全理性而是有限理性的，因为人类认知能力有着心理的临界极限，人类进行推理活动需要消耗大量的能量，推理也是一种相对稀缺的资源，另外决策者决策时需要大量的信息，而这些信息是不可能免费获得的，获得决策所需要的信息是需要大量成本的。考虑到参与人有限的知识水平、有限的推理能力、有限的信息收集及处理能力，经济主体的决策行为并非总是最大化的结果，其决策受到参与人所处的社会环境、过去的经验、日常惯例及其他人相似情形下的行为选择等因素的影响。在有限理性条件下，由于参与人无法免费获得决策所需要的全部信息，并且参与人即使获得了决策所需要的全部信息也可能由于有限的计算能力而无法得出最优决策。因此，参与人只能采取模仿、学习等简单的直观决策方法或一些固定的常规来进行决策。人类的决策结果受到复杂的认知过程的影响，不同的人或者同一个人在不同时间即使给出相同的条件也可能会得出不同的决策结果，即决策结果受到认知过程的路径影响。

2002年诺贝尔经济学奖得主之一心理学家丹尼尔·卡内曼(DanielKahneman)将源于心理学的综合洞察力应用于研究在不确定条件下参与人的决策过程及行为结果并展示了人为决策是如何异于标准经济理论预测的结果。在1979年，他与有着深厚数学及哲学背景的心理学家特韦尔斯基（tversky）提出了震撼经济学界的“前景理论”(prospecttheory)。他们的发现激励了新一代经济学研究人员运用认知心理学来研究经济学，使经济学的理论更加丰富。一个理论获得诺贝尔经济学奖不仅是对获奖者过去成就的肯定，更主要说明了获奖理论将会成为主流经济学未来的发展方向。2002年诺贝尔经济学奖授予给丹尼尔·卡内曼标志着经济学的研究对象从传统的“经济人”转向现实的“社会人”，经济学直面现实。如何从有限理性出发来研究参与人的行为，许多经济学家对之进行了广泛而深入的研究并提出了许多理论，在这些理论之中影响最大且受到了经济学界普遍接受的理论即进化博弈理论。

2.3进化博弈理论的产生及其发展

进化博弈理论源于对生态现象的解释，1960年代生态学家Lewontin就开始运用进化博弈理论的思想来研究生态问题。生态学家从动植物进化的研究中发现，动植物进化结果在多数情况下都可以用博弈论的纳什均衡概念来解释。然而，博弈论是研究完全理性的人类互动行为时提出来的，为什么能够解释根本无理性可言的动植物的进化现象呢？我们知道动植物的进化遵循达尔文“优胜劣汰”生物进化理论，生态演化的结果却能够利用博弈理论来给予合理的解释，这种巧合意味着我们可以去掉经典博弈理论中理性人假定的要求。另外，1960年代生态学理论研究取得突破性的进展，非合作博弈理论研究成果也不断涌现并日趋成熟，进化博弈理论具备了产生的现实及理论基础。

进化博弈理论应用于研究经济学问题在学术界曾经引起极大的争议，争论的焦点在于理性假定。当时由于理性概念在经济学界已经根深蒂固。多数人认为利用研究生态演化的进化博弈理论来研究参与人的行为是不合适的。因为动植物行为是完全由其基因所决定的，而经济问题则涉及到具有逻辑思维及学习、模仿能力的理性参与人的行为，因此，借助于进化博弈理论来研究远比动植物复杂的人类行为显然是行不通的。但随着心理学研究的发展及有限理性概念的提出，越来越多的经济学家应用进化博弈理论来解释经济现象并获得了巨大的成功，利用进化博弈理论来研究并解释经济现象的文献大量出现于各种经济学期刊了。尽管如此，利用进化博弈理论来解释经济现象还是需要对该理论的基本分析框架作出相应的调整。如果去掉参与人偏好、信念及理性假定等条件，那么参与人是如何作出决策的呢？进化博弈理论在处理有限理性参与人决策问题时，常常假定参与人遵循某种比贝叶斯法则更简单的行为规则，这种行为规则应该告诉如何采取行动及如何根据经验来改变行为选择，这样参与人只要知道什么会发生，而不必知道为什么会发生。

1970年代，生态学家maynardSmithandprice（1973）结合生物进化论与经典博弈理论在研究生态演化现象的基础上而提出了进化博弈理论的基本均衡概念----进化稳定策略（evolutionarilystablestragegyeSS），目前学术界普遍认为进化稳定策略概念的提出标志着进化博弈理论的诞生。此后，生态学家taylorandJonker（1978）在考察生态演化现象时首次提出了进化博弈理论的基本动态概念----模仿者动态（ReplicatorDynamics）。至此，进化博弈理论有了明确的研究目标。

1980年代以后，随着新古典经济学及博弈论固有的缺陷逐渐被人们所认识，有限理性概念得到了学术界的普遍认可，加之进化博弈理论在解释生态现象时获得的巨大成功，特别是经济学界于1992年在康奈尔大学召开的进化博弈理论学术会议，正式确立了该理论的学术地位。一大批如LarrySameulson、KenBinmore、peytonYoung等经济学家从不同的角度对传统的进化博弈理论分析框架进行拓展，并使之逐渐转化为描述经济行为的理论。目前，进化博弈理论的基本理论体系虽然已经形成但还是相当粗糙。因此，它仍然处于不断发展和完善的阶段，但该理论提供了比传统理论更具现实性且能够更准确地解释并预测参与人行为的研究方法，从而得到了越来越多的经济学家、社会学家、生态学家的重视，我们有理由相信该理论成为主流经济学的一部分已经为时不远。

三、进化博弈理论的基本内容

进化博弈理论结合经典博弈理论及生态理论研究成果，并以有限理性的参与人群体为研究对象，利用动态分析方法把影响参与人行为的各种因素纳入其模型之中，并以系统论的观点来考察群体行为的演化趋势。

进化生态学与博弈论的结合至少已有三十几年的历史，初看起来使人觉得奇怪，因为博弈论常常假定参与人是完全理性的，而基因和其他的演化载体常常被假定是以一种完全机械的方式运动。然而一旦用参与人群体来代替博弈论中的参与者个人，用群体中选择不同纯策略的个体占群体中个体总数的百分比来代替博弈论中的混合策略，那么这两种理论就达到了形式上的统一。尽管这两种理论在形式上达到了统一，但进化博弈理论与经典博弈理论还是存在本质区别。在进化博弈理论中每个参与人都是随机地从群体中抽取并进行重复、匿名博弈，他们没有特定的博弈对手④。在这种情况下，参与人既可以通过自己的经验直接获得决策信息，也可以通过观察在相似环境中其他参与人的决策并模仿而间接地获得决策信息，还可以通过观察博弈的历史而从群体分布中获得决策信息。对参与人来说，观察群体行为的历史即估算群体分布是非常重要的，首先，群体分布包含了对手如何选择策略的信息。其次，通过观察群体分布也有助于参与人知道什么是好的策略什么是不好的策略。参与人常常会模仿好的策略⑤而不好的策略则会在进化过程中淘汰，模仿是学习过程中的一个重要组成部分，成功的行为不仅以说教的形式传递下来，而且也容易被模仿。参与人由于受到理性的约束而其行为是幼稚的（naive），其决策不是通过迅速的最优化计算得到，而是需要经历一个适应性的调整过程，在此过程中参与人会受到其所处环境中各种确定性或随机性因素影响。因此，系统均衡是达到均衡过程的函数，要更准确地描述参与人行为就必须考察经济系统的动态调整过程，动态均衡概念及动态模型在进化博弈理论中占有相当重要的地位。

3.1进化博弈理论基本模型分类

进化博弈理论的基本模型按其所考察的群体数目可分为单群体模型(monomorphicpopulationmodel)与多群体模型(polymorphicpopulationsmodel)。单群体模型直接来源生态学的研究，在研究生态现象时，生态学家常常把同一个生态环境中所有种群看作一个大群体，由于生物的行为是由其基因唯一确定的，因而可以把生态环境中每一个种群都程式化为一个特定的纯策略。经过这样处理以后，整个群体就相当于一个选择不同纯策略（纯策略集的数目就相当于群体中的种群数）的个体。群体中随机抽取的个体两两进行的都是对称博弈，有些文献中称这类模型为对称模型（Symmetrymodel）。严格地说，单群体时个体进行的并不是真正意义上的博弈，博弈是在个体与群体分布所代表的虚拟参与人之间进行。如第一部分的老鹰----鸽子博弈，该生态环境中有两个种群老鹰与鸽子，它们代表两个不同的纯策略，用进化方法进行处理时认为该生态群体中每个个体都有两种可供选择策略即老鹰策略与鸽子策略，此时的博弈并不是在随机抽取的两个个体之间进行，而是每个个体都观察群体状态（选择老鹰策略与鸽子策略个体数在群体中所占的比例），给定此状态它就可以计算自己选择不同策略所得的期望支付（严格地说这并不是期望支付，但为了说明的方便本文仍然借用该概念）进而确定选择哪一个策略不选择哪一个策略，对物种而言这就意味着种群数量的增加或减少。

多群体模型是由Selten(1980)首次提出并进行研究的，他在传统单群体生态进化模型中通过引入角色限制行为（RoleConditionedBehavior）而把对称模型变为了非对称模型。在非对称博弈个体之间有角色区分，此时可以从大群体中区分出不同的小群体，群体中随机抽取的个体之间进行真正意义上的两两配对重复、匿名非对称博弈，有时又称之为非对称模型（asymmetrymodel）。如果我们把系统选择博弈中的宿舍变成学校（整个学校相当于一个大群体）而把十个人变成十个班（每一个班看成是一个小群体，且同一班的同学无角色区分即与单群体情形一样），每个班的学生都有多种选择，此时该校学生所进行的计算机系统选择博弈就是非对称博弈。非对称博弈模型并不是对单群体博弈模型的简单改进，由单群体到多群体涉及到一系列的如均衡及稳定性等问题的变化。Selten(1980)证明了“在多群体博弈中进化稳定均衡都是严格纳什均衡⑥”的结论，这就说明在多群体博弈中，传统的进化稳定均衡概念就显示出其局限性了。同时，在模仿者动态下，同一博弈在单群体与多群体时也会有不同的进化稳定均衡。

按照群体在演化过程中所受到的影响因素是确定性的还是随机性的，进化博弈模型可分为确定性动态模型和随机性动态模型。确定性模型一般比较简单并且能够较好地描述系统的演化趋势，因而，理论界对之进行较多的研究。随机性模型需要考虑许多随机因素对动态系统的影响，一般比较复杂，但该类模型却能够更准确地描述系统的行为，近年来理论界对之也进行广泛的探讨[对随机动态的详细讨论可以参阅这方面的经典文献Foster,D.,andp.Young.(1990),Fudenberg,D.andC.Harris(1992),Kandori,m.G.mailath,andR.Rob(1993)]。

3.2进化博弈理论基本均衡概念-----进化稳定策略

进化博弈理论的基本均衡概念---进化稳定策略⑦[文献2、5有详细介绍]是由maynardSmithandprice（1973）及maynardSmith(1974)在研究生态演化问题时提出来的，其直观思想是：如果一个群体（原群体）的行为模式能够消除任何小的突变群体，那么这种行为模式一定能够获得比突变群体高的支付，随着时间的演化突变者群体最后会从原群体中消失，原群体所选择的策略就是进化稳定策略。系统选择进化稳定策略时所处的状态即是进化稳定状态，此时的均衡就是进化稳定均衡。下面给出maynardSmithandprice（1973）对进化稳定策略的定义（此后本文称之为原初定义），用符号表示如下：

说是进化稳定策略，如果，存在一个<，不等式对任意都成立。其中a是群体中个体博弈时的支付矩阵；y表示突变策略；是一个与突变策略y有关的常数，称之为侵入边界（invasionBarriers）；表示选择进化稳定策略群体与选择突变策略群体所组成的混合群体。实际上相当于该吸引子对应吸引域的半径，也就说进化稳定策略考察的是系统落于该均衡的吸引域范围之内的动态性质，而落于吸引域范围之外是不考虑的，所以说它只能够描述系统的局部动态性质。至于系统是如何进入吸引域的原初的进化稳定策略定义所没有给予足够的重视。

要准确地理解进化稳定策略概念就必须正确理解突变者和侵入边界的含义。我们可借助于前面的两个例子来理解。在老鹰、鸽子博弈中，当该生态环境中只有老鹰（或只有鸽子）时，这时系统已经处于均衡状态，但它们都是不稳定的均衡，因为这两个均衡都可以被突变者侵入。开始时，假定该生态环境处于老鹰均衡，如果由于某种原因而进入鸽子时，那么随着时间的演化，整个生态系统最终就会稳定于一半为老鹰一半为鸽子的状态，即混合策略纳什均衡是进化稳定的。这说明该博弈中两个纯策略纳什均衡是不稳定的。因为，当系统处于纯策略所表示的状态时，只要存在突变者系统就会离开这种状态，所以它们都不是进化稳定的。相反混合策略纳什均衡却不一样，即当系统处于一半是老鹰一半是鸽子时，如果由于某种因素使得系统偏离该状态，那么系统会自动恢复到原来状态。另外，在系统选择博弈中突变者、侵入边界就更为明显，所谓突变者即是指选择进化稳定策略以外的策略者，且侵入边界与不同的均衡有关。该博弈有两个纯策略纳什均衡和一个混合策略纳什均衡（），前一个均衡所对应的侵入边界就是，也就是说如果选择操作系统的学生数占群体总数的比例大于（即学生数大于4），那么选择操作系统的突变者就不可能侵入到该群体中，如果选择操作系统的学生数占群体总的比例小于（即学生数小于4），那么选择操作系统的突变者就会侵入到该群体中而原来选择操作系统的学生会转而学习操作系统。

最初进化稳定策略定义有比较苛刻的条件限制，如单群体、群体中个体数目无限大、系统只受到不连续且互不重叠冲击的影响等。这些条件大大地限制该定义的应用，随着学术界对进化博弈理论研究的深入，许多理论家们从不同的角度对最初定义进行了拓展，如Selten1980首次给出了适应于描述多群体均衡的定义；Schaffer1988首次给出了适应于描述有限规模群体的均衡定义；FosterandYoung（1990）首次给出了适应于描述连续随机系统的均衡定义等等（有关对进化稳定策略进行拓展的讨论见文献[5]）。最初定义是在解释生态现象时提出来的，如果进行经济分析，时需要进行相应的改变。在分析生态现象时，把每一个种群的行为都程式化为一个策略，因此进化的结果将会是突变种群的消失（消失的原因在于生物的行为是由其遗传基因唯一确定的）。如果用于经济分析，那么进化的结果将是那些选择突变策略的个体最终会改变策略而选择进化稳定策略（因为人类可以通过学习、模仿等来改变自己所选择的策略）。

经典博弈理论中的核心概念纳什均衡即是指一种策略组合，在该策略组合下任何个人单独偏离都不会变得比不偏离好。纳什均衡是一个静态概念，不能描述系统的动态性质，用数学语言来说它是动态系统的不动点，纳什的成功就是在于他应用拓扑学的不动点定理证明了纳什均衡的存在性。进化稳定策略必定是纳什均衡策略，它是纳什均衡的精练，文献[3]对此有详细的介绍。在进化稳定策略的定义中引入突变者及侵入边界使之能够更好地描述系统的局部动态性质。第一部分的两个例子中，按照纳什均衡的概念是无法得知两个系统最终会选择哪一个均衡，但利用进化稳定策略却可以说明系统最终会稳定哪一个均衡并可以分析系统达到不同均衡的条件，在某种程度上，较好地解决了多重均衡选择问题。

3.3进化博弈理论基本动态概念----模仿者动态

进化博弈理论来源于生态学的研究，该理论基本上从“优胜劣汰”的进化论观点来看待群体行为的调整过程。一般的进化过程都包括两个可能的行为演化机制：选择机制(Selectionmechanism)和突变机制（mutationmechanism）。选择机制是指本期中能够获得较高支付的策略，在下期被更多参与者选择；突变是指参与者以随机（无目的性）的方式选择策略，因此突变策略可能获得较高支付也可能获得较低支付，突变一般很少发生。新的突变也必须经过选择，并且只有获得较高支付的策略才能生存（Survive）下来。进化博弈理论需要解决的关键问题就是如何描述群体行为的这种选择机制和突变机制。博弈理论家对群体行为调整过程进行了广泛而深入的研究，由于他们考虑问题的角度不同，对群体行为调整过程的研究重点也就不同，因而提出了不同的动态模型，如weibull(1995)提出的模仿动态（imitationDynamics）模型，认为人们常常模仿其他人的行为尤其是能够产生较高支付的行为；BörgersandSarin(1995，1997)等提出并应用强化动态（ReinforcementDynamics）来研究现实中参与人的学习过程；Skyrms(1986)引入了意向动态（DeliberationalDynamics）模型对哲学中的理性问题进行了讨论；Swinkels(1993)提出了近似调整动态（myopicadjustmentDynamics）；BorgersandSarin(1995)提出了刺激—反应动态（Stimulus-ResponseDynamics）等等。到目前为止，在进化博弈理论中应用得最多的还是由taylorandJonker(1978)在对生态现象进行解释时首次提出描述单群体动态调整过程的模仿者动态（ReplicatorDynamics）。所谓模仿者动态是指使用某一策略人数的增长率等于使用该策略时所得的支付与平均支付之差。下面就给出taylorandJonker（1978）提出的模仿者动态的微分形式：

化的而且因素之间的互动作用也是需要时间的。因此，均衡只是一种暂时现象或者在多数情况下，系统根本不可能达到的现象，要更准确地考察参与人的行为就必须运用系统论的观点，把行为互动性、因素互动性及时间因素纳入到其模型之中。

5.2经典博弈理论的策略互动分析法及其缺陷

考虑到新古典经济学没有把参与人行为之间的互动关系纳入到其模型之中，经典博弈理论则在理性人假定的基础上把参与人行为的互动关系纳入到其模型之中进一步考察了参与人的决策问题。在我国，对人类互动行为的研究至少可以追溯到三国时期田赛马的故事，但作为一种正式理论提出来，一般认为是始于冯·诺意曼和摩根斯藤（Vonneumannando.morgenstern,1944）出版的《博弈论与经济行为》一书，直到纳什（nash1950）在研究非合作博弈的基础上提出著名的纳什均衡（nashequilibrium）概念才使得博弈论成为一门完整的理论。经过近五十年的发展，终于在1994年，三位杰出的博弈论大师：纳什（JohnF.nash）、泽尔藤（RechardSelten）和海萨尼(JohnC.Harsanyi)获得了经济学的最高荣誉——诺贝尔经济学奖，在全球经济学界再次掀起了对博弈论的研究热潮。经典博弈论为社会科学提供了一个新的研究视角，使我们能够以全新的方法来处理各种冲突与合作的问题。博弈论作为一种理论工具，其应用相当广泛。在信息经济学中得到了充分的应用，1996年诺奖得主mirrlees等、2001年诺奖得主akerlof等都对信息经济学研究作出了卓越的贡献。这充分说明了博弈论在经济学的地位可见一斑。

经典博弈理论的核心概念----纳什均衡就是由普林斯顿大学数学家纳什在研究非合作博弈时提出来的。纳什均衡即是指给定其他参与人选择的情况下，每一个人单独偏离均衡都不会变得比不偏离好，显然纳什均衡是一个静态均衡概念。经典博弈理论尽管把参与人的互动行为引入到其模型之中，并认为现实中参与人不是孤立地作出自己的决策，每一个参与人的决策不仅依赖于其自身所面临的条件及其所拥有的信息，而且也依赖于其他参与人的决策选择。但该理论却面临着其自身无法克服的缺点。首先，博弈论中的互动是一种“沉默互动⑨”，这种互动不允许参与人之间存在任何形式的交流，即假定参与人都是一个个只会理性计算的孤立经济人而非社会人，一旦引入社会互动，许多博弈都无法进行分析，也就是说经典博弈理论中的互动并不“社会互动”而是孤立的“沉默互动”。其次，博弈论的基本均衡概念纳什均衡要求博弈各方都是理性的，并且理性是共同知识，博弈时如果某一方选择了非理，那么博弈就无法进行下去。特别地该理论在利用后向归纳法（Backwardinduction）对纳什均衡进行精练时，不但要求参与人完全理性，而且还要求参与人的行为满足序贯理性（SequentialRationality）要求。这一比理性更强的要求使得博弈论更加远离现实人。再次，在处理参与人所面临的不确定性时，不仅要求各参与人知道世界的各种状态，而且要求参与人知道每一种状态所出现的概率，并且给定一个先念信念，当出现任何新信息时，每个参与人都能够应用贝叶斯法则修正自己的先念信念，也就是说参与人不但具有很强的计算、推理能力，而且能够在一个大的状态空间上应用贝叶斯法则解决相当复杂的问题。现实中多数情况下，参与人并不都具有这种计算、推理能力。最后，博弈论碰到了其最棘手的问题就是多重均衡的处理，当博弈出现多重均衡特别是多重严格纳什均衡时，尽管许多理论家提出了一些方法（Selten（1965）提出的子博弈精炼纳什均衡概念，Selten（1975）提出的颤抖手精练纳什均衡，Kerps—wilson(1982)提出的序贯均衡，Schelling（1960）提出的聚点均衡等）来处理多重均衡问题，但始终没能获得一致认可的结论。

与新古典经济学相比，经典博弈理论虽然在其模型中纳入了行为的“沉默互动”关系，但该理论给出的研究方法仍然没能跳出新古典经济学的均衡分析框架，这种只注重结果而忽略达到结果的过程的分析方法依然把对经济系统的影响因素都看作为一个个孤立因素，依然认为影响因素与决策结果是一一对应的关系，依然没能把参与人所处社会环境等因素纳入到其模型之中，因而不能准确地描述现实中人的决策行为，其结论也仅仅具有理论意义而缺乏政策含义。

5.3进化博弈理论局部动态分析方法的现实性

进化博弈理论利用达尔文“优胜劣汰”的生物进化论、经典博弈理论并结合心理学的研究成果，从西蒙提出有限理性（BoundedRationality）的参与人群体出发，通过对群体行为的研究进一步得出参与人个体的行为。进化博弈理论跨越了完全理性的“经济人”与有限理性的“社会人”的鸿沟，实现了经济学研究方法革命性的突破。与传统均衡分析法相比，进化博弈理论的局部动态分析方法在以下几个方面独具特色。

5.3.1局部动态分析法的均衡观

传统的均衡分析方法认为完全理性参与人能够对环境的任何变化作出迅速的最优反应，因而，经济系统是常常处于均衡状态的，分析参与人的行为只需要研究均衡结果，并以此来预测经济人的行为，通过比较不同均衡结果来寻找系统达到均衡的条件。这种处理方法为了数学上处理的方便而撇开现实中“因素互动”而分别考察单个因素对均衡的影响，使得理论更加缺乏现实基础。进化博弈理论则完全摒弃传统理论中非现实的“理性人”假定，直接从有限理性参与人群体出发而提出的一种全新的研究方法----局部动态法。局部动态法把经济系统达到均衡结果的过程纳入到其模型之中，认为经济系统达到均衡需要一个长期的渐进过程，均衡结果依赖于达到均衡的过程，也就是说任何一个结果都是路径依赖的，它与混沌经济学完全动态的研究方法具有某种程度的相似之处。

5.3.2局部动态法的时间观

传统的均衡分析法并没有纳入因素互动关系并且理性计算是不需要时间的，所以得出经济系统常常是均衡的结论。进化博弈理论的局部动态法一个显著特征就是把参与人的决策过程时间及因素互动的时间纳入到其基本模型之中，强调系统达到均衡的过程，并认为经济系统由于受到各种互动行为及互动因素的影响，有些系统达到均衡可能只需要很短的时间，有些系统达到均衡可能需要很长的时间，有些系统可能无法达到均衡。时间因素对经济学研究有着非常重要的意义，如均衡分析法无法考虑宏观经济政策中“时滞”使得许多实施时有效的政策在发生作用时却出现了与原意相反的结果。时间是度量政策效率的一个很重要的因素，如果不考虑时间因素有些政策可能很有效率，但纳入时间因素，一些需要太长时间才能使系统达到意愿均衡的政策可能根本就没有效率。进化博弈理论把时间纳入到模型分析中并充分应用数学中的相图来描述经济系统达到均衡的路径，这样有利于决策者控制经济系统使之朝向既定的目标前进，也有利于决策者寻找能够最大限度地促进系统向意愿均衡转化的因素，使系统尽快达到有效率的均衡。

5.3.3局部动态法的均衡选择观

新古典经济学研究的逻辑有理性就有均衡，然后在既定均衡下通过对不同均衡的比较来寻找系统达到不同均衡的条件，即比较静态法，最后结合条件找出希望达到的均衡，因此，该理论不存在真正意义的均衡选择问题。经典博弈理论提供的分析方法在多数情况下都存在其自身所无法处理的多重均衡问题。如老鹰与鸽子博弈及系统选择博弈中多重均衡问题。进化博弈理论的局部动态法引入突变因素就能够较好地解决了多重均衡的选择问题，在老鹰与鸽子博弈中，尽管全是老鹰（全是鸽子）都是均衡的，但这两个均衡都极不稳定即都不是进化稳定均衡，一旦有鸽子（老鹰）突变者进入该系统就会使系统偏离，随着时间的推移而使得系统趋向于混合策略进化稳定均衡即一半鸽子一半老鹰（该均衡是一个全局吸引子）；在系统选择博弈中经典博弈理论无法解释系统最终会趋于哪一个均衡，局部动态法引入了突变因素就能够很好地解决了均衡选择问题，即系统最终会趋于哪一个均衡依赖于系统的初始状态即路径依赖。进化博弈理论的基本均衡概念----进化稳定均衡描述的是当经济系统一旦进入到某一均衡的吸引域内时，系统就会对其他的突变策略具有一定程度（即在突变边界内）的抵抗力。

5.3.4局部动态法的特殊性

新古典经济学与经典博弈理论均衡分析法都是以单个消费者、单个生产者、单个市场为研究对象来考察参与人的最优决策行为，并由此研究整个社会的资源配置问题。然而它们却碰到了如何由个体行为转化到群体行为的困难，因为这种转化过程涉及到各种互动因素的影响。一个明显的例子是经典博弈理论中囚徒困境博弈，在该博弈中两个囚徒都从个体理性出发，但得到了集体非理性均衡的结论。也就是说，均衡分析法根本无法实现从个体行为向集体行为的过渡，在此框架内寻找宏观经济的微观基础的困难是非常大的。进化博弈理论的局部动态法则从人的社会性出发，利用系统论的处理方法来看待参与人的决策行为。该理论直接以参与人的群体为其研究的逻辑起点，在考虑到影响参与人行为的社会因素、文化因素、民族习俗及个体生活习惯等因素的基础上进一步考察群体中有限理性个体的行为互动关系，很巧妙地避开由个体行为向集体行为转化问题，因而能够更加真实地反应现实人的决策过程及其决策结果。

六、结论

进化博弈理论是经济学领域的前沿理论，它来源于对生态现象的研究，虽然该理论应用于经济分析的时间不长，但它为经济学研究提供了一个全新的分析方法，较好地克服了新古典经济学及经典博弈理论中理性假定及多重均衡的困难。并且，应用进化博弈理论来研究经济系统能够获得比传统理论更准确的结果，能够更加现实地解释经济现象，因而在短期内为多数经济学家所接受。从某种意义上说引入进化博弈理论局部动态法来分析经济中参与人的行为是经济学研究方法的一次创新。

注释：①本文把源于冯·诺意曼和摩根斯藤经纳什发展而成的博弈理论称之为经典博弈理论。②即无性生殖，这样假定的意思就是说后代继承其母体的策略，并且永远不改变，当然用于研究人类的行为时，需要作相应的调整。③所谓近视调整即是指参与人不管未来怎么样，只知道使当前的支付最大化④经典博弈理论中每一个参与人都有特定的博弈对象，并且，在重复动态博弈中，后行动者通过观察先行动者的理而利用贝叶斯法则来修正自己的先念信念，然后，在此信念下选择使自己获得最大支付的策略。⑤好的策略即是指能够获得较高支付的策略。⑥所谓严格纳什均衡即是严格占优纳什均衡。给定对手选择的情况下，每个人都通过选择严占优的策略而组成的纳什均衡。⑦事实上，这与Selten提出的颤抖手均衡概念具有相似性，所谓颤抖手均衡是指一个战略组合，只有当它在允许所有参与人都可能犯错误时仍是每一个参与人的最优战略的组合时才是一个均衡，其严格定义可以参阅张维迎的《博弈论与信息经济学》。其中的颤抖或者犯错误与进化稳定策略中的突变因素有差不多的含义，但它们之间存在本质上的不同。⑧由模仿者动态方程进行支付变换，可得。⑨这一点我们可以从博弈论一个著名的捐款----回赠实验中看出，募捐者要求每一个人都自愿捐款，最终募捐者以3倍于捐款总额的钱平均分派给每个捐款者，为了使得博弈能够分析下去，募捐者要求自愿捐款时每个人都不得与其他人讨论，否则该博弈就无法进行下去，因此，本文称博弈论中的互动是一种沉默互动而非社会互动。这个实验充分体现了古典经济学及博弈论研究对象上的一致性，即它们都是研究单个个体的行为而排除了人的一个重要特征----社会性。参考文献

[1]王则柯（1999）：《博弈论平话》，中国经济出版社。

[2]张维迎（1999）：《博弈论与信息经济学》，上海三联出版社。

[3]张良桥，冯从文（2001）：《进化稳定均衡与纳什均衡：兼谈进化博弈理论的发展》，《经济科学》，3，103-111。

[4]张良桥（2001）：《理性与有限理性：论经典博弈理论与进化博弈理论之关系》，《世界经济》，8，74-78。

[5]张良桥（2003）：《论进化稳定策略》，《经济评论》，2，70-74。

[6]张良桥，郭立国（2003）：《论模仿者动态》，《中山大学学报自然科学版》，3。

[7]杨小凯（2000）：《新兴古典经济学和超边际分析》，中国人民大学出版社。

[8]青木昌彦,奥野正宽(1999):《经济体制的比较制度分析》,魏加宁等译,北京:中国发展出版社.

[9]allais,m.,(1952):thefoundationsofapositivetheoryofchoiceinvolvingriskandacriticismofthepostulatesandaxiomsoftheamericanschool,inexpectedutilityhypothesesandtheallaisparadox,editedbym.allaisando.Hagen,Dordrecht:teidel.

[10]Börgers,t.andR.Sarin(1997):LearningthroughReinforcementandReplicatorDynamics,Journalofeconomictheory,77,1-14.

[11]Börgers,t.andR.Sarin,(1995):“LearningthroughReinforcementandReplicatordynamics”,mimeoUniversityCollegeLondon.

[12]Conlisk,J.(1980):CostlyoptimizersVersusCheapimitators,JournalofeconomicBehaviorandorganization,1980,(1):275-293.

[13]Cowen,tyler,andRandallKroszner,theDevelopmentofthenewmonetaryeconomics,Journalofpoliticaleconomy,1987,(95):567-590.

[14]Crawford,Vincent,p.(1989):“anevolutionaryexplanationofVanHuyck.Battalio,andBeil’sexperimentalResultsonCoordination,”manuscript,Departmentofeconomics,UniversityofCalifornia,SanDiego.

[15]DanielKahnemanandamostversky(1979):prospecttheory:ananalysisofdecisionunderrisk,econometrica,1979,(47),263-291.

[16]Foster,D.,andp.Young.(1990)StochasticevolutionaryGameDynamics,theoreticalpopulationbiology,(38):219-232.

[17]Fudenberg,D.andC.Harris(1992):evolutionaryDynamicswithaggregateShocks,Journalofeconomictheory,1992,(57):420-441.

[18]Jones,R..theoriginandDevelopmentofmediaofexchange,Journalofpoliticaleconomy,1976,(84):757-775.

[19]Kahneman,D.anda.tversky(1974):judgmentunderuncertainty:heuristicsandbiases,Science,185,1124-1131.

[20]Kahneman,D.anda.tversky(1979):prospecttheory:ananalysisofdecisionunderrisk,econometrica,47,263-291.

[21]Kandori,m.G.mailath,andR.Rob(1993):Learning,mutation,andLong-runequilibriainGames,econometrica,61,29-56.

[22]Kreps.D.,andwilson,(1982):SignalingGamesandStableequilibrium,econometrica,50,863-894.

[23]Lewontin,R.C.(1960):evolutionandthetheoryofGames.Journaloftheoretical.Biology.1,382-403.

[24]maynardSmith,J.andG.R.price.(1973):“theLogicofanimalConflicts”,nature,,(246):15-18.

[25]nash,Jr.JohnF.(1950),theBargainingproblem.econometrica.

[26]nash,Jr.JohnF.(1951),noncooperativegames,annalsmathematics54.

[27]Schelling,t.(1960):theStrategyofConflict,HarvardUniversitypress,Cambridge,ma.

[28]Schelling,thomas(1960),StrategyofConflict,HarvardU.press.

[29]Selten,p.(1978):thechainstoreparadox,theoryanddecision9,127-159.

[30]Selten,R.(1980):anoteonevolutionarilyStableStrategiesinasymmetricGamesConflicts,Journaloftheoretical.Biology.84,93-101.

[31]Selten,R.(1975),ReexaminationoftheperfectnessConceptforequilibriumpointsinextensiveGames,internationalJournalofGametheory,4,25-55.

[32]Selten,R.,(1965):SpieltheoretischeBehandlungeinespligopolmodellsmitnachfagetragheit,ZeitschriftfurdiegesamteStaatswissenschaft,12,301-324.

[33]Simon,H.a.,(1955):abehavioralmodelofrationalchoice,QuarterlyJournalofeconomics,69,99-118.

[34]Skyrms,Brian(1986):Deliberationalequilibria,topoi,5,59-67.

[35]Smith,V.L.(1979):indirectrevelationofthedemandforpublicgoods:anoverviewandcritique,ScottishJournalofpoliticaleconomy,25,183-189.

[36]Swinkels,J.(1993):adjustmentDynamicsandrationalplayinGames,GamesandeconomicBehavior,.5,455-484.

[37]taylor,p.D.andL.B.Jonker.(1973):evolutionarilyStableStrategyandGameDynamics,mathematicalSocial.Science(40):145-156.

[38]tversky,a.andD.kahneman(1992):advancesinprospecttheory:cumulativerepresentationunderuncertainty,Journalofriskanduncertainty,5,297-323.

[39]Vonneumann,Johnandoskarmorgenstern(1944),theoryofGamesandeconomicBehavior,princetonUpress.

[40]weitzman,martin(1984):theShareeconomy.Cambridge,HarvardUniversitypress.

博弈论的研究特点篇5

关键词:创新网络;演进博弈;形成机理

一、引言

近年来,随着信息技术的飞速发展与竞争环境的变化,企业开始通过创新网络来获取创新资源,缩短创新时间,进而取得竞争优势。创新网络不仅有利于减少创新费用和分散创新风险,而且有利于促进企业与高校、科研机构和政府的紧密结合。可以说,创新网络是构建并完善国家创新系统的重要组成部分。多数学者普遍认为创新网络是由企业、高校或科研院所、政府机构、中介组织等组成,其中企业是最主要的创新主体,企业为了实现创新功能,通过创新网络与其他创新主体建立各种正式或非正式的关系,目的是为了更好的获取创新资源,从而有效地提高创新效率。freeman(1991)认为创新网络是一种应付系统创新的基本制度安排,其中企业间的创新协作关系是网络架构的主要联结机制。olafarndt&rolfsternberg(2000)认为创新网络是不同的创新参与者的协同群体。因为创新网络能够帮助创新企业共享创效利益、共担创新风险,并获得特殊的技能。组成创新网络的企业、大学或科研院所、中介组织及政府进行合作以实现共同的创新目标(barringer&harrison,2000)。moller&svahn(2009)对创新网络管理过程进行了研究,并发现网络成长受科技环境影响很大,同时它又能反作用环境,进而改善区域创新环境。现代科学技术如纳米技术、生物技术、信息和通信技术的发展推动了创新网络的研究,这些技术在不同行业的广泛使用导致了组织界限的模糊,并产生了深而广的网络结构。例如,生物技术和纳米技术的快速发展,使得科技组织投入了大量的智力资本和物质资源,最终导致了网络的广泛发展(robinson,rip,&mangematin,2007)。因此,越来越多的国家认识到创新网络在提升自主创新能力、提高国家竞争力和创造财富方面的重要性。在美国、英国和澳大利亚,政府的创新政策由鼓励研发投入到鼓励建立多部门合作的创新网络构建(corley,boardman,&bozeman,2006)。虽然目前创新网络的研究取得了长足发展,但有必要进一步分析其形成机理以便于完全认识它的潜在优势。本文研究的是在前人研究的基础上重点分析创新网络的本质特质,然后就创新网络研究机理进行分析,并找出其中的发展规律。

二、创新网络的本质特征

网络广义含义被认为是由不同的主体和主体间的关系组成。在创新网络中,创新主体通过建立各种正式或非正式的关系,进而获取创新资源,并有效地提高创新效率。创新网络之所以能在创新活动中发挥巨大的作用是基于它的五大特性:

1.互补性。由于不同的创新主体拥有不同的创新资源,在创新过程中发挥着不同的创新作用。通过共享知识和技术资源,创新网络中的创新主体间的合作可以降低创新成本,进而提高创新效率,即产生“1+1>2”的协同效应。由此可见,创新网络中的企业之间、企业与高校、科研院所、政府和中介机构之间形成了优势互补、相互促进、共同发展的良好局面。

2.开放性。网络创新活动通常是创新主体间互动频繁和内外交流频繁的过程,创新网络之所以具有创新优势,是因为网络主体间科研通过频繁交流产生网络互动效应,网络节点通过与网络外发生多方位、多层次的联系,获取更广泛的知识和互补性的资源。开放性的网络便于创新主体与外界联系,及时了解网络内外相关技术和市场信息,提高与网络外先进技术和市场的对接能力,确保创新活动可以更好地适应外界环境的最新变化。

3.动态性。由于创新网络中的企业是随时进入和退出的,创新网络结构相应的产生变迁,表现在跟随性变迁和选择性集聚等方式,这就决定了创新网络的动态变化特性。其次,由于创新资源分布在网络的各个节点中,创新资源的产生和流动也决定了创新网络的动态性。网络创新的实质是网络内企业相互学习的过程,相邻节点(企业)间可以更加便利地分享创新成果和知识。此外,创新主体与外界进行知识交流决定了网络的动态性。随着信息化的加快发展,要取得更大的创新,必须有效突破地域的束缚,更多的与外界互动以便有效提高网络整体的创新能力。

4.根植性。创新网络的形成往往与地方经济、社会发展、文化制度有着密切的联系。一个创新网络内的企业因为具有共同的社会文化背景,处于相近的制度环境中,其经济行为便不约而同的植根于网络内共同的知识背景和游戏规则中,由此产生的聚合效应的就越多。创新主体通过非正式的社会网络有机的联系在一起,有效增强了网络成员间的信任,这既有利于传播和扩散显性知识,更有助于隐形知识的流动和共享,进而增强了网络的创新能力。

5.协同竞争性。创新网络内各主体间既存在协作的关系也存在竞争的关系。创新主体间在注重协作的同时,往往为了追求最大利润而展开竞争,当然,竞争与协作并非矛盾体,有效地竞争为共同创新提供了动力,只不过这种竞争是在协作的基础上,可以看作是一种协作性竞争。

三、创新网络形成的复制动态演进博弈模型

创新网络的形成过程必然涉及到企业竞合问题,在讨论企业竞合问题时,学术界通常应用合作或非合作博弈方法。传统博弈论通常假设博弈双方是完全理性的,而且在信息充分的环境里,由此得出的博弈均衡解未免牵强。而smith(1974)提出的演进博弈理论正好弥补了传统博弈论的不足。matthew和alison(2002)曾指出“由于演进博弈理论具有动态调整和学习过程等动态机制特征,从而为研究群体行为进化和稳定机制提供了较好的分析方法”。zander(2002)在研究瑞典通用电器公司与瑞士的brown-boveri合作创新网络的形成时指出,创新网络的最初形成具有一定的经济逻辑,当网络形成时,由于某种经济动因开始不断地演进,其形成是一个不断演进的复杂的过程。

本文从有限理性出发,认为博弈双方的策略均衡不再是一次性博弈的结果,而是一个不断学习和调整的结果,通过多次博弈和长期的学习与改进,博弈双方趋向稳定策略,而且在稳定策略条件下,个别“突变”策略并不能带来收益,此时的稳定策略称之为“进化稳定策略”(ess)。正是由于创新网络具有互补性、开放性、动态性、根植性和协同竞争性才导致了网络的复杂性,进而导致创新主体间博弈的有限理性。在有限理性前提下,创新网络的形成便是一个动态的学习与调整过程。因此,本文在分析创新网络具有的特性基础上,借助演进博弈理论研究创新网络形成机理,构建创新网络复制动态模型,并从中找出影响创新网络形成的主要因素。

1.博弈模型的建立。假设现有一个正在成长中的创新网络,在网络外部存在一些试图加入该网络的企业。假设博弈方a代表网络外部试图加入的企业群,博弈方b代表网络内部企业群。博弈方a有两个选择,一是“加入”网络,二是“不加入”;博弈方b也有两个选择,“接受”或“不接受”a的加入。由于博弈双方对创新的认识能力和预测能力有限,因此,博弈双方符合有限理性的条件。博弈双方支付矩阵如表1所示。

表1中r′a、r′b分别表示博弈方a如果无法加入创新网络时双方的收益;ra、rb分别表示博弈方a加入网络后双方的收益。其中r′a?茁ata,?酌btb>?茁btb,这在后面的研究中得以证明。

2.博弈过程分析。现假设博弈方a采取“加入”创新网络策略的企业比例为?姿,则采取“不加入”策略的企业比例数为1-?姿;同时假设博弈方b采取“接受”a加入创新网络策略的企业比例为?籽,则采取“不接受”策略的企业比例为1-?籽。因此可以计算出博弈方a选择“加入”和“不加入”策略的期望收益uea、una,以及博弈方a的平均收益ua,各收益表达式分别为:

uea=?籽(ra+?酌ata-?茁btb)+(1-?籽)r′a(1)

una=?籽r′a+(1-?籽)r′a(2)

ua=?姿uea+(1-?姿)una=?姿?籽ta(?酌a-?茁a)+r′a(3)

同理可得博弈方b选择“接受”策略和“不接受”策略的企业期望收益和平均收益uyb、unb、ub,数学表达式分别为:

uyb=?姿(rb+?酌btb-?茁btb)+(1-?姿)r′b(4)

unb=?姿rb+(1-?姿)r′b(5)

ub=?籽uyb+(1-?籽)unb=?姿?籽tb(?酌b-?茁b)+r′b(6)

我们知道,复制动态概念指出博弈的优势策略转变是一个渐进过程,因此可以用复制动态公式表示策略调整的速度,现在对博弈双方进行复制动态分析。

博弈方a群体复制动态方程为:

公式(7)表示博弈方a选择“加入”策略类型的企业随时间变化的比率与博弈方a的企业数量成正比,与博弈方a选择“加入”策略类型的期望收益大于所有博弈方a平均收益成正比。

博弈方b群体动态方程相位图如图2所示。

3.博弈结果分析。基于上述创新网络形成演进博弈模型可知,博弈双方的比例变化复制动态的关系可以在以两个比例?姿,?籽为坐标图上标示,如图3所示。从图3可以看出,博弈双方的进化稳定策略(ess)只有唯一点(?姿*=1,?籽*=1),其他各点均不具有复制动态的收敛特性,且抗扰动能力差。由此可见,在有限理性条件下,博弈双方经过长期的反复博弈后,学习和调整策略的结果是:潜在加入创新网络的企业在?酌a>?茁a情况下,即创新收益大于创新风险的条件下,则加入创新网络带来的收益大于0((?酌a-?茁a)ta>0),在利益驱使下,最终所有的企业都选择加入创新网络;同理,创新网络内原有企业在?酌b>?茁b情况下,最终选择的结果是接受新企业的加入。由此可见,当收益系数?酌越大,风险系数?茁越小时,博弈结果最终收敛于(?姿*=1,?籽*=1)的可能性就越大。

在创新网络中,收益系数?酌通常与企业的吸收和转化创新知识的能力有关。实践证明,通过提高员工素质,构建良好的企业内外部正式和非正式的交流渠道,能够有效提高企业吸收和转化知识的能力,进而促进创新网络的形成和维护。风险系数?茁主要是由创新网络的内外部环境决定,如果创新网络所处环境良好,每个创新主体间彼此信任,网络内正式和非正式交流和合作关系融洽,那么每个创新主体都愿意合作,合作创新意愿越强,越容易促使创新网络的形成。在运行效率高的创新网络中,企业采取合作创新所付出的成本就越小,相应的创新风险系数就越低。因此,良好的网络环境对创新网络形成及运行具有重要的促进作用。

博弈论的研究特点篇6

【摘要】本文分别对国内外关于知识型员工监管激励的研究做了总结并指出其存在的问题,主要讨论有关知识型员工监管激励的理论渊源、发展情况及存在的挑战与演化博弈论在知识型员工监管激励研究中的应用前景。

【关键词】知识型员工监管激励演化博弈研究综述

1前言

随着全球化竞争和区域竞争的到来和加剧,如何提高企业的核心竞争力是关系到企业生存发展的关键。但是,就目前在对知识型员工的管理即如何监督、激励等过程中仍存在不少问题。正是基于此,我们选择“企业中知识型员工的监管激励演化博弈分析模型”作为研究方向,针对企业中的实际情况,在考虑到相关职能部门、企业与知识型员工相互博弈以及这三方均具有有限理性的情况下,对知识型员工的激励机制进行研究;在此基础上,设计可行的激励机制,激发知识型员工的积极性和创造性,并期望能为相关职能部门和企业制定激励政策提供理论依据和决策参考。

2知识型员工的定义和特征

2.1知识型员工的定义

管理大师彼得·德鲁克首先提出知识型员工这一概念,即知识型员工是指那些掌握和运用符号和概念、利用知识或信息工作的人。

概括来说:知识型员工是凭借自己所受教育,实用脑力劳动创造价值,与一般员工相比,具备较强的学习知识和创新知识的能力,拥有知识资本和创新能力,利用现代科学技术知识提高工作效率为企业带来知识资本增值,并以此为职业的脑力劳动者。

2.2知识型员工的特征

(1)强烈的自我价值实现愿望,他们往往更加在意自身价值的实现,并强烈期望得到社会的认可,他们往往更加热衷于具有挑战性的工作,希望展示自我价值。

(2)对权威的蔑视性,知识型员工由于渴望展示自己的价值,往往表现出权威的蔑视。

(3)具有高度的独立性。由于知识型员工拥有丰富的知识资本,因此往往主观上不愿受制于人。他们更强调自我控制、自我管理、自我引导和自我发展。

(4)学习愿望强烈,富于创造精神。他们喜欢做前沿性、挑战性的研究,在易变不完全确定的系统中发挥个人的资质和潜力,创新是他们体现自我价值的方式。

3关于知识型员工监管激励的研究状况

3.1国外知识型员工监管激励的研究状况

美国著名的管理学家彼得·德鲁克(2001)提出了知识工作的概念:知识型员工是指“那些掌握和运用符号和概念,利用知识或信息工作的人”。知识型员工一方面能充分利用现代科学技术知识提高工作效率,另一方面知识型员工本身具有较强的学习知识和创新知识能力。知识创新能力是知识型员工最主要的特点。此外,知识型员工的工作主要是一种思维活动,知识的更新和发展往往随环境条件的变化而有所适应,具有很大的灵活性。所以知识型员工兼具知识型、创造性、灵活性等方面的特征。加拿大的著名学者、加拿大优秀基金评选主审官弗朗西斯.赫瑞比(2000)认为:简而言之,知识型员工就是那些创造财富时用脑多于用手的人们。他们通过自己的创意、分析、判断、综合、设计给产品带来附加值。在西方发达资本主义国家,员工监管激励在管理界已经是一个相当古老的话题,早在十八世纪末,十九世纪出,企业界和管理界就对监管激励员工、提高劳动生产率进行广泛而深入的研究。

3.2国内知识型员工监管激励的研究状况

国内学者张伶,张正堂(2008)认为虽然双因素理论和工作特性理论都说明与工作有关的内在激励因素对于员工行为重要的激励作用,但是,双因素理论因素中关于“激励因素”和“保健因素”的划分是模糊的,而不同学者对于工作特性唯独的划分也是模糊的,因此,他们基于知识型员工的特性分析,提出内在激励特性包括工作自、晋升机会、上级支持、人与组织匹配等4个方面,并建立了这些内在激励因素对知识员工工作态度、工作绩效影响关系的假设模型和以苏北地区企业的知识型员工为研究对象,通过实证检验发现,工作自、晋升机会、上级支持、感知的人与组织匹配通过工作满意度、组织承诺对工作绩效有正向显著影响。郝敏怀(2009)从如何培训开发、职业生涯规划和薪酬激励等方面针对企业专业技术人才这一典型的知识型员工的人才激励策略进行了探讨,同时认为按照马斯洛需求层次理论,为满足专业技术人员各个层面的需求还必须多种激励方式相结合,实现多渠道激励。余莉(2009)通过阐述激励的机制和基本理论,在分析研发人员个性特征和主导性需求的基础上,提出了针对研发人员的激励方法策略,其指出在物质激励中的薪酬激励的设计上,既要注重刚性工资的竞争性、成本性,更要突出激励性因素的作用,加大基于绩效的弹性工资力度,并且在这方面拉开差距。

3.3对国内外知识型员工监管激励的评价

纵观国内外研究,我们可以看到目前对监管激励的研究主要是沿着监管激励的作用机理展开,在分析诸如专业技型员工,科技研发人员这些典型的知识型员工的特征的基础上,分析激励因素和激励过程,建立监管激励模型,监管激励模型基本上是在企业利润最大化和“经济人”的人性假设,以主客体的博弈研究各种监管激励机制。但目前对于监管激励模型的构建大多都是基于传统博弈论,传统博弈论假设行为主体都是具有完全理性即行为主体始终以自身最大利益为目标,具有各种环境中追求自身利益最大化的判断和决策能力,具有在存在交互作用的博弈环境中完美的判断和预测能力,不会发犯错,不会冲动,没有不理智。很显然,现实世界中这种假设通常是得不到保证的。同时,纵观国内外研究,我们发现,在政府相关职能部门、企业与知识型员工相互博弈的情况下,学界对知识型员工监管演化博弈机制尚不多见,因而本课题采用演化博弈论的方法,对行为主体采取有限理性的假设,即行为主体被假设为程序化地采用某一既定行为,他对于经济规律或某种成功的行为规则、行为策略的认识是在演化过程中得到不断地修正和改进的,成功的策略被模仿,进而产生出一些一般的“规则”和“制度”作为行为主体的行动标准。在这些一般的规则下,行为主体获得“满意”的收益,这与现在情况更符合。因此,我们在考虑到相关职能部门、企业与知识型员工相互博弈以及这三方面均具有有限理性的情况下,运用演化博弈的方法构建知识型员工监管的演化博弈模型,运用复制动态方程对企业和知识型员工的演化稳定策略进行分类讨论,找出政府、企业和知识型员工三群体类型比例变化复制动态关系,对如何有效监管和激励企业知识型员工提出对策和建议。

4基于演化博弈论对知识型员工监管激励的研究思路

本课题将通过基于行为主体有限理性假设的演化博弈理论,打开对企业知识型员工监管激励的新思路。

4.1演化博弈论基本理论的概述

在传统博弈理论中,常常假定参与人是完全理性的,且参与人在完全信息条件下进行的,但在现实的经济生活中的参与人来讲,参与人的完全理性与完全信息的条件是很难实现的。在企业的合作竞争中,参与人之间是有差别的,经济环境与博弈问题本身的复杂性所导致的信息不完全和参与人的有限理性问题是显而易见的。

与传统博弈理论不同,演化博弈理论并不要求参与人是完全理性的,也不要求完全信息的条件。有限理性这一概念最早是由西蒙在研究决策问题时提出的,它是指人的行为只能是“意欲合理,但只能有限达到”。威廉姆森在研究影响交易费用的因素时,对有限理性的问题进行了归纳总结人的有限理性是由两方面的原因引起的:一方面是由于人的感知认识能力限制,它包括个人在获取、储存、追溯和使用信息的过程中不可能做到准确无误;人的有限理性的另一方面则是来自语言上的限制,因为个人在以别人能够理解的方式通过语句、数字或图表来表达自己的知识或感情时是有限制的(这或许是因为他们没有掌握到所必需的词汇,或许是因为这些词汇还不存在),不管多么努力,人们都将发现,语言上的限制会使他们在行动中感到挫折。从这两个方面而言,完全理性的人根本就不可能存在。

演化博弈论(evolutionarygametheory)是近年来博弈理论的新发展,最初产生于生物学领域。它放弃了传统博弈论的充分理性假说,将生物体视为有限理性(boundedrational)的当局者,它们在相互竞争的同时完成自身的进化,合理解释了某些生物习性的形成。随后,经济学家将之引入经济分析中,将人也视为有限理性的生物体,认为社会制度并非是人为设计的结果,而是大量有限理性的个人在相互博弈的基础上形成的一种适应环境变化和社会发展的均衡态,它们不断被保存下来,又不断向前进化,即在所谓适应性进化(adaptiveevolution)的过程中产生并发展起来的。演化博弈论的产生、发展在本质上就是起因于博弈论中关于理人的假设与经济应用中行为人“试验——失误”(即试错法)学习过程相偏离的事实而引发的。

4.2基于演化博弈论方法的知识型员工监管激励的研究思路

纵观国内外的相关研究,在政府相关职能部门、企业与知识型员工相互博弈的情况下,学界对知识型员工的监管博弈机制研究尚不多见。正是基于此在考虑到相关职能部门、企业与知识型员工相互博弈以及这三方均具有有限理性的情况下,构建知识型员工监管的演化博弈模型,运用演化博弈论的方法对相关职能部门、企业与知识型员工之间相互作用时的策略选择行为进行分析,对知识型员工的监管激励机制进行深入研究;在此基础上,设计可行的监管激励措施,从而能最大程度激发知识型员工的积极性和创造性,并期望能为相关职能部门和企业制定监管激励政策提供理论依据和决策参考。

5结语

本文对国内外关于知识型员工监管激励的研究做了总结并指出其存在的问题,在简要概述知识型员工的内涵及其特征的基础上,对知识型员工监管激励的理论渊源、发展情况及存在的挑战与演化博弈论在知识型员工监管激励研究中的应用前景进行了探讨。特别需要强调的是,演化博弈理论摒弃了博弈论完全理性的假设,比博弈论能更好的解释和分析现实中的经济和管理问题,因此,期望通过对知识型员工监管的演化博弈模型的构建能为相关职能部门和企业制定监管激励政策提供理论依据和决策参考,从而在对知识型员工的监管激励机制问题的研究上迈出更加深入的一步。

参考文献

[1]弗朗西斯·赫瑞比:managingknowledgeworkers[m].机械工业出版社,2000.

[2][美]约瑟夫m.普蒂.海茵茨.韦里奇.哈罗德·孔茨著.丁彗平、孙先锦译.管理学精要(亚洲篇)[m].机械出版社,2005:363.

[3]斯蒂芬.p罗宾斯.组织行为学.中国人民大学出版社,1997:81-92.

[4]余莉.研发人员个性特征与有效激励方法研究[j].中国钼业.2009.33(1).53-56.

[5]胡恩华.刘洪.企业中知识型员工的监管博弈分析[j].工业技术经济.2005.24(4).53-55.[j].2009.23(1).10-13.

博弈论的研究特点篇7

关键词：博弈论；财经类院校；教学改革

中图分类号：G642.0文献标志码：a文章编号：1674-9324（2017）05-0185-02

博弈论是研究决策主体的行为发生直接相互作用时决策主体的决策以及这种决策的均衡问题的，也就是说，博弈论的研究对象是当一个主体，比如说一个人或一个企业的选择受到其他人或其他企业选择的影响，而且反过来影响到其他人或其他企业的选择时的决策问题和均衡问题。[1]

在经济学文献中对博弈论最早的研究是古诺（1838）、伯川德（1883）和埃奇沃斯（1925）关于垄断定价和生产的论文，但是这些都被视为特例而没有改变经济学家思考大多数问题的方法。约翰・冯・诺依曼和奥斯卡・摩根斯坦在他们1944年著名的《博弈论和经济行为》一书中引进了博弈理论的思想，书中提出大部分经济问题都应该被当作是博弈进行分析。[2]

20世纪五六十年代是博弈论发展和研究的重要阶段。纳什在1950年明确提出了“纳什均衡”这一基本概念，解释了博弈论和经济均衡之间的内在联系。到20世纪50年代，合作博弈的发展达到鼎盛时期，包括纳什和夏普利分别提出的“讨价还价”模型以及吉利斯和夏普利提出的合作博弈中的“核”的概念。泽尔腾于1965年将纳什均衡的概念引入到动态博弈，提出了“精炼纳什均衡”的概念；海萨尼于1967年把不完全信息引入博弈论，并提出了“贝叶斯纳什均衡”的概念。20世纪80年代以来，博弈论逐渐成为主流经济学的一部分。博弈论的应用范围也越来越广泛，包括经济学、政治学、军事、外交、国际关系、公共选择等。

由于博弈论在经济和管理领域的广泛应用，《博弈论》已经成为许多高校的经济与管理专业的本科生的必修课。我校也开设了《博弈论》课程。然而，由于博弈论课程开设时间较短，而且作为运筹学的一个分支，它对数学基础的要求较高，因此有必要对《博弈论》课程的教学进行深入的探讨。

一、博弈论课程的教学特点

1.数学描述比较抽象。博弈论的标准表达是函数形式和集合形式的表达。博弈论作为运筹学的一个分支，它和数学的结合非常紧密，需要比较严谨的数学表达和数学证明。例如，20世纪50年代纳什在证明纳什均衡的存在性定理时就使用了泛函分析中的不动点定理。学习博弈论，通常需要具备微积分、线性代数、概率论、泛函分析等数学基础。[3]

2.教学过程通常浅入深出。由于博弈论的概念和定理均采用严谨的数学表达形式，学生理解起来较为困难。因此，教师在教学过程中通常从简单直观的例子出发，引出博弈的抽象数学模型。简单直观的案例可以帮助学生理解博弈的思想，但随着讲授内容从完全信息静态博弈到完全信息动态博弈再到不完全信息静态博弈最后到不完全信息动态博弈，均衡的概念得越来越复杂，数学定理的证明过程也越来越困难。

3.具有广泛的应用领域。现实生活中存在各种各样的矛盾，这使得博弈论可以应用于多个领域，如商业、政治、外交等。在微观研究领域，交易机制的设计涉及博弈论；在中观研究领域，劳动力经济学和金融理论中都有关于企业要素投入品市场的博弈论模型。最后，从宏观的角度看，国际经济学中有关于国家间的相互竞争（或互相串谋）选择关税或其他贸易政策的模型；宏观经济学中也有货币当局和工资、价格制定者（厂商等微观单位）间的战略相互影响，最终决定了货币政策效果的模型。[4]

二、博弈论教学中存在的问题

1.缺乏足够的案例支撑。在案例的选取过程中需要考虑到案例的趣味性、贴近现实生活的程度、学生参与案例的程度、与知识点的结合程度等。虽然博弈论的教材中提供了一定量的案例，但仍显得不够丰富。特别是对于财经类学校的本科生而言，在学习理论知识的同时，需要将其与自己对经济社会活动的观察和认识相融合，以提高分析经济社会现象以及解决实际问题的能力。[5]因此，在教学过程中选择丰富的案例是非常有必要的。

2.偏重于理论教学。以往的博弈论教学，偏重于理论教学。采取的教学方式仍然是传统的灌输式的方法，老师在讲台上讲课，学生在台下听课，而且老师的讲课内容也只是教材上的理论知识，较为枯燥乏味，学生的课堂参与度不高。因此，在重视理论教学的同时怎样提高教学的趣味性并增强学生的课堂参与度是值得思考的问题。

3.考核形式单一。目前的考核形式仅限于笔试的方式，比较单一。由于博弈论是一门应用性比较强的学科，传统的笔试并不能很好地考察学生们对博弈论知识的掌握和应用程度。有的老师采取让学生做报告的形式进行考核。学生可以选择自己感兴趣的论文，在课堂上进行讲解，教师根据学生的报告情况进行打分。这其中存在的问题是学生选取的论文的难易程度很难掌控。因此，教师需要思考如何丰富考核形式并且让考核更加真实全面地反映学生的能力。

三、完善博弈论课程教学的建议

1.采用案例教学法。由于博弈论的数学描述通常比较抽象，老师通过分析案例来说明博弈论在经济和社会领域中的各种应用，既可以提高课程的趣味性，又可以帮助学生较深入地理解博弈论的基本原理。在案例的选取过程中，首先，要尽量选择简单的案例，使学生更加容易明白博弈的规则；其次，要注意选择契合现实生活的案例，有的案例不是学生的现实生活中的问题，学生理解起来可能较为困难；再次，要注意案例选择要尽量的多源化，由于博弈论在各个领域包括商业、政治、外交等均有应用，因此在选择案例的时候不要局限于某一个领域，应尽量选择不同领域的案例，帮助学生更加深入地理解博弈论的应用。

2.理论教学与实验教学相结合。传统的理论教学会让学生感觉枯燥乏味，学生的课堂参与度不高。我们可以将理论教学与实验教学相结合，设计丰富多彩的博弈实验，将学生分成小组，然后小组内进行角色扮演，小组内不同的学生扮演不同的博弈参与者，他们之间进行竞争、讨价还价或者合作。博弈实验可以提高课程的趣味性和应用性，增强学生的课堂参与度，这种互动式的教学将极大地提高学生的学习兴趣和效率。[6]

3.理论教学与实践教学相结合。由于博弈论是一门应用性比较强的学科，仅通过学习理论知识并不能很好地掌握博弈论的思想。因此，教师可以在笔试的基础上丰富考核形式。让学生针对现实生活中的博弈问题进行建模分析，在课堂上进行汇报并整理成小论文的形式上交。为了提高所有学生的课堂参与度，对于课堂汇报过程中提问的学生给予适当的分数奖励，提出的问题质量越高，分数的奖励越大，被提问的学生回答地越好，课堂汇报这部分的分数也将越高。这一方面可以激励学生认真地进行建模分析，认真地准备课堂汇报，也将鼓励所有的学生参与到课堂汇报中。[5]

四、结语

随着经济社会的发展，越来越多的问题将借助于博弈论进行分析。因此，财经类院校的本科生学习博弈论，掌握其思维方式和思想及在经济管理中的应用是非常有必要的。本文首先分析了博弈论课程的特点，然后指出了目前博弈论教学中存在的一些问题，针对这些问题，本文给出了具有针对性和可操作性的建议。本文将为财经类院校本科生博弈论课程的教学提供有益的启示。

参考文献：

[1]张维迎.博弈论与信息经济学[m].上海：上海三联出版社，1999.

[2]朱・弗登博格，让・梯若尔.博弈论[m].北京：中国人民大学出版社，2002.

[3]浦徐进.本科博弈论教学过程中的案例运用[J].江南大学学报：教育科学版，2009，（4）：372-375.

[4]吉本斯.博弈论基础[m].北京：中国社会科学出版社，1999.

博弈论的研究特点篇8

关键词：产学研；校企合作；博弈

中图分类号：F224.32文献标识码：a收稿日期：2016-04-05

科学技术的快速发展和顾客需求的复杂多变，使企业生存环境越来越不稳定。同时，经济全球化和买方市场的形成，使企业之间的竞争不断加剧。巨大的环境压力迫使企业从各个方面寻求具有竞争优势的途径。校企合作是其中一种有效的改善方式。通过校企合作，双方可以实现优势互补，创造协同效应，加速技术创新。同时，校企合作还能提高双方的反应能力。此外，校企合作能有效降低双方在技术创新中的风险与成本。因此，本文试图研究校企双方的合作博弈所产生的效果。

一、校企合作是一种非零和博弈

博弈论（Gametheory），又称对策论、游戏论，是研究博弈中参与者各自所选策略的科学理论。其实质是研究组织或人的行为。博弈论假定组织或人是理性的，在一定约束条件下，追求其自身利益的最大化。也就是说，一个主体的选择受到其他主体的影响，并反过来影响其他主体选择时的决策问题和均衡问题。[1]博弈论包括参与者、行动、信息、战略、支付函数、结果、均衡等七个基本要素，其中参与者、信息、战略和支付函数是主要的构成要素。通过参与者、行动、结果所组成的博弈规则，可使参与者获得最大化的收益。博弈论广泛而深远地改变了经济学家的思维方式，作为一种研究主体行为的相互作用及均衡状态的理论方法，越来越受到社会的重视。

随着经济全球化，知识经济、信息技术和互联网的飞速发展，经济竞争主体以“链”式和“联盟”为主要组织形态成为经济环境的主要特征。[2]无论对企业还是高校，其生存和竞争的环境正在发生质变。从全球范围来看，校企合作以“知识供应链”“技术和产品供应链”或“创新联盟”等形态普遍存在。[3]同时，随着需求特征的个性化和创新风险的增加，校企合作有进一步加强和紧密的趋势。

从前面的分析可以看出，校企合作创新的前提与博弈论的观点是一致的。以博弈论这个独特的视角来解释校企合作问题，可以得到更加科学和合理的结论。高校具有技术开发的平台优势和人力资源的培养优势，企业则拥有工业化制造技术、产业化市场开拓优势，商品需求信息和资金筹措优势。[4]双方把各自具有的独特资源和优势进行有效组合，通过资源共享和优势互补，达到前所未有的系统集成优势，这是合作博弈存在的一个基本条件。因此校企合作创新本身就可看作是一个博弈问题，可以运用博弈论的基本理论和方法来分析。从博弈论看，校企合作创新属于完全信息动态博弈问题，存在各方满意的最优安排的纳什均衡。

在博弈论的模型中，根据全体参与者的支付总和是否为零，将分为零和博弈（zero-sum-game）与非零和博弈（non-zero-sum-game）。校企合作作为一种新型的博弈关系，属于“非零和博弈”范畴，即校企合作是一种效益大于零的合作。无论是从国家的角度，还是从整个人类进步的角度来看，促进整个社会和企业的创新，实现科技进步是政府、企业、高校共同关心的利益和话题。高校拥有知识和技术的比较优势，但缺乏对市场的把握和将技术商业化的能力，而这些正是企业所长。校企合作能够融合更广域范围内的信息资源、知识资源、智力资源，实现优势互补。通过这种合作为整个社会服务，产生的协同效应远远大于高校、企业各自单独为社会创造的价值之和。

二、校企合作是一种合作博弈

根据参与者是否合作，博弈可以分为合作博弈（cooperativegame）与非合作博弈（non-cooperativegame）。人们现在谈到博弈论时，一般都是指非合作博弈。合作博弈与非合作博弈之间的主要区别在于博弈方的行为相互作用时，博弈方能否达成一个具有约束力的有效协议（bindingagreement）：如果能，就是合作博弈；否则，就是非合作博弈。例如，两个寡头企业如果能达成一个协议，联合起来获取最大化垄断利润，并且各自按这个协议生产，那么这就是合作博弈。企业所面临的问题就是如何分享合作带来的剩余。[5]非合作博弈强调的是个人理性、个人最优决策，其结果往往是低效率的甚至是无效率的。而合作博弈强调的则是团队理性、效率、公正、公平，这实际上就是一种“双赢”或“多赢”策略，通常能获得较高的效率或效益。

校企合作是高校和企业为了实现信息资源共享、利益互惠的目的而组织起来的。这种合作一旦形成，就形成商业合作关系，受共同认可的协议与合同制约。因此，这应该是一种合作博弈，表现出的是合作共赢、集体利益的最大化。[6]

无论哪种校企合作模式，都是基于共同的利益而建立起来的组织，合作双方或多方将在技术开发、产品创新、知识共享、风险共担、服务协作等一个或多个方面进行合作。这种合作方式应该具有区域的跨国性、行为的战略性、范围的广泛性、管理的规范性等特征。通过这种合作方式，校企合作双方甚至政策供给者――政府都可以获得较高的效益，从而使社会、高校和企业三方共赢。

三、校企合作的博弈模型

假设一项技术成果成功实现商业化后获得总收益为Q。将该成果从研发到最终实现产业化的全部成本包括两部分：一部分是用于技术研发的成本为CR，另一部分是用于将该技术成果进行产业化实施的成本Ct，效益为Q。

为了便于讨论，本文对模型进行如下假设：①技术成果商业化的收益Q、研发成本CR、产业化成本Ct均为常数，且为高校和企业共有的知识。②大学没有能力独立将技术成果进行商业化，即大学不会独立进行创新活动。因此无论采取哪种合作方式，将成果进行产业化的成本即Ct均由企业支付。③合作过程中不存在道德风险。

在校企合作创新的博弈过程中，企业首先行动。在第一阶段，企业有三种战略：第一，通过技术转让从大学获得关键技术，开发出新产品。第二，要求大学参与到开发和商业化过程中，共同完成创新。第三，企业自主研究开发完成创新。其中前两种战略属于合作创新，后一种是自主创新战略。

技术转让：即企业与高校通过协商确定一个价格p，按照该价格一次性向学校支付转让费用，从而完全拥有该成果的收益Q。此后企业独立承担产业化的风险，并独享商业化带来的利润。本文将博弈主体的收益与成本的比值定义为其收益率。在这种情况下，企业和高校的收益率若相等，即可得出双方实现交易时的转让价格。

合作研发：企业在前期即参与项目的研发过程，并投入一定比例的研发经费。设企业投入研发的比例为a。当成果完成商业化后，双方又按照协商好的比例分配销售收益。假设企业在利润分成中的比例为B，则高校的收入分配比例为1-B。在这种情况下，企业和高校的收益率若相等，可以得出：要使企业和高校之间成功进行合作研发，企业在利润分配时的比例应大于其投入研发的成本，否则合作研发的协议是无法在双方之间达成的。

独立研发：即在技术的研发和产业化的过程中，全部成本完全由企业自己支付。实际上，独立研发可以看作是在上述合作研发的情况下，当a=1，B=1时的一个特例。可以看出，无论企业采用哪种合作方式，只要高校选择接受，都会有一定的收益；而拒绝，则没有任何收益。因此，对大学来说，与企业进行合作创新均是占优策略。而实际上，由于道德风险的存在，当高校选择与企业进行合作创新时，其收益并不一定都是正值。因此必须建立规范、成熟的市场机制，减小道德风险的概率，从而保护高校参与合作创新的积极性。

而对企业来说，究竟技术转让和合作研发哪个是占优策略，则取决于技术转让收益和合作研发收益两者之间大小的比较。当Ct+CR>Q时，技术转让收益大于合作研发收益，则技术转让是企业的占优策略，否则合作研发是企业的占优策略。由此可以看出，技术成果的研发和转让成本的大小对企业选择合作方式具有十分重要的作用。如果一项技术成果的研发和转化难度较大，需要投入成本甚至超过最终收益，则企业将会选择直接转让的合作方式。如果这时企业选择进行自主创新，则收益将会是负值。因此这也就是企业与高校合作创新的最主要内部动因――实现优势互补，资源共享，节省研发成本。而对一项研发和转化相对容易，需要投入成本较低的技术成果，即Ct+CR

四、结论

综上所述，本文认为校企合作是一种非零和合作博弈机制。虽然竞争是市场经济永恒的规律，然而竞争的战略和方式却是多样的。在竞争逐渐激烈的网络社会中，校企合作作为高校和企业之间相互交织的组织，能够有效提高参与各方的竞争力。因此，通过合作博弈所得到的利益大于不合作所得到的利益，这也正是校企合作成为高校、企业和政府重要战略的基础。

大学与企业合作进行技术创新是当前我国技术环境及创新体制下提高创新效率的必然选择。而且在大学与企业之间的合作技术创新可以通过多种不同的形式来实现。在校企合作创新的过程中，技术研发的成本和收益之间的关系对高校和企业选择合作创新方式具有重要影响。本文的研究结论对高校、企业在合作创新实践的过程中，如何根据合作技术的特点和双方的实力选择合适的创新方式，对促进校企合作创新，制订有效措施均具有一定的借鉴意义。

参考文献：

[1]王立平，刘志迎.企业―科研机构合作创新的演化博弈分析[J].科技成果纵横，2005，（1）.

[2]杜鹃，李炎炎，叶斌，等.产学研合作模式中存在的共性问题及其对策[J].科技进步与对策，2005，（2）.

[3]马海纯.远程孵化器是产学研相结合的有效模式[J].高科技与产业化，2002，（1）.

[4]宋冬梅，张云宁.企业合作竞争的进化博弈分析[J].价值工程，2004，（7）.

博弈论的研究特点篇9

新世纪,中国金融市场将全面跨入有效益的金融市场的新阶段.有效益的金融市场是动态反映金融政策和货币、资金变化的金融市场.开拓、建立新市场是金融市场发展的强大动力.金融市场的发展对金融决策的影响力将大大增强.受利益机制的作用,不论战略投资者或非战略投资者通常利用博弈方式作出金融决策,博弈机制对金融市场的影响如何?如何采取最优对策?怎样做好金融管理?这是我们研究金融博弈要讨论的重要课题.

1金融博弈的重要性和必要性

为什么研究金融博弈?金融市场是金融资本配置的运行机制,它双向联接金融资本的供给和需求、投入和转投、输入和输出,对于金融资本在经济区域、产业部门之间的合理配置具有极其深远的影响意义.金融政策是经济政策的前导,对金融市场具有重大作用.金融政策调控金融市场,引导经济运行和结构重组.金融市场对金融政策的反映是最灵敏、最快捷的.但是对于金融政策,市场投资者采取不同形式的对策,这在金融市场上引起不同的变化情况,从而影响经济运行及结构调整.金融政策必须研究金融市场活动的这一特性,这对于实现政策目标意义重大.金融系统包括货币系统、资本系统以及共同基金系统.由于金融资产的市场化、证券化、基金化,金融市场规模网络化、庞大化,证券交易者需要在不同的市场之间、多样性证券组合之间作出抉择,金融行为必然是相互激励、相互约束的,金融活动必然是互动性的、博弈性的;出于对市场风险的防范意识,市场投资者也会采取博弈行为,这也会对金融证券市场发生影响.这些金融行为都具有金融博弈的特性.因此研究金融博弈是必要的,这可以大大提高金融活动的对策性、合理预期性.国家银行利率政策对于金融市场具有宏观调节功能.长期实行低利率政策是有利于资本市场和证券基金市场的建立和发展的,它使市场资金分流,当大量的社会资金进入长期资本市场时,资本市场出现高涨局面,推动金融资本配置系统的扩张、膨胀,对于金融工具的利用、开发,对于用金融投资创造出更大规模的固定资产投资起到极大的扩张性效应.金融市场运行效益提高会吸引成千上万的战略投资者进入长期市场,由于他们的金融市场扩张战略是极不相同的,金融市场出现多极化、大流量的对策均衡形式.战略投资者利用博弈方式对债券和股票市场做出的选择,对多种证券组合的选择,对企业股票的选择,都会使证券交易市场出现不同形式的动态变化.如何认识这一特性?应采取什么样的金融对策?这是研究金融博弈需要回答的问题.

2金融博弈的优势战略与劣势战略

金融博弈研究优势战略与劣势战略的关系.这与研究金融市场战略决策有关.但金融博弈既不同于金融战略,也不同于金融策略.金融战略是研究金融投资的战略资源与配置,战略利益与目标;研究金融战略方案的设计和制定;研究确定金融投资的重点和步骤,最大可能地实现金融战略目标.金融策略是研究战略投资的战术,策略和对策原则.它是根据金融战略设计的,是服从于金融战略的,是实施金融战略的具体步骤.金融博弈是研究金融活动的战略选择,它是按对策论原理研究设计金融战略、策略的,是制定金融战略、策略的研究工具,是为金融决策提供理论支持及咨询服务的.金融博弈的重要性就在于它是从博弈论角度研究金融活动的,它从全局高度研究各种金融策略的相互关系,相互作用,以及对战略利益发生哪些影响,必须采取何种对策.这对于提高金融决策水平是一项极为重要的工作.金融博弈重点是研究金融市场的优势战略.在金融市场上,优势战略取决于优势均衡的共同选择.优势战略是对参与者产生最大利益的战略目标.优势战略是建立在高度均衡利益关系基础之上的,由于它使金融市场的运行效率大大提高,必然引起金融市场上货币资金的供给扩张,使金融市场出现稳定上升的趋势,使金融市场的周期波动出现良好态势.这对于经济运行具有扩张性增长效应.如果偏离它,任何选择都只会导致缺乏稳定性的非优势均衡或劣势均衡,即低效益或负效益的利益均衡,使金融市场低效率或负效率运行.这使经济运行处于调整、收缩状态.战略投资者在金融战略的选择中,经常遇到金融市场的优势均衡和劣势均衡问题.近几年,中国证券交易市场、股票1、2级市场以及证券基金市场发展变化很快,证券市场的容量、交易帐户数量、资金流量以及交易频率都有成倍提高.如果每一个证券交易者都能够成功地把握住每一次机遇,都能够选择优势战略,实现金融市场的优势均衡,他们就能够成为最大的赢家.但是,由于博弈机制的负效应,不论战略投资者或非战略投资者都远远没有达到共同选择的优势均衡.它们在多数年份是处于非优势均衡或劣势均衡的,这表现为:①效益总量是负增长的,收支总量是等于或小于零和的;②在1级、2级市场,有大量资本沉淀或负效益运行;③股票市场价格收益比高达50倍以上,投资回收期非常长,投资收益率非常低.只有全面审视证券市场的博弈格局,选择新机制,才能摆脱非优势均衡、劣势均衡,使证券市场健康发展,出现广大投资者所期望的全赢局面.

3金融市场的新、旧博弈机制

金融博弈是新、旧机制的博弈.研究新、旧博弈机制的关系,需要研究金融市场博弈机制的基本格局.以证券交易市场为例,假设战略投资者面对的选择有2种,即持有金融股或其他某一成长股,例如高科技股,博弈结果如何?从现有标准模型1来分析,当有金融利好消息时,它有几种不同情况(见图1):①如果他们都作出正常反应,都大量持有金融股,当金融股价p受到利好消息推动而大幅度上升时,他们都会有不同水平的正赢利(记为+,+);②如果有一部分投资者a持有金融股,另一部分投资者B则持有其他股,那么,结果是a正赢利,B负赢利(+,-);③如果a持有其他股,而B持有金融股,则a负赢利,B正赢利(-,+);④如果这两部分证券交易者都持有其他股,那么,他们都会因此而发生亏损(-,-).第1种情况为优势战略、优势均衡.第2、3种情况都是不稳定的非优势均衡,由于博弈机制的作用,利益冲突都导致了第4种情况,即博弈双都处于负赢利的劣势均衡.这里,最优选择是都持有金融股,因为这是最优均衡.需要进一步研究的是,如果受到博弈重置机制的影响交易者利好卖出,当有金融利好消息时,金融股价p大幅度下跌,那么,博弈方式又是如何?它有下述几种不同情况:①如果两部分投资者都选择持有金融股,这时他们都会发生负赢利(记为-,-);②如果一部分交易者a选择金融股,另一部分交易者B选择了其他股,结果是a负赢利,B正赢利(-,+);③如果a选择其他股,B选择金融股,那么,a是正赢利,B是负赢利(+,-);④如果这两部分投资者都博弈地选择了其他某一成长性股票(例如科技股),那么,他们都是正赢利(+,+)的.在这一轮博弈中,第一种场合变为劣势均衡,第2、3种场合仍为不稳定均衡,第四种场合变为优势均衡.按这种博弈分析,我们建立模型2(见图2).在模型2中,最优选择是持有科技股,因为这里,它是最优均衡.把模型1和模型2加以合成,建立模型3(见图3).模型3是总体均衡的标准模型,模型1或模型2是它的局部模型.通过模型3,可从战略全局高度研究股市博弈的格局及相应的各种利益支配的均衡状态,从而作出最优选择.模型1、2只说明了股市单向价格博弈机制,我们建立模型3是为了全面研究股市的新、旧博弈机制的关系.我们从金融股和科技股博弈的典型例子,可以归纳出基本规则.①股市博弈是典型有效益证券市场的博弈方式.它是证券市场均衡的内生变量的调节机制,它具有互动性,双向性.这与商品市场的博弈机制是不相同的.商品市场的价格大战是单向价格博弈机制的典型事例,打价格战导致了两败俱伤的劣势均衡,它的优势均衡是双边都保持正常价格.而股市的博弈机制却是双向的、互动的,由于股价机制的双向作用,它的优势均衡和劣势均衡是相互作用、相互变动的.但不论其哪一个劣势均衡都会导致两败俱伤,因此,都必须注意控制博弈风险.②股市博弈是新、旧机制关系的博弈.假定模型1是研究旧机制的博弈格局,模型2则研究的是新机制的博弈格局,模型3则研究的是新、旧机制博弈格局的相互关系.反之则相反.金融博弈是对新、旧机制的相互关系的博弈.由于股市长期波动,新、旧博弈机制的相互关系和优、劣势均衡的位置是不确定的.这是与股市周期有关的,在股市扩张期,由于创新机制的作用,新机制处于优势,旧机制处于劣势;而在调整期,新、旧机制的优势均衡位置,则取决于增长机理的支撑作用,这时,旧机制处于优势是取决于其扩张性的增长基础的.金融管理必须处理好新、旧博弈机制的关系,才能使它对股市发展起到积极稳定的作用.③零和对策均势点和非零和对策势区域.在模型3中,以左上方第1格为例,如果对策均衡点恰处在两条“博弈线”的相交点上,这时双方对策的价格、交易量和效益总量是处于均衡状态的,由于双边力量达到了均衡形式,既不存在全赢,也不存在全输,我们把这一点称为“零和对策均势点”.零和对策均势点以外区域为“非零和对策均势区域”,如果对策点处在这些区域内,其博弈结果是非零和的,两个标有“+”号的区域均为双赢区域,博弈双方都获得赢利.两个标有“-”号的区域均为双输区域博弈双方都处于负赢利状态.其他格局可依此类推(见图3).

4金融博弈的双赢或全赢问题

金融博弈是零和与非零和的博弈.按博弈论模型,零和博弈是对博弈者的支付之和等于零的博弈.非零和博弈是支付之和大于或小于零的博弈,如果博弈结果的支付之和大于零,称为“大于零和博弈”.如果支付之和小于零,称为“小于零和博弈”.用C表示支付矩阵,R表示负支付矩阵,则有,（式略）以上的(1)式为零和博弈;(2)式为大于零和博弈;(3)式为小于零和博弈.(2)式与(3)式均为非零和博弈.在不同时期内金融博弈不完全是零和博弈,它具有非零和博弈形式.①从静态模型观察,在证券交易市场,交易价和交易量是处于波动状态的,在某一时点实际价格和均衡价格是不是一致?交易量和均衡量是不是一致?当实际价格和均衡价格不一致时,其交易量和均衡量也不一致,按实际价格计算,其效益总和是非零和.有一种观点认为,金融博弈只能是零和博弈,其结果只能是博弈双方有得必定有失,得失总和等于零.但这只存在于市场价格和均衡价格恰好一致时.均衡价格是基准价格,尽管市场价格总是趋近于它,但不一定总是同它相一致的.当市场价格和基准价格不一致时,其效益总和是非零和的.由于大量博弈基金的运作及市场效应使市场价格大大偏离基准价格,出现非零和的支付矩阵.②从动态模型观察,分析一个完整的金融市场波动周期,非零和博弈的超额效益和负效益似乎是完全相等的,是动态零和的.但分析表明它们是不完全相等的.金融活动是动态递增的进程,在每一单位时间内的效益序列中是存在着非零和博弈的,而且,随着金融市场的发展,其可能性曲线是向上移动的,即非零和的可能性是越来越大的.如假定某一时间内的参与者们都面对两种选择,即进入市场或不进入市场.如果他们都选择了进入市场,在市场上升期,由于优势均衡,进入者是全赢的,即他们都有不同水平的净赢利;在市场处于下降期,进入者是全输的,即都发生不同水平的亏损,这是因为,当获利者退出市场时,双向选择了负对策,结果导致了劣势均衡.如果他们都选择不进入市场,情况则恰好相反.这两种情况都是非零和博弈.那么,这个全赢全输是不是动态零和?在一定时期内,只要它们有不同的增长率和负增长率,全赢全输的效益总和就是不相等的,即非零和的.所以,我们不能认为金融博弈完全是零和博弈,它通常是存在着非零和博弈形式的.还需要指出的是,金融博弈是对金融周期的博弈.在经济发展时期金融市场是效益递增的,在局部市场之间具有非零和的博弈机制.即使当许多市场趋于零和时,某一市场也存在着非零和的博弈机制.但是,非零和不一定是全赢,也可能是全输.这取决于金融市场波动周期及投资者对机会的判断力和对风险的控制力.当战略投资者大量进入某一市场时,该市场就进入高峰,而当非战略投资者大量进入同一市场时,它将进入低谷.由于战略和非战略投资者的博弈,必然使金融市场经常处于周期波动状态,使价值总量的支配格局呈现出极为不同的变化形态,从而交替出现在零和与非零和之间、全赢和全输之间的极为不同、千差万别的变化情况.金融周期通常是领先并取决于经济周期的变化的,最长达到50年或更长时间,最短仅有几个小时,一般为8～10年(固定资产更新的经典周期),政策周期约为5年,我们把长周期称为“战略投资周期”,最短周期称为“交易周期”.金融证券市场是经济发展的新兴市场,它是随着经济的发展而发展变化的,它永远存在着全赢的机会.金融博弈不论在对策研究或实际运作上应当将争取全赢作为新战略的大目标.这是同经济发展高度相适应的.

5金融博弈的正、负对策均衡的市场效应

金融博弈是金融市场的最显著特点.在金融市场上,博弈机制具有不同的对策均衡形式及其市场效应.例如,在模型1中,股市博弈的双方力量都选择了金融股,使市场运行效率大为提高,都成为大赢家,这种选择是正对策均衡.如果双方力量都选择持有其他股,都成为大输家,这是负对策均衡,因为这时它是使市场效率趋于负增长的.又如,在模型2中,情况恰好相反,博弈双边力量都选择金融股为负对策均衡,双边力量都选择科技股为正对策均衡.当某一战略选择恰好和金融市场的优势均衡相一致时,由于市场效应,战略投资者都成为最大的赢家,这个赢是以高度均衡的利益关系为前提的,它提高了金融市场运行效益,对经济运行产生了极大影响,大大提高了经济效益,促进了经济良性循环,这使投资者都获得了丰厚回报.这是金融博弈的正效应.当市场投资者的选择都偏离了优势均衡时,市场运行处于非优势均衡区域,由于市场效率下降,对经济运行产生了负效应,使经济效益负增长,导致金融市场的劣势均衡,都成为大输家,这是因为博弈负对策产生的市场负效应引起的负效益.金融决策对每一对策及其市场效应必须加以分析.金融博弈是正、负对策均衡的博弈.那么,如何作出最优对策?①要用经济学、金融学的理论知识和分析工具,使用计算机互联网,观察分析金融市场变化的动态,了解公共信息和市场行业信息.②建立模拟对策基金,使用计算机网络研究模拟运作、设计金融博弈的对策程序.③在实盘运作上,要明确优势均衡的对策目标,了解博弈双方的对策行为,设计最优对策方案,采取与博弈对手相一致的优势战略(例如,进入或不进入市场).④注意控制在两个非优势均衡区内的博弈风险,规避在劣势均衡区内的博弈风险.⑤必须实行有效控制的市场运作,一发现市场效率趋于递减,就快速采取策略行动,规避金融市场风险.金融市场是国家财政的市场,是企业的市场,是金融证券投资者的市场,必须用国家法律的、经济的、行政的、教育的管理方法及市场自律的方式加强对金融活动的积极引导,建立规范的金融市场管理制度,维护金融市场运行秩序,保护金融市场的交易环境,保证金融资产投资者尤其是中小投资者的权利和义务,建立金融预警、监管系统,加强金融市场监管,大力提高对金融危机的防范能力.

博弈论的研究特点篇10

>>民营快递联合涨价博弈之败兼并和伯特兰德竞争的价格效应分析基于Swot分析的民营快递企业发展分析浅析民营快递企业职业化管理的博弈关系多寡头库诺特和斯坦克尔伯格竞争模型的博弈分析民营快递企业进军中国国际快递市场的障碍及其对策分析中小民营企业银行融资的博弈分析民营企业员工忠诚管理的博弈分析基于博弈论视角看网购快递涨价联盟的瓦解民营快递企业的发展对策研究民营快递企业转型的策略选择民营快递品牌经营的困境与出路快递市场相关方的博弈分析中小企业研发困境的博弈分析民营企业财务困境的预警分析民营企业的融资困境分析及策略探讨“涨价门”令民营快递变局凸显小企业融资困境博弈分析民营快递企业经营模式变革的问题与对策分析我国民营快递企业并购分析常见问题解答当前所在位置：l

[3]何浏B2B2C环境下快递服务品牌的消费者满意研究――感知服务质量的中介效应[J].中国软科学，2013（12）：114-127

[4]陆瑶，傅少川基于博弈论的我国民营快递市场竞争策略研究[J].物流技术，2010（7）：10-12.

[5]张维迎博弈论与信息经济学[m].上海：格致出版社，2012.

[6]axelrod，RtheevolutionofCooperation[m].newYork：BasicBooks，1984.

[7]SmithaD，plowmanDa，DuchonD，QuinnamaQualitativeStudyofHigh-reputationplantmanagers：politicalSkillandSuccessfuloutcomes[J].Journalofoperationsmanagement，2009，27（6）：428-443.

[8]HillJa，eckerdS，wilsonD，GreerBtheeffectofUnethicalBehaviorontrustinaBuyer-supplierRelationship：themediatingRoleofpsychologicalContractViolation[J].Journalofoperationsmanagement，2009（27）：193-281.

[9]蔺雷，吴贵生服务延伸产品差异化：服务增强机制探讨――基于Hotelling地点模型框架内的理论分析[J].数量经济技术经济研究，2005（8）：137-147

博弈论的研究特点十篇

博弈论的研究特点篇1

博弈论的研究特点篇2

博弈论的研究特点篇3

博弈论的研究特点篇4

博弈论的研究特点篇5

博弈论的研究特点篇6

博弈论的研究特点篇7

博弈论的研究特点篇8

博弈论的研究特点篇9

博弈论的研究特点篇10

相关作文

小学作文

初中作文

高中作文

作文体裁