数学建模博弈论十篇

发布时间：2024-04-26 03:56:52

数学建模博弈论篇1

abstract:withthedevelopmentofeconomy,theconstructionmarkethasbecomeregular.thebiddinglegislationplayanimportantroleinequity,public,qualityandagainstillegalcompetitionandcorruption.althoughtheenterprisespentalotofmaterial,timeonacomplexbidding,butusuallytheendisnotdesirable.onthebasisofbiddingevaluationanalysis,asetofsuitablebiddinggamemodelmethodsareconsidered,whichisusefulforscientificdecisiononbiddingpracticeinconstructionenterprises.

关键词:建筑市场;招投标;评标办法;博弈论

Keywords:constructionmarket;bidding;biddingevaluationmethod;gametheory

中图分类号:tU71文献标识码:a文章编号:1006-4311(2010)08-0100-02

0引言

工程项目建设招标投标是国际通用的、比较成熟的而且科学合理的工程承发包方式。承包商投标的目的是能够制定科学合理的技术方案并报出一份既有最大中标可能性又可以赢利的最佳的报价。

我国目前建筑市场竞争日益复杂和激烈,施工企业在注重提高企业内在素质的同时,加强工程投标工作的研究,优化投标决策,提高投标质量,是在市场竞争中生存和发展的重要保证。

我国的工程招标评估一般采用综合评估法,即对工程质量、施工工期、投标价格、施工组织设计或者施工方案、投标人及项目经理业绩等提出要求,并确定评价标准。这些要求和标准的确定也是因为业主的要求不同,所以各个标准也不尽相同。。一般以评分方式进行评估,得分最高者中标。采用经评审的最低投标价法,是在投标文件能够满足招标文件实质性要求的投标人中,评审出投标价格最低的投标人,但投标价格低于其企业成本的除外。

招标投标是为了营造公平、公开、公正的竞争环境,进一步规范我市建筑市场秩序,加快培育市场机制,遏制腐败现象发生,培育和建立统一开放、竞争有序的建筑市场,保证工程建设的顺利进行和建筑业的健康发展。但由于旧体制的功能与惯性还未消失,新体制的功能尚不完善,致使建筑市场交易成本过高,交易秩序出现混乱,影响了招标投标制度的效率。

本文认为,要对工程造价作出科学合理的评估,需要建立严密的数学模型,而根据实际情况,显然选择博弈理论更加合理。基于博弈论建立适应不同评标办法的投标模型,为施工企业的投标工作提供一些具有理论和实质意义的参考。

1博弈论投标报价建模的基本要素

1.1博弈论在投标报价建模应用中的适宜性博弈论是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题。博弈论的基本概念包括:参与人、行动、结果、信息、战略、支付函数、均衡。博弈分析的目的是运用博弈规则预测博弈均衡。

工程投标是一种对策行为,众多投标者之间就是一场博弈。投标人往往不具备甚至完全不具备竞争对手的投标信息资料,施工企业在与对手参与投标活动时可以认为是同时选择行动,因而可以运用不完全信息静态博弈理论来描述和解释工程竞标博弈。

1.2博弈论基本要素概述从理论上讲,博弈分为四种类型,分别为:

1.2.1合作博弈――研究人们达成合作时如何分配合作得到的收益,即收益分配问题;

1.2.2非合作博弈――研究人们在利益相互影响的局势中如何选决策使自己的收益最大,即策略选择问题;

1.2.3完全信息不完全信息博弈:参与者对所有参与者的策略空间及策略组合下的支付有充分了解称为完全信息;反之,则称为不完全信息;

1.2.4静态博弈和动态博弈:静态博弈指参与者同时采取行动,或者尽管有先后顺序,但后行动者不知道先行动者的策略。动态博弈指双方的的行动有先后顺序并且后行动者可以知道先行动者的策略。

为了说明博弈的各个类型,我们可以在这里举个例子:a、b、c、投票决定如何分配100万,他们分别拥有50%、40%、10%的权力,规则规定,当超过50%的票认可了某种方案时才能通过。那么如何分配才是合理的呢?按票力分配,a50万、b40万、c10万c向a提出:a70万、b0、c30万b向a提出:a80万、b20万、c0……

权力指数:每个决策者在决策时的权力体现在他在形成的获胜联盟中的“关键加入者”的个数,这个“关键加入者”的个数就被称为权利指数。

夏普里值:在各种可能的联盟次序下,参与者对联盟的边际贡献之和除以各种可能的联盟组合。

次序:abcacbbacbcacabcba,关键加入者:acacab,由此计算出a,b,c的夏普里值分别为4/6,1/6,1/6。所以a,b,c应分别获得100万的2/3,1/6,1/6。

以下结合具体实例,对博弈论涉及的各个要素进行逐一分析:

(1)参与人是指一个博弈中的决策主体,它的目的是通过选择行动(或战略)以最大化自己的支付(效用)水平。参与人可能是自然人,也可能是团体,如企业、国家,甚至若干国家组成的集团。在本文中,一般用i=1,…,n代表参与人。除了一般意义上的参与人之外,在博弈论中“自然”作为“虚拟参与人”来处理。

(2)信息是参与人有关博弈的知识,特别是有关“自然”的选择、其他参与人的特征和行动的知识。信息集是博弈论中描述参与人信息特征的一个基本概念,是参与人在特定时刻有关变量的知识。

(3)战略战略是参与人在给定信息集的情况下的行动规则,它规定参与人在什么时候选择什么行动。一般地,用si表示第i个参与人的特定战略,Si={si}代表第i个参与人的所有可选择战略的集合。如果n个参与人每人选择一个战略,n维向量S=(s1,…si,…sn)称为一个战略组合,其中si是第i个参与人选择的战略。

(4)支付在博弈论中,支付是指在一个特定的战略组合下参与人得到的确定的效用水平或者是指参与人得到的期望效用水平。参与人的目标是选择自己的战略以最大化其期望效用函数。在博弈论中,支付或者是指在一个特定的战略组合下参与人得到的确定的效用水平或者是指参与人得到的期望效用水平。

(5)结果是博弈研究者所感兴趣的分析,例如均衡战略组合,均衡行动组合,均衡支付组合等。

(6)均衡是所有参与人的最优战略组合,博弈分析的目的是预测博弈的均衡结果,即给定每个参与人都是理性的(理性是指有一个很好定义的偏好,在面临给定的约束条件下最大化自己的偏好)。博弈论中的均衡概念与一般均衡理论中讨论的均衡概念是不同的。

在博弈论里一个博弈可以用两种不同的方式来表述,一种是战略式表述;另一种是扩展式表述(或称为展开式表述),更适合于讨论动态博弈。因为本文中基于博弈论建立的报价模型都是静态博弈,下面仅给出适合于静态博弈的战略式表述(又称为标准式表述):

博弈的参与人集合:i∈Γ,Γ=(1,2,…,n)

每个参与人的战略空间:Si,i=(1,2,…,n)

每个参与人的支付函数:ui=(s1,…si…,sn),i=(1,2,…,n)

用战略式表述的博弈为:G={Si,Sn;ui…,un}

在这种表述中所有参与人同时选择各自的战略。所有参与人选择的战略一起决定每个参与人的支付。

2不同投标报价评分方法下的建模方法分析

目前,我国施工企业参与投标的项目报价评分办法主要有两种:一是经评审的最低价法;二是复合标底法。根据评分办法及可获取的数据类型应建立不同的博弈模型。具体来说,综合评估法采用较多,即对工程质量、施工工期、投标价格、施工组织设计或者施工方案、投标人及项目经理业绩等提出要求,并确定评价标准。这些要求和标准的确定,因业主的期望值、业主的管理水平、工程项目和建筑市场的实际情况的不同而不同。一般以评分方式进行评估,得分最高者中标。

2.1基于合理最低价法的成本分布函数博弈模型(信息较对称时)适用于合理最低价法投标的博弈模型在求最优解的过程中,成本分布函数的确定是关键。确定竞争对手承包工程的成本分布函数f(x),需要参考对手以往的设计报价记录,结合投标者现在的发展,运用一定的数理统计方法抽象得出,从而可以将企业的投标价格和具体的环境条件联系起来,具有动态性。

在具体方法上,首先研究只有两个投标者的成本分布函数博弈模型建模过程:只有两个投标者参与投标,即i=1,2。令bi为投标者i的报价,ci为投标者i的承包成本。假定ci只有i自己确切知道。竞争者之间都相互知道自己和其他投标者的ci独立地取自定义在区间[m,n]上的分布函数f(x)。则由以上定义可知投标者i的支付ui如下:

u(b,b,c)=b-c,if,b>b0.5×(b-c),if,b=b0,if,b

这是最简单的投标报价博弈模型。投标者i面临的问题是:

maxui=(b-c)f(x)dx,

其中:b为最优报价,c为实际成本,Φ(b)=f-1(b)。

2.2基于合理最低价法的模糊预测博弈模型(信息不对称时)

投标人投标决策分析时往往并不具备完全的资料信息,且竞争对手的投标策略是变化的。经实例证明采用基于“概率模型”的投标报价模型误差较大,偏于保守;而采用基于博弈模型和模糊预测的投标报价决策方法,更符合信息不完全情况下的投标竞标实际情况,其得出的最优报高率f更大,比前者为投标人带来更大的期望收益。因此,在信息不完备情况下的投标报价决策中,该投标报价决策方法更为有效。

具体方法是,通过研究收集竞争对手以往的投标报价分布情况的统计资料来作为分析的基础,直接建立报高率f与赢标率t的函数关系。

对很少遇到的或没有遇到的对手,则可以运用模糊数量法来确定其报高率f与赢标率t的关系。模糊预测模型为:t=a0+aigf,其中a0=(a0,c0),ai=(ai,ci)是模糊数,ai为模糊数的中心值,ci为模糊数的模糊幅度。

如果投标人在某次投标竞争中有m个已知竞争对手,n个未知对手,对成本的估算为c,则对于该投标者而言,是首先分别分析已知竞争对手和未知竞争对手总体赢标率,并取其大者作为最优投标报价报高率f*的函数输入,求得最优报价。

3结论

在博弈模型建立与应用中,成本分布函数模型及模糊预测模型均是基于已有较成熟的概率统计方法的报高率f的研究,适用于经评审的最低价法项目,能够较好地指导实践。因此合理最低价法投标报价博弈模型的研究具有很强的现实指导意义。

由于对最低投标价的合理性评判尚缺少一致的理想标准,复合标底法被广泛应用。由于复合标底可采用多种复合形式,很难取得这样的记录;如果拥有以往与当前评标方法完全相同的项目,则借助评分矩阵模型,根据不同的复合公式建立不同的矩阵模型,分析采集自投标报价与标底比价的区间历史记录,进而确定最佳报价。因此,对复合标底法投标报价的评分矩阵博弈模型的深入研究具有广泛的现实意义。

我国的招投标制度虽然已实施多年,但有许多的内容还需要不断的完善和补充,本文区别目前通用的评标办法,针对性地建立博弈模型,对提高招投标在综合决策中的科学性的有益尝试,在今后的研究可以通过待实际经验数据的积累来进一步验证其有效性和可靠性。

参考文献:

[1]袁建波,丁夏淑.博弈论在复合标底投标中的应用[J].中外公路,2005,(8):199-201.

数学建模博弈论篇2

关键词：博弈实验教学软件实验经济学

一、引言

诺贝尔经济学奖得主爱德华・哈斯丁・张伯伦（e.H.Chamberlin）教授1948年在哈佛大学博士生课堂上进行的描述市场需求和供应经济关系的纸牌实验正式拉开了实验经济学的序幕[1]。20世纪50年代，美国休斯敦大学约翰・福布斯・纳什（JohnForbesnashJr）利用不动点定理证明了均衡点的存在，并将博弈论引入议价行为模型，进行了纯议价博弈实验，1994年因为他在博弈论领域的卓越贡献获得了诺贝尔经济学奖[2]。1952年，美尔文・爵烁和莫莱尔・弗莱尔（melvinDresherandmerrillFlood）进行了著名的“囚徒困境”实验。20世纪60年代，有着“实验经济学之父”之称的弗农・洛马克斯・史密斯（VernonLomaxSmith）教授在亚利桑那大学十一个班级进行了长达六年的实验验证竞争均衡理论，1962年，以此实验为基础撰写的论文《竞争市场行为的实验研究》在《政治经济学杂志》上的发表，标志了实验经济学的诞生。其也因为在实验经济学领域开创性的贡献于2002年获得了诺贝尔经济学奖[3]。

近年来，博弈实验及以其为代表之一的实验经济学以其实现方式的可复制性和实验过程的可控制性受到越来越多经济学家的青睐，该实验还是研究不同经济政策建议有效性的经济、可行办法之一。我国自上世纪80年代以来，不少学者已经逐渐意识到实验经济学的发展，目前正有组织地对其开展研究和应用工作。因此，以实验经济学为主要研究方法，进行研究性、设计性的本科生实验教学已经成为经济管理类实验的发展趋势。目前，国内诸多知名高校如中国人民大学、浙江大学、厦门大学等已经相继建立了自己的经济学实验室，开始了在实验经济学领域的专业研究和教学应用[4]。

然而在博弈实验的推广过程中却出现了教学效率低、教学工作量大、数据不易收集、多为验证性实验等诸多难点，极大影响了博弈实验在高校别是在普通高校本科教学中的推广。笔者所在的中国药科大学医药经济管理综合实验教学中心自行编写了基于Browse/Server（简称B/S）结构的博弈实验教学软件。该软件使用JSp（JavaServerpages）与my-SQL相结合，构建了功能强、使用简便、管理方便、运行速度快、安全可靠性强的网页数据库。基于该数据库，将Java和JDBC结合起来极大降低了程序编写难度，提高了软件在不同平台运行的兼容性和稳定性[5]。

二、传统博弈实验模式在教学应用中的缺点

1.教学效率低。

国内实验经济学教学大多沿袭国外教学模式，嵌入于经济学、管理学等理论课程中进行，用于加深对基础理论知识的理解和掌握，多为演示型、验证性实验。实验中沿袭国外常规教学手段使用纸质教学文件为实验用具（见图1），学生在格式化的纸质文件中记录每轮博弈决策，每轮博弈后，将决策纸交予教师进行记录、评判后再行发回进行下一轮博弈。每轮博弈均涉及决策、收决策纸、记录、评判、发回决策纸、下轮决策的循环，因其极大地占用了课堂教学时间，在实际教学过程中的运用受到课时等诸多因素的限制，难以开展。

以本中心的实验教学为例，在使用博弈软件之前每次进行重复囚徒困境博弈模型的实验教学时，60人的博弈实验，需要4位实验教师同时工作（2位教师计算和统计实验结果，1位教师按时收集、发放博弈决策纸，1位教师维持教学现场秩序）才能保证博弈实验的正常进行，1课时（45分钟）只能进行7-10轮博弈，平均5-7分钟完成一次博弈，实验效率较低。而在7-10轮博弈轮数中绝大部分学生还未能体会均衡、零和等博弈的核心理念，实验就已经匆匆结束。

2.教学难度大。

常见的用于本科教学的博弈实验模型如囚徒困境博弈模型、选美实验博弈模型、智猪博弈实验模型、重复博弈实验模型的课程化构建中多要求构建博弈方信息完全不对称的实验环境。但是由于多种原因如重复囚徒困境博弈实验中相对规则的博弈对手配对、微信等现代化的信息沟通途径甚至是同学间的手势和眼神极易导致博弈对手间的信息沟通，从而极大地影响实验的结果。有时甚至需要教师使用分割博弈对手所处实验环境、强制信息沟通工具管制等方式保障实验教学的正常进行，增加了实验教学工作量，加大了实验教学的难度。

3.教学计算量大、工作量大。

多数博弈实验均需要一定的运算和统计工作，尤其是在贿赂博弈、领导者博弈等带有研究性的博弈行为实验中。在重复囚徒困境博弈实验中每轮实验都需要统计并标示博弈对手的博弈决策，计算本轮博弈双方得分。虽然单个运算强度不大，但是由于参与实验者众多和往复博弈次数而导致运算量较大，且较为容易出现计算失误。

4.教学数据收集困难，工作量大。

为了强化博弈实验的教学效果，需要及时统计参与博弈学生的博弈决策及其产生的效果，作为学生优化决策的依据。在重复囚徒困境博弈实验中需要归纳典型博弈思路，如一报还一报策略（titFoRtat）、弗里德曼策略（FRieDman）、道宁策略（DowninG）、乔斯策略（JoSS）等经典博弈策略的产生概率及其平均收益，用以引导学生的决策思路[6]。但是对纸质材料的收集和整理需要花费大量时间，在一个教学单元（如2课时）内，难以完成数据的收集和整理工作。

5.教学、科研效果分析困难，缺乏必要依据。

北京大学董智勇教授在《实验经济学》一书中写道：实验经济学（experimentswitheconomicprinciples）是经济学家在挑选的受试对象参与下，按照一定的实际规则并给以一定的物质报酬，以仿真方法创造与实际经济相似的一种实验室环境，不断改变实验参数，对得到的实验数据分析整理加工，用以检验已有的经济理论及其前提假设，或者发现新的理论，或者为一些决策提供理论分析。高校能够提供大量可供选择的高度理性受试对象，实验课程能够以分数等激励手段代替的物质激励极大地降低了实验成本，因而成为实验经济学的重要实践场所。以博弈实验为代表的实验经济学更是成为优化决策体系、提升决策水平的重要方法，其是在贿赂模型等研究性博弈实验模型中。这一切的实现不但需要基础数据，而且需要强大的以博弈数据库为基础的数据挖掘工具。纸质实验道具因其在收集速度上的缺陷显然不能满足要求[7]。

三、计算机网络技术在博弈实验教学应用中的优势

1.提高实验教学效率。

本中心采用博弈实验软件后，极大地提高了教学效率：在重复囚徒困境博弈实验中，以每次实验20轮计算，传统纸质道具的博弈学实验，至少需要90分钟，使用计算机实验教学软件后，只需要20分钟，在1个课时内就可以完成实验，保证了教师讲解时间，提高了学生的博弈水平。对比具体如下图（图2）：

通过上图，我们可以很直观地发现，应用计算机的实验方法具有明显的技术优势和显著的进步性。

2.降低实验教学难度。

博弈实验中通过电脑自动分组等功能可以做到真正的“双盲”实验。在重复囚徒困境博弈实验中，自制教学软件能够实现自动配对、随机分组功能（见图3），使学生在完全不知道博弈对手的情况下完成博弈实验，真正做到了信息的完全不对称。

3.免去实验教学的信息收集、整理、运算工作。

采用了计算机的实验方法后，在重复囚徒困境博弈实验时，学生只需要单击“合作”或“背叛”后即可看到（或等待后看到）博弈对手本轮决策，由电脑依据评分原则直接给出单轮分数并累计入学生总得分。学生决策提交后，收集、整理、运算、统计的工作都由电脑后成并展示在学生眼前，极大地降低了实验教学过程中教师的工作量。

4.教学数据自动转存，方便实验效果深入挖掘。

使用教学软件后，重复囚徒困境博弈实验中的学生的操作将被自动保存，实验结束后以eXCeL的形式导出。导出后的数据经过eXCeL的简单加工可以进入SpSS等统计软件深入挖掘掩藏于基础实验数据背后的经济学现象和规律。

四、结语

为了满足实际教学需要，越来越多的高校自行编辑博弈实验教学软件以推广博弈实验在经济学、管理学等相关课程中的运用，提高教学效率，深化教学改革。笔者所在实验中心的软件化博弈教学实践表明，博弈教学软件的使用不但能够极大提高教学效率，而且能够降低教学难度，实现实验数据的自动收集、主动分类及自动基础分析等，这样不但满足了本科教学需要，而且为经济博弈行为的科研提供了强大依据，具有较高的推广意义和价值。

参考文献：

[1]刘晓丽.博弈实验对博弈论的方法论意义[J].学术探索，2013.

[2]杜丽群.经济学的两种研究范式：实验经济学与行为经济学评析[J].经济思想史评论，2007.

[3]邓钊.经济学实验方法及在我国的应用前景分析[J].现代商贸工业，2010.

[4]方小教.经济学实验课程构建方法的改革路径[J].淮北煤炭师范学院学报（哲学社会科学版），2008.

[5]谢玉诚，茅宁莹，陈露，施皓韵.经济学实验教学方法改革[J].新西部，2013.

[6]周骏宇.艾克斯罗德重复博弈实验及其应用[J].自然辩证法研究，2005.

数学建模博弈论篇3

关键词：建筑企业；施工；项目；管理模式；博弈

引言：建筑施工项目的流程大致有：生产过程、质量检查、业务流程等几个方面。如果建筑企业只是单纯地研究这几个方面，而忽略了各方面的相关制约关系，那这种施工项目的管理模式研究只能算的上属于最肤浅的表面化的研究，整个过程不具有科学性和系统性。

1.施工项目管理模式博弈分析的重要性

在经济学中，博弈论的地位不容小觑。而进化博弈论作为经典博弈论的扩充，近来，更多的人将进化博弈论的思想运用在建筑工程项目管理中，并且得到了意想不到的好的效果。进化博弈理论是经济学领域的前沿理论，对于这种应用时间不长，但是很快为各个领域的经济学家所接收并使用的新兴理论来说，他有其自身的独特魅力。跟传统的经济理论相比较，进化博弈理论因为考虑到更实际的情况和条件，能获得更加精确的结果。对于动态的建筑施工项目管理来说，进化博弈理论能更好地分析在施工过程中的经济问题。

对于建筑企业的施工项目而言，项目的根本目的也在于盈利，只有正确的选择适合施工项目的管理模式，才能最大化的获取相应的利润。项目是由人员操作而进行的，而操作项目的人员不是完全理性的，这一点不符合经典博弈理论。进化博弈理论恰好填补了这一缺陷。针对目前建筑企业施工项目管理模式中的不足，本文将和读者一起运用进化博弈理论进行管理模式的一定的研究。

2.进化博弈模型

进化博弈模型最早是在生物的研究中产生的，maynardsmith和price最早运用这个理论解释了生物的进化现象。在生物体中，他们考虑了理性缺失的客观条件，用fitness来表示生物的支付，博弈双方的情况设定是随机的，并且博弈的行为不是一次的，在整个过程中可能会因为一些变化而改变博弈方先前所作出的策略分析和选择，不断反复，最终做出最佳策略。

在经济研究方面也可以发现，与经典博弈理论明显不同的地方在于，进化博弈理论对参与决策的人的假定为有限理性的。由于人的有限的认知，人们在进行决策的时候是存在系统的推理错误的。在不断的决策过程中，人是需要不断学习的，这就是一个进化的过程，这便是进化博弈理论的得名。博弈的群体进行不断的博弈活动，很难一次性找出最优化的点，当经过长期的改进后，博弈方将会得到一个稳定的决策，慢慢得到完善，从而获得最优解。

在生物学、经济学中都可以看到进化博弈理论的身影。其核心概念包括2方面：稳定策略和复制动态。稳定策略是一个种群中的多数成员所采取的策略，并且这种策略是最佳的策略。复制动态是随着时间的推移，各个成员通过不断的模仿和改进而得出的策略。这两个概念恰好完全解释了进化博弈论的概念，在分析更多复杂的问题时，指出了简单的问题解决的方向。

3.进化博弈论在建筑企业施工项目管理模式中应用的意义

建筑企业施工项目管理模式与给博弈方所带来的利益大小是有密切关系的。作为企业的决策人，没有十足的把握能保证在有限的理性范围内取得利益的最大化。而进化博弈理论作为一个考虑了决策人存在有限理性的条件下，采用数理的相关知识，科学系统的给出决策的方向，甚至决策的内容。一般的建筑企业在施工项目的管理上，主要从公司实际情况，历史数据等角度进行分析，但是所得到的的决策信息跟现实情况的吻合度是相当低的。进化博弈论巧妙的避免了这个问题，在不断的模仿和改进过程中，能大大确保决策不会陷入历史所设置的框架中，更接近所需的决策情况。从长远的利益意义上来看，进化博弈理论带给建筑企业的利润是可观的，有很强的实践指导意义，因此，建筑企业在施工项目的管理上应该充分考虑使用进化博弈论。

4.进化博弈分析在建筑企业施工项目管理中的应用

在建筑企业中，假定有两个有限理性的决策群体，他们要根据自己的情况作出不同的施工项目管理决策。假设在该群体中采用策略1的博弈方的比例为x，那么采用策略2的博弈方的比例就是1一x。算出采用两种管理模式策略博弈方的期望得益u1，u2和群体平均期望得益u分别为u1=x・a+（1-x）・b、u2=x・c+（1-x）・d，u=x・u1+（1-x）・u2。根据复制动态的相关理论可以知道，收益较低的管理模式博弈方会改变自己的管理模式，使得收益变高。所以采取不同施工项目管理策略的人员数也在不断变化。Dx/dt=x（u1-u）=x[u1-x・ul-（1-x）・u2]=x（1-x）（u1-u2）=x（1-x）[x（a-c）+（1-x）（b-d）]来表示特定策略比例的变化速度与其比重和其得益超过平均得益的幅度成正比。可以从上式看出，最多可能有三个稳定点，分别是x=0、x=1和x=（b-d）/（a-b-c+d），如果博弈方由于失误偏离了进化稳定策略的点x*，复制动态仍然会使x回复到x*。当干扰使x出现低于x*时，F（x）=dx/dt必须大于0，当干扰使得x出现高于x*时，F（x）=dx/dt必须小于0。

在施工项目管理博弈的动态演化过程，由两个不稳定的均衡点和一个鞍点连成的折线构成进化博弈不同收敛状态的临界线，即在施工项目中2种不同的管理模式。由于企业系统演化过程的长期性，因此，在很长的时期将呈现出两种施工项目管理模式共存的状态.

下面根据一个实例向读者解释清楚：

在建筑施工项目中，如若施工项目的风险是中性时，项目管理人员的风险则分为两种：风险中性和风险厌恶型。

当风险中性时，项目管理人为了使自己的收入最大化，面对激励增加时，项目管理人会在生产性努力和分配性努力上选择增加前者，而减退后者；当风险属于厌恶型时，项目管理人员的收入是一个随机数据，在同一个激励下，项目管理人员的努力程度比没有机会主义的情况下高，这会直接导致企业的利润下降。

从上面简单的分析可以看出，在项目管理人员的风险为中性时，可以选择让项目管理人员承包该项目，有利于项目管理人员最大化的付出自己的努力；在项目管理人员的风险是厌恶型的时候，可以适当的提高激励的程度，再者就是尽量避免项目管理人产生机会主义，加大检查力度，确保建筑施工项目能得到最大化的利润。

结语

本文对建筑企业施工项目管理模式进行了进化博弈理论的分析发现，目前，我国的建筑企业在施工项目管理方面还存在一定的问题，正是需要进化博弈理论应用的时候。进化博弈理论是在考虑各方面的前提下，从动态的角度，运用理论来分析施工项目的管理过程，在不断修改完善的过程中，寻找最优化决策的过程理论。转变效益低下的项目管理模式，利用进化博弈理论，增加建筑企业的市场竞争力，提高建筑企业施工项目管理人员的整体素质，提高建筑企业的利润。

参考文献

[1]张飞涟，刘力，董武洲，等.博奔论在建设项目安全管理中的应用[J].系统工程，2002，20（6）：33～37.

数学建模博弈论篇4

[关键词]博弈论与旅游学价格战对策

一、博弈论及旅游价格战的博弈模型

1.博弈论与旅游学。博弈论又称为对策论（gamestheory)，是研究具有斗争或竞争性质现象的理论和方法，它既是现代数学的一个新分支，也是运筹学的一个重要学科。它较好地解决了对竞争等问题的可操作性分析，近年来不仅成为经济学中激荡人心的一个研究领域，也为其他许许多多包含竞争现象的问题提供了精细的分析技巧。随着博弈论在各学科中的普遍应用,旅游学中的各分支学科也在不同程度上开始了应用博弈论方法进行分析的探索。

2.旅游公司价格竞争的博弈模型。价格竞争是行业重复建设、对行业总体市场容量过度乐观、企业数量发展过快的结果。近年来，由于国家产业政策的支持,旅游的产业规模急剧膨胀,旅游公司数量增长幅度大大超过了旅游人数的增长幅度，从而造成供求失衡。旅游公司为争夺市场份额,纷纷把降价作为争夺客源的主要手段。按照博弈论的观点，在非合作博弈条件下，降价是企业的合理选则。现用博弈模型分析如下，假定在旅游市场有两家经营同类产品的旅游公司：a和b，还假设他们同时行动，并只有两种选择：降价和不降价。从而得到表1的旅游价格战博弈模型：

（r——对双方合作的奖励，p——对双方背叛的惩罚，s——给笨蛋的报酬，t——对背叛的诱惑）

运用画线法可求得该博弈的得益数组（420，420）所对应的策略组合（降价，降价）为本次博弈的纳什均衡。www.133229.com由于纳什均衡是一种非合作博弈均衡，虽然双方选择（不降价，不降价）要比降价好,但是参与博弈的双方都是以追求自身利益最大化为目标,每一方都不能保证对方会不降价而自己也采取不降价来共同分享利益,为防止对方降价而自己不降价给自己带来损失的情况发生,最终双方选择的是均采取降价的纳什均衡（420，420）。于是你降我也降，你再降我也再降，重复博弈的结果就是价格大战越来越激烈。这从博弈角度说明了价格竞争的必然性。

实践证明，即使公司能够签订都不降价的行业自律协议，也是无法有效避免降价竞争的发生。因为策略组合（不降价，不降价）不是纳什均衡，行业自律协议不具强制性约束力，即使在短期内能够维持在脆弱的自律平衡状态，机会主义或其他因素也会很快将此不稳定均衡状态破坏掉。这在博弈理论中已有严格的证明。

二、应对旅游恶性价格竞争的对策

在市场经济环境下，自由竞争是市场经济活力的源泉。价格竞争是市场竞争的一种重要方式，特别是在供需失衡的行业中，当供大于求时，价格竞争将更为激烈。然而过度的价格竞争对行业的发展是不利的，以下对如何避免过度价格竞争做一探讨。

1.通过改变博弈模型的结构消除过度竞争。据前所述博弈模型，旅游公司之间的价格战博弈只要符合两个条件:1）t>r>p>s；2）r>（t+s）/2，各公司的最佳选择都是该博弈唯一最优的“纳什均衡”（降价，降价）。要避免出现旅游恶性价格战，可以通过改变博弈结构，使博弈方的收益值不再符合该博弈模型的两个条件。

一种方法是博弈双方主动改变博弈策略，将公司目标从“收入”调整为“利润”。以表1的旅游价格战博弈为基础，根据旅游业的特点，不妨假设选择“不降价”策略时，旅游企业的利润率是30%，选择降价策略时，旅游企业的利润率是20%，则得表2。

以利润为目标的旅游价格战博弈不再符合原博弈模型的两个条件，博弈的最终结果发生了改变，不再是唯一的（降价，降价）。其中纯策略纳什均衡通过划线法容易找到为两个，即（150，150）和（84，84）。目前博弈论界正在研究表2所示的（不降价，不降价）这样的最优纳什均衡出现的条件和机制，一旦找到，就可以为避免恶性的价格竞争提供一条途径。由于其中的研究颇为复杂，此处不再赘述。

另一种改变改变博弈结构的方法是旅游监管部门作为新的当事人参与博弈，也有可能会使旅游公司避免出现恶性价格战。但这需要旅游监管部门加强执法力度，对降价的公司给予足够大的惩罚才能奏效。

2.持续创新同样是旅游行业获得较高利润，避免过度竞争的有效途径。旅游企业可通过开发特色旅游新产品而避免产品雷同。比如近几年的老年旅游市场的开发；以高中学生为对象，在假期举行的高校游；以各种兴趣为对象的摄影游、徒步游、探险游等。

3.除此以外，政府还可通过深化体制改革,硬化企业投资约束，从而消除产业过度进入，达到供求平衡，避免过度竞争。

总之，这些策略需要旅游企业根据市场环境的变化及自身实际情况适时进行创新、调整和选择。

参考文献：

数学建模博弈论篇5

随着我国基础建设日益发展，博弈论在交通工程投标中得到广泛的应用。将对博弈论的原理、使用及其在招投标范围内的各种模型的构建展开系统的论述和研究，在深入理解并结合现有招投标现状的情况下构建出基于博弈理论总成本投标报价模型，从而为投标单位提供一些有针对性的报价模型及建议，帮助确定其投标报价，这样既能提高标单位的中标概率又可以使其获得最大期望收益，从而增强企业的竞争力。

［关键词］

博弈论;投标;报价;分析;研究

当今社会竞争环境复杂，项工程目问题的结果需要多个行为主体共同确定。各行为主体既拥有各自的利益目标，又相互依存。招标单位采取的办法一般是复合标底，简单点说就是招标单位在投标前不确定自己的真实标底，而采用所有投标者的投标报价水平，通过加权取平均数确定最终的标底，这样就需要投标者主要凭个人经验来进行投标，因而带有很大的被动性。博弈论的理性决策需建立在各行为主体决策的预测结果之上，不可置他人决策于不顾而单独做出。

1博弈论概述

博弈论是一个理性决策的过程，研究的主要问题是多个行为主体在风险不确定的情况下相互影响以及决策均衡性的问题;研究对象为具体的行为特征，在一定范畴内可以称之为对策论。

博弈论三要素①局中人。博弈活动的主要参与人、主导者，称之为局中人。在实际的应用中，局中人不但指自然人、集体，也可以指某种行为。用i来表示，i=(1，2，…，n)。在项目的决策中，局中人均以实现自身利益最大化为目标。

2招投标过程中的博弈分析

2.1招投标与博弈论的联系招投标的过程，从理论上分析，也可以看出是一个博弈的过程。对应招投标的不同流程，参与的各个主体构成了博弈中的当事人，各主体之间的竞争关系，由各自的决策域不同直接表现。在最终决策的制定时，各主体又都受到他人决策结果的影响。这种影响体现在:开标之前，各个投标人对各自的投标价格并不知晓，而每个投标决策的制定又需要以他人决策的预测结果为前提。经过分析可以看出，制定不同的投标人构成了博弈理论中的当事人，而各个投标人的决策制定构成了决策域，最终结果的制定共同构成了博弈理论中的支付函数。在博弈论的体系中，通常情况下认为，当信息彼此知晓时，博弈的双方可通过简单谈判即可达成一种双方均能接受的协议。在当信息不完全公开情况下，则需分多个阶段多次交流才能保证所有参与人接受协议。若把招投标的具体过程进行仔细分析，可将采用不完全信息静态博弈模型为招投标模式。

2.2招投标过程中的常见博弈现象

2.2.1先开标后议标现象项目开标后，针对工程价款、相关优惠政策的调整，通常情况下，招标人和投标单位会以议标的形式再次讨论。由于现今的建筑市场，施工单位不能给自己一个合理的定位，为了获取工程，总是以业主的意愿为基本前提，有时甚至不惜以竞相压价的形式以完成中标。一方面，这可以促使工程造价成本的降低，另一方面，却违背了公开招标的基本前提，与公开招标公平性相抵触。这也把社会生产的一般市场价值抛到脑后，有时就会造成施工企业无法按照既定目标完成工程，反而使得造价成本提高。由以上分析可知，开标之后又议标实际上是对合同价确立的过度激励。对于目标的激励性，应有可观测性，也应对除投标标价之外的其他目标采取必要激励措施，保证目标的可观测性。若业主单位对招投标阶段的投资控制过度激励，很可能会造成施工单位盲目追求成本，忽视其他目标的现象。故业主应综合考虑各项因素，建立正确的激励机制。

2.2.2投标人联合与投标人互相倾轧相反，有时为了获得正常的利润以外的超额利润，投标单位会联合起来对哄价进行抬标。这种现象称之为投标人联合。站在博弈的角度分析，博弈的局中人指招投标主管部门和投标人，主管部门的策略为监督整个招投标过程中的是否违规现象，而投标人的策略为联合或不联合，两者共同构成支付函数。支付函数的最终确定，有超额利润来确定。投标人的联合，将对招标造成非常坏的影响，因此，招标单位应采取必要的措施来阻止这种现象的发生，也可以通过采用邀请招标的形式来实现，同时注意加强在投标截止日期前对所选的投标人的保密，使参与投标的单位彼此不知道有哪些单位参与竞标，建立起非合作型博弈，最终实现投标的有效性。

2.3招投标机制设置招投标过程中的博弈分析，主要是指对评标方法的确定，而评标方法的确定主要是用来解决投标人的积极性。因此，所谓招投标机制的设置，主要是为了应用博弈理论对招投标活动进行约束。这种约束应从两个方面展开。

2.3.1个人理性的约束在招投标机制的设置中，应充分考虑项目参与人的积极性，制定有效激励措施，促使项目参与人愿意在制定的机制中完成任务。最好的办法就是使得投标人获取标所得到的利润将远远大于失去这个项目的价值。可从如下几方面进行着手:①注重于投标实际环境的分析，制定合理可行的标底。②在标底的计算中，要注意按照现有的工程量清单，按照市场价格求算标底。③对暂定标底权重的赋予，应将各有效投标报价中所占相同权重的报价进行加权平均，得到评分的基准价，实现对市场的正确引导。

2.3.2激励相容约束本约束主要是为了尽可能的选出质量高、信誉好的企业。在激励相容约束的制定过程中，应注意使得所设计的机制尽可能的调动所有参与人的积极性，达到招标单位所期望的目标。激励制度的建立，要注意结合投标单位的实际情况，尽量避免过分激励和较弱激励的现象。

3博弈论在投标报价中的应用

3.1博弈论在“合成标底”评标中的应用

3.1.1合成标的打分法的介绍现阶段最常见的评标方法就是合成标底打分法，也可称为复合标底法。该方法将标底进行量化，实现标底的可控制。基本步骤如下:①标底由招标单位制定，并给定一个浮动的百分比范围，当投标报价超过了所允许变动的范围时，视为废标。②对符合要求的投标单位的所有报价，包括招标单位的价格，进行加权平均，得到合成标底。③以合成标底为依据，设定评分标准，对符合要求的投标报价进行综合进行打分。

3.1.2合成标的打分法的特点具体说来共有3点:①不可预知性;②竞争性;③合理性。所谓不可预知性是指标底的最后确定由几方共同确定，该次投标项目的标底通过加权平均的方法计算出来。竞争性是指评标方法在规则制定时对高于标底的报价制定严格的扣分机制最大程度的限制投标单位的投标报价。合理性是指最大程度上将标底的确定交给市场，并对不切实际的高报价和低保金完全不予考虑，使得复合标底比较合理，反映合理低价的标准。

3.2博弈论投标报价模型的构建针对招投标过程的博弈展开研究，主要是为了防止“围标”现象的出现。为了获得更加接近于真实情况的报价概率分布，模型的构建以评标中合成标底的做法为依托，以评标规则为依据，结合综合标底打分法完成。

3.2.1模型的假设为了方便理解并简便该模型的计算步骤，本文对所构建模型做如下几个方面的假设:①在进行标底的编制中，将有些信息设为已知。且这种已知在现实的标底计算中，也是成立的，如定额编制办法中取费基数及取费费率的设定。②对评标方法、评标参数的确定在招标文件中进行设定说明，对某些变量进行固定。③只考虑价格因素对投标报价的影响，其他的因素暂时忽略。本文所构建的博弈论模型应以满足上述假设条件为前提进行，并此为基础前提进行研究。

3.2.2变量的设定模型变量的设置如下:Y:用以表示招标单位编制的招标标底，且本变量为一个相对数值，是可以发生变化的;λ1:计算复合标底时，变量Y所占的权重;λ2:计算复合标底时，所有投标人编制的投标报价所占的比重。当投标方报价处于合成标底的有效范围内时得满分，超出范围或小于范围值时，相应的进行扣分。上文各变量的确定后，可以根据其逻辑关系得到下列几个计算式。

3.2.3报价模型由公式(2)可知:对于标底H，我们可以得出我方对该项目报价与合成标底之间的差距，这个差距即是由于a和n在某种不确定性导致的我方报价与合成标底之间的误差e。这时需要注意的问题是，得分有一个限定的氛围，不以满分为标准设定，也就是说最终的中标者不一定获得满分，在运用本方法进行计算时，应将各个误差e用矩阵的形式来进行表示。如3.3所示，对于矩阵中的各数值由x和a两个因素决定。通过定性分析的方法，采用经验估计法确定报价平均值a的大致范围，以一定的百分比对各投标报价和我方报价在一定范围内按一定百分比进行依次取值，得出我方报价与合成标底的误差值。

4博弈模型实例计算

同时，由于平均的投标价格及其有效投标人的数量n都是具有不确定的，这样投标公司的投标价格与合成标底就必然存在着不可控制的误差。当有了合成标底之后，就可以计算我方最终投标报价与合成标底的误差e了。进而，组成报价误差矩阵模型，与以往类似项目投标相比较，其他各投标人报价均值a的范围可能在［0.96Y，1.00Y］范围，本次计算a在每隔0.5个百分点分别取一次值;我方报价x范围也暂定为［0.96Y，1.00Y］范围内，同时每隔0.1个百分点取值一次，将我方报价和报价均值分别代入误差矩阵中，得到以下博弈误差矩阵模型。由上文中可以看出:理性人博弈的目的原则是Lmin，xmax对上述博弈矩阵进行决策分析，开标开始前已知晓本次投标单位为六家，但是各个单位有效投标报价的数目并不确定。所以，将n=3，4，5，6分别带入到博弈模型的矩阵e中，分别得到各自的误差矩阵及扣分矩阵。通过矩阵计算可知，对本方而言，我们得满分的报价区间见表1。由上表可知:不论取值多少，只要n取值范围在(0.9790Y，0.9820Y)时，我方报价均可得满分。根据博弈中报价尽可能大的原则，我方报价取x=0.9820Y。只要其他投标方报价在(0.95Y，1.00Y)范围内，我方就能获得满分。当然，这里并不排除其他投标方也和我方一样获得满分的可能。

5结语

本文着重对博弈理论展开研究和表述，系统的研究了博弈理论的发展、组织及对招投标实际问题的适用性。投标方以市场为依据，针对“合成标底打分法”的评标规则特点构建了基于博弈理论的投标报价模型，并通过实例进行简单验证，为今后的实际研究提供了理论支持。

［参考文献］

［1］马亚，刘振奎.博弈论在招投标中的应用［J］.价值工程，2010(11).

［2］王成国，黄韬.现代经济博弈论［m］.北京:经济科学出版社，1996.

［3］徐春华.复合标底投标报价博弈研究［J］.价值工程，2009(1).

［4］江伟，黄文杰.博弈论在工程招投标中的应用分析［J］.工业技术经济，2004(1).

［5］方德海.合理低价中标方式下的投标策略博弈［J］.工程经济，2003(8):29－30.

［6］许高峰.国际招投标［m］.北京:人民交通出版社，2001.

［7］张明媚.工程招投标中的激励机制分析［J］.数学的实践与认识，2002(3).

数学建模博弈论篇6

【关键词】师生关系；协同；博弈论

一、引言

随着我国高等教育改革的不断深入，高校教师与学生的关系从中国古代传统的“父子”关系逐渐演化成现代高校教育系统中的两个关键利益诉求主体。从非合作博弈论的观点出发，学生的利益诉求表现为：以最低的努力成本（effoltCost）获得最高的收益。因此，在平常的教与学的活动中，会表现出教师与学生之间非合作博弈下的纳什均衡。而本文试图分析课堂教学中的到课率、成绩总评，期末学生“选评教”以及论文写作等多个方面中的博弈因素，并提出基于师生之间信息共享的协同关系。

二、相关文献综述

在国内有相当多的文献使用了博弈模型来研究师生关系。林天伦和陈国香（2010）把师生博弈分成关系和谐的合作博弈与冲突的非合作博弈，并认为师生冲突的本质是非合作博弈的结果与表现。通过重建均衡的师生博弈模型，改变当前师生博弈的规则与格局，最终达成师生间的价值共识。黄秀海（2010）运用“囚徒窘境”博弈模型对“学评教”机制下的教师行为及师生关系进行了分析。结果发现：教师的理是妥协、迎合学生，教师之间及师生之间极易达成合作博弈。“学评教”机制的设计缺陷彻底改变了传统的师生关系，认为必须建议重新设计“学评教”机制。陈艺优（2012）针对自己在数学教学中存在的各种问题，从教师和学生之间的博弈关系入手，分析了这些问题产生的原因及改进的方向，在此基础上，从数学意识的强化、教学内容与教学方法的调整等多个角度探讨了改进数学教学的一些措施和建议。朱火保和朱锦（2003）从学生的主体地位、教与学的过程和经验、学生的个性差异三个方面入手，基于师生博弈的角度，对教学方法的设计及其效应进行了分析。最后提出分层次的学业成就评价方法，以增强不同类型学生的学习信心、学习兴趣以及学习动机，激励他们努力学习。杜志宏（2011）认为高校师生关系是高等教育中最核心的一对关系，建立和谐师生关系是提升高等教育质量的关键所在。并指出现阶段师生关系以博弈为主要特征，主张运用博弈论来分析师生博弈的内涵与特征，并从场域环境、策略引导、博弈符号、纠错救济等角度探讨了构建和谐高校师生关系的路径。霍晓程和李小平（2012）针对高校基础可数学课中学生普遍的逃课行为、课堂教学效果不高、考核质量不理想等现象，采用一系列师生博弈策略来帮助解决这些矛盾，将这些策略应用于实践当中，收到了比较好的效果。

与上述研究文献不同，本文是在基于师生之间非合作博弈的视角下，通过师生之间完全的、及时的信息共享，最终形成协同的教师与学生关系。

三、“选评教”机制下的师生博弈模型

（一）模型描述

在“选评教”机制下，在每个学期期末之前（通常倒数二、三周），学生在教务处网站上进行选课。对于选修课，学生可选或不选；对于必修课，学生可以选择不同老师所开的课堂。从以往对学生的问卷调查以及访谈来看，学生选课往往是根据往届同专业学生对老师的口碑来进行决策，标准无非是“课堂管理不严”、“期末总评分虚高”、“老师和蔼”等等。在学课完成之后，第二个学期开始教学，并在该学期期末之前对老师表现进行主观和客观的评价。评教完毕后才能开始选下个学期的课程。在该学期期末，老师对学生的平时表现和期末考试进行总评。教务处根据学生评教结果对老师的工作量进行核算，评教结果优秀的（总分>95）工作量计算上浮10%（即乘以1.1）；评教结果不合格的（总分

（二）模型建立

学生可以选择努力或不努力，对老师的评价可以选择好评或差评，老师可以选择严格或不严格：其非合作博弈盈利矩阵如表1所示：

表1老师与学生的非合作博弈盈利矩阵

当学生不努力时其效用为5，努力时效用为0；当老师不严格时其效用为5，严格时效用为0；当老师获得好评时其效用为5，中评时其效用为0，差平时其效用为-5。因此存在纳什均衡解，即老师对学生要求不严格，期末给学生高分：学生的学习也不努力.期末评教给老师好评。在这种情况下，博弈双方的效用都会最大化（5，10）。目前大部分高校的师牛关系属于这种状态。

（三）基于Stakelbe唱博弈动态分析

在3.2中的博弈模型均衡解是教务处、学生家长、教师本人甚至整个社会都不愿意看到的局面当一个研究生或博士作为青年教师刚刚踏上讲台时，他作为Stakelberg博弈中的leader，首先表现出对教学极大的热情和学生严格认真负责。然而，作为Stakelberg博弈中的follower，常常会在“选评教”中出现中评或差评。特别是当老师自认为付出极大努力并对学生约评价抱有很大的期盼时，中评或差评会让老师心灰意冷。最后导致在课堂上老师再也不会批评学生迟到、早退，课堂点名也是流于形式，期末总评尽量高分，从而“讨好学生”。而学生则“投桃报李”，在平时不努力的情况下既然可以获得高分，就自然给老师好评。

四、基于信息共享的师生协同关系优化

现在的高校往往已经有了先进的网上选课评教信息系统，但如何让老师严格教学、学生努力学习，最后老师得到公正、客观的评价，是这种信息系统的用武之地。以下从几个方面提出作者自己的合理化建议：

（一）学生在选课时应该对老师有充分的了解。具体体现为学生可以查看每个老师以往的授课记录，对往届学生的评分情况以及往届学生对老师的主观、客观评价情况。而老师应该在学生选课时在班上进行宣讲，把严格的要求事先告知学生，再让学生自己做决策。

（二）在平时课堂上的学生表现应该适时公布。即对每次课上谁迟到、早退、旷课或回答问题受表扬都在下次上课时公布，让学生时刻了解自己的平时成绩的动态变化。

（三）学生的评教和老师的期末总评同时进行，而且结果双方都可以实时查看。只有让信息得到充分、及时的共享才能让双方的评价客观公正。

五、结论

通过建立基于信息共享的师生协同关系优化.能够彻底改变目前基于非合作博弈均衡情况下的老师上课不严格“庸懒散”和学生学习不努力的局面。从而建立起一种全新的、向上的、科学的、被全社会所认同的协同师生关系。

参考文献：

[1]林天伦，陈国香。基于博弈论的师生冲突分析[J].教育科学研究2010（4）

[2]黄秀海，“学评教”机制下的师生合作博弈及其关系研究[J].现代教育科学，2010（2）

数学建模博弈论篇7

（长沙理工大学交通运输工程学院，湖南长沙410114）

摘要：针对公路工程项目政府投资大，回收率小的现状，政府越来越多地采用tot模式对公路经营权进行转让，而在转让过程，政府与投资方之间的目标利益最大化使得转让无法快速达到最佳契合点。论文基此建立了政府和投资方之间的合作博弈模型，研究了二人合作博弈模型中的要素，进一步确定了影响tot模式公路经营权转让的相关因素。

关键词：tot模式；公路经营权；转让；合作博弈

中图分类号：F50文献标志码：a文章编号：1000-8775（2015）04-0065-03

收稿日期：2015-01-20

作者简介：邓秋菊（1989-），女，汉族，湖南耒阳人，硕士研究生，专业：管理科学与工程。

1引言

公路工程作为一项公共基础项目[1]，最原始的状态是国家投资国家经营，而随着经济的发展，国家对于公路网的规划和建设需求更为迫切，资金的过大投入无法及时回收使得资金被固结在一个项目很长一个经营周期，所以整个公路的再建设就达到了一个资金瓶颈。那么，tot模式的应运而生正是给公路项目的再投资提供了突破口。

tot是英文transfer-operate-transfer的缩写，即移交——经营——移交。tot方式是国际上较为流行的一种项目融资方式，通常是指政府部门或国有企业将建设好的项目的一定期限的产权或经营权，有偿转让给投资人，由其进行运营管理；投资人在约定的期限内通过经营收回全部投资并得到合理的回报，双方合约期满之后，投资人再将该项目交还政府部门或原企业的一种融资方式[2]。

对于tot模式，它的存在可以解决政府资金的回收率小的问题，但是在经营权转让过程中政府与投资方之间的目标利益最大化使得转让无法快速达到最佳契合点，从而滞缓转让进程，降低合作效率[3]。本文通过对tot模式公路经营权转让进行合作博弈分析，运用二人合作博弈理论分析政府和投资方之间的利益分配问题。

2政府与投资方合作博弈关系的形成

在tot模式的项目中，政府与投资方之间的各方目标导致双方博弈关系的产生。对于政府，他是站在全社会经济的角度考虑，对问题进行考量，考虑多种因素，比如政治、经济、社会等。比较利益双方，投资方则往往以经济效益的最大化为其投资的最终目标[4]。因此，tot模式项目政府与投资方之间的博弈关系就是由于不同的目标而产生的。而双方合作的基础就是双方的共同目标。但两者的目标也有不同，对于政府更偏向于得到较高的融资资金用来填充公路领域的再投资资金，而投资方更希望以较少的投入获得较高的回报[5]，于是双方之间的这类相互抵触的差异目标使双方的博弈关系得以产生。

博弈的形成是建立在各个条件满足的前提下的，对于合作博弈更需要满足以下条件。

（1）双方目标的达成

博弈双方共同目标的存在是达成合作的基本前提，为达成共同目标，双方可对个人不同的目标值进行估算或者进行让步，进而服从共同目标[6]。而合作博弈分析的意义正在于此，使tot模式项目的经营权转让更加快速，提高了双方的合作效率。

（2）理性参与

tot模式项目中双方的合作可以提高的收益不小于因为合作而损失的收益，这样才吸引博弈双方参与合作。由于这与理性人的假设相一致，所以将理性参与作为另一个合作博弈的形成条件。

（3）合理的利益分配

合作的关键在于利益的存在，而如何对博弈双方在理性参与下的收益分配方案进行确定也是合作成功的重要条件。对于tot模式项目，如果双方达成协议，那么政府可以在转让经营权之后较快获得资金，并在约定的期限收回资产，存在的风险较小，而投资方因巨大的投资且在但短期内无法快速回收资金，本身是存在较大风险的。所以根据风险与收益相对应分配原则，政府应提供较高的投资回报来吸引投资方对tot模式项目的投资。政府所提供的回报是由tot模式项目的转让方案来表现的，尤其对转让价格的规定[7-8]。

（4）有效的协商

tot模式经营权转让合同其实就是合作双方对经营权转让的协议，对于协议的产生，双方的协商是必不可少的，正常的讨价还价也是合理存在的。双方对共同目标达成一致的前提下更多地为己方争取更大的收益，所以，势必会有一个谈判过程，其实也是解决利益冲突并达成使双方受益的协议过程。

3政府与投资方合作博弈的基本设定

政府对tot模式项目经营权转让定价是以有关部门认可的第三方评估机构作出的资产评估值为基准的，所以是受到法律制度的制约的，通常价格不会低于该评估价值。但是作为投资方，其参与合作的最终目标是收益，企业对于投资的收益率有其对项目效益的判断，所以投资方也将对转让获得的公路经营权进行预期收益的计算，算法中对收益率的取值是处于一个取值区间的，即投资商可以接受的最低收益率与投资商期望获得的最高收益率共同组成的一个收益率区间，这个区间影响着投资方对预期收益的确定，最终也会形成一个资产定价区间。则这个投资方确定的价格区间与政府的转让底价作为转让定价的基础，双方在此基础上进行二人的合作博弈。对于博弈双方，合作所创造的利益至少不低于不合作时所创造的利益，否则它们不会达成转让，合作利益满足超可加性，因此，双方之间的利益分配可以定义为一个具有旁支付的二人合作博弈。

二人合作博弈属于谈判博弈。它具有两个特征：第一，博弈双方因合作而取得的总收益大于无合作而各自获得的收益之和，即双方合作收益大于非合作收益之和。第二，不属于零和博弈，零和博弈指的是你增收等于我减损，或者我所得等于你所失的博弈。尽管双方都尽可能取得更大的收益，但是考虑到未进行合作而使双方收益减少的风险，则博弈方会放弃选择双方受损的做法。政府和投资方则更多地针对转让定价而进行讨价还价的博弈，如果双方达成转让协议，则政府将较快得到一笔转让资金，可以投入公路再建设，从而改善交通条件，加大公路网，协调区域经济的发展，也提高了投资商的投资意向，进而通过项目的运营而获得收益，促进资金的收益价值。如果双方没有达成协议，政府将继续对公路进行经营，那么资金被固结在项目中，无法进行投资再建设，且政府的运营效率也不及投资方的专业团队，很可能造成公路运营效益的损失，另一方面，投资方的资金造成闲置，降低了资金的收益价值。所以政府和投资方选择合作而获得的总收益要高于未选择合作而获得的各自收益的和，且该博弈不能属于零和博弈。

对于博弈双方，最关键是对合作取得的总收益进行分配，博弈模型建立的最终目的也是确定各方能够分配的收益，这项通过合作取得的总收益就是投资方以在企业确定的收益率区间中选取的最低可接受的收益率对项目收益进行的定价与第三方给出的资产评价值之间的差额，而政府获得的收益额即最终转让价超出资产评价值的数额。

政府和投资方的收益分配的二人合作博弈记为Γ（S，d，u1，u2）其中S为可行分配集，d为破裂点，u1和u2为博弈双方各自的效用函数。由于双方不同的主观立场、效用函数等因素，使其成为一个不对称的合作博弈问题[9]。

4二人合作博弈模型中要素的研究

（1）可行分配集

在二人合作博弈中，双方因各方利益而进行博弈，但是受到协议的控制，只能对双方可进行转移的利益进行分配，而针对无法分割的收益，分配过程很容易受到条件制约，这是合作博弈研究的关键对象。所以，关于双方利益的分配方案相对各博弈方的个人策略来说重要得多，在分配过程中需要采用旁支付等补偿机制。在本文研究的问题中政府和投资方待分配的收益是易于转移的。

用s1和s2表示两个博弈方的利益或支付，则二人合作博弈的分配可表示为S=（s1，s2）。本文中的博弈双方，政府方利益分配（合作取得的超过第三方机构评估值的部分收益）用s1表示，投资方利益分配（以最低收益率计算得到的转让价与最终合作定价之间的差值）用s2表示。但此分配受到以下问题条件和基本理性要求的限制。

1）分配不可以使双方获得的收益之和大于投资方以最低期望收益率算得的转让价，此处记为q。

2）博弈中的双方各自不能出现负收益。

而可行分配集就是能同时满足这两个要求的分配。该分配集可表示为S=｛（s1，s2）｜s1≥0，s2≥0，s1+s2≤q｝。

因为分配S=（s1，s2）不仅表示了博弈各方的对策略的选择，还表示了双方收益的分配，所以在合作博弈的问题中分配与可行分配集处于核心位置。

（2）效用函数

效用是二人合作博弈中的另一个十分重要的概念。博弈方各自在分配中的收益都属于通过评估计算得到的期望收益，而尚未得到。因此要考虑博弈方各自的风险因素。而博弈的对象不仅仅是现金收益，有时也可以是实物、项目或资源等非现金收益，但这并不能体现其给博弈方带来的收益，因为主观效用会影响博弈双方的分配结果。博弈方的内在要求及偏好是通过效用来表示的，效用配置则通过主观态度来影响二人合作博弈的过程及最终结果。一旦现金作为博弈对象并且在双方具有相同的风险时，期望效用与收益会因为风险态度及对主观价值评价的一致而相等；但是当博弈双方存在不同的风险态度及主观评价时，会对双方博弈的态度与结果产生影响。所以二人合作博弈既考虑分配S=（s1，s2），又需对效用配置U=（u1，u2）进行考虑，其中ui表示各方的期望效用，是分配集S到实数集R的函数ui：S—〉R，也就是博弈双方收益的函数，即U=ui（s）=ui（si）。效用配置集由全部的可行效用配置组成，即由可行分配集通过效用函数计算而成。

对于tot模式经营权转让问题，博弈双方收益分配的对象是转让超出评估值的收益，但此分配金额并不能完全体现项目转让带来的效用，因为对政府而言，通过转让获得的费用可以进行新一轮的公路投资再建设，而且把项目的运营交由投资方进行，能利用团队经营理念为社会及该项目带来的良好的效益，这些则是通过转让获得的固定效益，用p表示。用s1表示转让定价超出评估机构的评估值，则政府的效用表示为u1=p+s1；而对于投资方，分配的收益可以增加项目的整体投资回报，其效用表示为u2=s2[10-11]。

（3）谈判破裂点

谈判破裂点是二人合作博弈的另一个重要因素。任何谈判都是建立在一方妥协一方收益的基础上，一旦双方无法妥协或者预期收益无法实现，谈判就会破裂，但谈判破裂时博弈方也可能得到收益，因为合作未达成时双方可能有其他获取收益的机会。谈判破裂点就是当谈判发生破裂后博弈双方所能获得的利益。通常用d=（d1，d2）来表示，其中di是谈判破裂后博弈方能够获得的收益。当博弈双方在谈判发生破裂后都未获得收益，则谈判破裂点用（0，0）来表示。谈判破裂点也是可行方案集合内的一个子集。换句话说，博弈双方可以选择谈判破裂而中止协议。

在政府和投资方的合作博弈中，若谈判发生破裂，则政府继续经营公路，负责公路的养护，而投资方将资金投入到其他领域中去，此时分配为S=（0，0），则谈判破裂点为d=（p，0）。谈判破裂点影响着博弈双方的态度与结果，至少博弈双方无法接受分配的收益低于谈判破裂点。因为效用通常是收益的增函数，即si＜di跟ui（si）＜ui（di）是保持一致的，也就意味着博弈双方对与低于谈判破裂点的效用的分配（s1，s2）不可能进行选择。换句话说，一个有意义的合作博弈，至少要包含一个能为博弈双方都带来超过谈判破裂点效用的分配s∈S，即实现ui（si）＞ui（di）同时对i=1，2都符合[12]。否则就无法让博弈双方对合作发生兴趣，也无法得到优于个人理性博弈的结果，则该合作博弈也就失去了意义。

5结论

通过对tot模式公路项目经营权转让的博弈分析，并结合二人合作博弈模型中要素的研究，能够很好的分析转让定价过程中政府和投资方的博弈行为，为实现科学合理快速的经营权转让起到了重要的作用。

参考文献：

[1]徐海成.公路资产论[D]：[西安公路交通大学博士学位论文].西安：西安公路交通大学，1999，23-29.

[2]王开.关于高速公路建设融资的探讨[J].黑龙江交通科技，2009，2：34-35.

[3]高卫东.中国公路经营权存在的问题及对策分析[J].内蒙古科技与经济，2005，8：31-33.

[4]李永涛.讨价还价理论的实验经济学检验[J].商业研究，2013，3：25-26.

[5]张朋柱.合作博弈理论与应用[m].上海：上海交通大学出版社.2005：13-17.

[6]谢识予.经济博弈论[m].上海：复旦大学出版社，2006，344-359.

[7]m.Kaneko.priceoligopolyasaeooperativegame.internationalJournalofGametheory，1978，7（3-4）：135-150.

[8]王建辉，武玉英，陈火金.合作博弈在电子商务创建中的应用[J].北京理工大学学报（社会科学版）.2002，4：26-28.

[9]Johnnash，twopersonCooperativeGames，eeonometriea，21（1953）：125-140.

[10]m.a.Ball.anewsolutionforn-persongamesusingcoalitionaltheoryⅠ.theconditions.theRoyalSociety，a（2001）457：95-116.

[11]Shapley.avalueforn-persongames.ContributionstothetheoryofGames.1953：307-317.

[12]Judithtimmerete.onthreeShapley-likesolutionsforcooperativegameswithrandompayoffs.internationalJoumalofGametheory.

数学建模博弈论篇8

关键词：行为博弈；演化博弈；强互惠；生物理性；跟风策略；博弈论

中图分类号：F224.32文献标识码：a文章编号：1007-2101（2013）05-0037-06

一、引言

博弈论的开创者为数学家冯·诺依曼（Johnvonneumann）和经济学家奥斯卡·摩根斯坦（oskarmorgenstern），二人应用博弈论研究人类在战略和经济上的决策行为，发现了理的数学原则，并归纳出理的典型特征。[1]随后，约翰·纳什（Johnnash）拓展了二人的理论，区分了合作博弈和非合作博弈，创造了简明且影响深远的“纳什均衡”概念。[2]在20世纪五六十年代，博弈论的研究以合作博弈为主。而在20世纪七八十年代，约翰·海萨尼（JohnHarsanyi）提出了不完全信息博弈和海萨尼转换；莱茵哈德·泽尔腾（ReinhardSelten）定义了子博弈精炼的概念。[3]由此，博弈论研究的重点转向了非合作博弈。在20世纪90年代，行为博弈和演化博弈突破了经典博弈的完全理性人假设：行为博弈应用心理学规律弱化了理性假设，通过实验模拟来修正理论与实际的偏差，它关心的是参与者在实际中如何行动，而不是理论逻辑上的推理；[4]演化博弈假设博弈方是从大的总体中随机抽取的，他们是按照生物或社会的方式反复进行博弈。[5]或者说，行为博弈运用实验的方法来研究行为动机、认知能力和推理过程之间的结构关系；演化博弈则分析演化的动态过程和经济行为的学习特征，并重构了博弈均衡（eSS，演化稳定策略）。如果说经典博弈论的力量在于它的普适性和数理精确性，那么行为博弈与演化博弈的优势就是它解释问题的现实性，所以实验与模拟是构建有限理性博弈的基础，但目的并非“证伪”博弈论，而是通过建立规则来改进它。

强互惠（Reciprocity）最深刻的含义在于：它是一种具有“利他”倾向的第三方惩罚行为或惩罚机制，虽然和我无关，甚至需要我付出巨大代价，但我仍然要对“恶”人宣战，以此来“惩恶扬善”[6]。强互惠行为的证据大多来自可控行为博弈实验：在“最后通牒”博弈中，多数实验参与人拒绝了不公平的分配方案，以此来惩罚对方的非友善行为；[7]在“公共物品”博弈中，惩罚可以减少搭便车行为从而提高捐赠水平，但需要个人承担一定的成本；[8]在劳动市场博弈中，当雇主获得惩罚和鼓励雇员权力时，雇员的努力水平会显著提高。此外，许多学者对不同经济领域中的强互惠行为进行了解读：强互惠视角下的工资刚性；[9]商业活动中平等规范的盛行；[10]产业组织理论中的强互惠[11]。在众多的强互惠研究中，以美国桑塔费研究员金迪斯等人所做的跨文化最后通牒博弈最为引人关注。金迪斯等人在12个国家中的15个有着极为不同的经济和文化环境的小规模社会中招募研究对象并进行实验，结果与经济学规范模型自利假设发生系统性偏离：除了物质利益之外，很多实验对象更关注公正和互惠，愿意为修正物质利益的分配而承担个人损失。

从现有的研究文献来看，强互惠理论产生于行为博弈实验，并在此基础上进行了拓展性研究。但现代经济学研究往往只局限于行为博弈的视角，提出强互惠行为是一种非理性的情感行为。那么，强互惠行为到底是不是非理？其中的情感因素从本质上来看是什么？以及为什么会有这样的情感因素出现？显然，通过深入分析行为博弈和演化博弈之间的逻辑联系，探索强互惠行为背后的内在生物学机制，对正确理解人类行为是非常必要和重要的。

二、行为博弈的分析范式与强互惠行为的发现

行为博弈是将行为及实验经济学与标准博弈论相融合的结果，意在对个人或团体在各种策略条件下行动做出与实际更为一致的解释和预测。与传统博弈论注重逻辑推理相比，行为博弈以数据和心理学材料为分析工具，实验及其结果是其理论构建的基础。所以，从某种程度上来看，行为博弈的分析范式是一种实验的范式。

（一）行为博弈实验的设计

1.实验对象的选择。人类群体中个体种类很多，究竟应该选择那类群体作为行为博弈实验的研究对象便成为实验设计首先要关注的问题。在现有的行为博弈实验中，大多数实验者选择了在校大学生作为自己的研究对象，一方面是因为大学生群体相对比较简单，与社会联系较少，考虑的外生变量较少；另一方面是因为大学生群体受到一定的文化教育，能够很好地理解实验过程，并按照实验者的要求做出相关经济行为。选择大学生群体作为实验对象是行为博弈实验设计的一个显著特征。其实，在大学生群体中，不同专业之间的学生表现出了不同程度的互惠行为：经济学专业的学生出价要比其他专业的学生低7%而索取的要高7%。[12]

2.实验操作指导。实验操作指导在实验开始前告诉参与人需要知道的各种信息，主要包括博弈顺序和博弈支付两个方面，即有关信息的完全性和完美性的说明。清晰而明确的操作说明是保证实验成功的关键，且一般情况下大声朗读实验说明是确立“公共知识”的主要方式。从本质上来看，实验操作说明是一种控制信息的手段：一方面，确保实验对象可以利用足够的信息去计算均衡；另一方面，通过对信息的控制来发现参与者的能动性，比如，在学习模型中，实验者有意控制关于支付的信息，目的在于探索人的学习能力。[13]

3.匿名与否。匿名是行为博弈实验的基本要求。实验对象的博弈行为受到对方的身份、年龄、相貌、语气等个人特征的影响。只有在匿名博弈的前提下，实验发现的才是个人的真实偏好，一旦知晓对方的个人信息，将会影响实验对象行为的策略选择。霍夫曼等人进行了两个“相互蒙蔽”的独裁者博弈。[14]实验结果显示：一半以上的实验对象未分出任何金额的美元，并且平均剩余钱数只有总额的10%，明显小于无“相互蒙蔽”条件下的结果。对这种现象可解释为“相互蒙蔽”增加了实验对象之间的“社会距离”。[15]此外，一些个人特征也会对实验参与者的行为产生影响，比如拥有较好面貌的实验者能够得到对方更多的分配比例或更不易被对方拒绝；[16]能够促使实验者提出更公平的分配方案或更不易拒绝对方；[17]女性比男性能提出更公平的分配方案，也能接受更低的分配比例[18]。所以，要想在行为博弈实验中发现参与人行为之间的真实差异，必须排除人口统计因素的影响，而匿名处理成为必然选择。

4.激励方式。现金激励和非现金激励对人的行为产生不同的影响，仅仅得到分数支付的实验对象倾向于无规则的达到竞争均衡，而且比能得到现金的实验者更快地厌烦实验，即假设的奖励更易变、更不可信和更容易满足。相反，现金支付会减少理性预测反应的偏差。所以，对实验对象支付现金迅速成为实验经济学中的标准方式。那么，奖金的多少对行为博弈实验的结果产生怎样的影响呢？许多研究已经进行了增加奖金的实验。大多数理论推断当奖金上升时，回应者会拒绝的出价将上升而他们会拒绝的比例份额会下降。然而，有的研究却显示，随着奖金的增加拒绝比率并未出现显著的变化。[19]根据当地的购买力，卡梅龙（Cameron）在印度尼西亚、斯络尼姆和罗思（SlonimandRoth）在斯洛伐克、里斯特和凯瑞（ListandCherry）在佛罗里达州均进行了创见性的实验。研究结果表明奖金的较大变化对拒绝行为只有有限的影响，对提议者的出价比例也几乎没有影响。

总之，行为博弈实验的设计涉及很多因素：实验方法论因素（重复与否、奖金形式和匿名与否等）、人口统计因素（性别、种族、专业、年龄和相貌等）、文化因素（语言问题等）、描述性因素（说明方式、语境等）。博弈论专家通过对这些因素的控制和度量进行了拓展性的研究，结果表明：公平是人们对参与者行为或其结果的一个判断，并且这个判断会影响其对行为和分配的偏好。

（二）强互惠行为的发现

强互惠行为是人们对善意或非善意互动的反应，体现出人们对公平的显著性偏好（Falk，2001）。那么，人们如何区分善意和非善意的举动呢？关键在于两个因素：一是行为导致的后果；二是潜在的企图。相关实验研究表明第二个因素起主导作用，若提议者的分配方案是随机产生的，那么回应者对相同方案的拒绝率要低于非随机情况，即表现出一种友好行为。[20]所以，强互惠行为违反了传统经济学中人的“自虑”假设，是一种典型的“他虑”行为，而规范经济学中将其定性为非理性的情感行为。

为揭示强互惠行为的本质，必须从发现这种行为的大量行为博弈实验开始。由于影响实验设计的因素很多，所以现存的实验证据也比较复杂。无论是在经济学和心理学实验领域，还是在社会学和人类学实验领域，均发现了强互惠行为的存在，这说明了该人类行为的普遍性。然而，最具说服力的证据大都来源于可控的实验室实验：在最后通牒博弈中，许多人拒绝了较低的出价以惩罚提议者的非友善企图；在投资博弈和礼品互换博弈中，友善行为得到了回报。[21]在众多行为博弈实验中以桑塔费研究院所作的跨文化最后通牒博弈研究最为突出，影响也最为广泛。来自经济学、人类学、社会学、心理学和博弈论等诸多领域的专家历时近10年完成了这项实验：研究对象来自12个国家中的15个小规模社会；在大多数实地实验中，受试者是匿名参加的；多数博弈实验选取的标的是钱，少数选取了烟草等替代品；在所有的实验中，均根据应征者对实验的理解程度来选择实验参与者。研究结果表明：传统的“自虑”假设未在任何一个小规模社会中得到证实；市场化程度越高，提议者出价越高，行为博弈实验中的合作水平越高；个体层次上的变量不能解释群体之间的行为差异；实验中的行为与小规模社会中的经济模式相一致。[22]

总之，强互惠行为的发现违反了规范模型中理性人追求自身利益最大化的假设。在各种形式（对不同的因素进行控制和度量）的行为博弈实验中，最后通牒博弈支付均严格为正，而且在大多数实验中，实验参与人一般都拒绝出价较低的提案。更为重要的是，经济选择中的这种强互惠偏好并非像传统经济理论中所假设的那样是外生的。相反，它是在日常的经济、社会互动中逐渐形成的，即强互惠偏好是内生的。这为探索强互惠行为的根源指明了方向，即从演化的视角来分析这一人类偏好，指出它的生物理性本质。

三、演化博弈的分析范式与占优的跟风策略

演化博弈理论是研究群体进化的一种动态方法，其研究对象是频率制约选择下的进化动态。其中，个体的适应度并非常数，而是依赖于不同表现型在群体中所占的比例。演化博弈理论源于博弈论与生物学之间的互动：首先，生物学家尝试运用博弈论建构各种生物竞争演化模型，比如生存竞争、性别比例等；[23]然后，生物学家将种群思想引入博弈论之中，比如适应度概念、进化稳定策略、复制方程等；[24]最后，经济学家借鉴生物学家提出的理论，继续发展了演化博弈，从演化稳定均衡扩展到随机稳定均衡。不论演化博弈理论如何发展，独特的分析范式是其核心特征。

（一）演化博弈的分析范式

2.演化稳定策略。演化稳定策略（eSS，evolutionarilyStableStrategy）是演化博弈中一个非常关键的概念。[25]其核心思想是，如果一个现存策略是演化稳定策略，那么，必须存在一个正的进入障碍，使得当变异策略的频率低于这个障碍时，现存的策略能够比变异策略获得更高的收益[26]。假设现存策略为x，变异策略为y，而变异者进入后占总体的比例为？着（0

3.复制动态方程。演化过程是两个基本要素的组合：一个是产生多样性的变异机制；一个是倾向一些种类的选择机制。演化稳定性强调变异的作用，即个体策略的随机变动，而复制动态强调的则是选择的作用。（二）占优的跟风策略

一种人类行为如果经历了漫长的演化过程，即经过变异的入侵检验和选择的动态复制，能够生存下来。那么，就可以说这种人类行为是演化稳定的。通过前面的分析可知，要想揭示强互惠行为的内生性和生物理性本质，必须从演化的视角进行解读。那么，在演化博弈中应该如何来解释强互惠行为呢？对这一问题的回答可以从演化博弈中的关键性概念“跟风策略”开始。

跟风策略（tFF，titfortat）又称“一报还一报”策略，即开始时选择合作，然后不断重复对方上一步的选择。[29]它是由多伦多大学博弈论专家阿纳托尔·拉帕波特（anatolRapoport）在罗伯特·阿克塞尔罗德（Robertaxelrod）重复囚徒困境计算机竞赛中提出的一个博弈策略。阿克塞尔罗德在20世纪末进行了三次计算机模拟实验，目的在于探讨人类合作能否从有着自己利益最大化推理逻辑的行动者的行为互动中自发产生。在第一次实验中，共有15种策略参赛、225场比赛，模拟结果显示，跟风策略平均得分504.5，即基准分600的84%，排名第一；在第二次实验中，阿克塞尔罗德将参赛策略增加到63个，并将第一次实验的结果告知参赛者，模拟结果显示，跟风策略平均得分为基准分的96%，在此排名第一；在第三次实验中，阿克塞尔罗德并未增加新的策略，而是从演化博弈的角度出发，试图发现史密斯的“演化稳定策略”（eSS），模拟结果表明，跟风策略在演化迭代中依旧表现出色，而“诡诈型”策略在200代以后完全消失。通过三次重复囚徒困境博弈实验，阿克塞尔罗德发现：跟风策略稳定成功的原因在于它综合了善良性、报复性和宽容性。[30]善良性，即从不首先背叛；报复性，也称可激怒性，即对方若背叛，则自己将在下轮对其惩罚；宽容性，即一旦“改过”，自己以合作对待。正是这三种特性保证了跟风策略在与各种策略的博弈过程中能够获得较高的平均支付，具有较强的适应性，即跟风策略具有演化稳定性。正如生物学家道金斯所说，即使有自私的基因掌权控制，好人仍能得好报。[31]

四、行为博弈与演化博弈的比较

（一）差异性

经典博弈论最根本的失误在于，缺乏一套关于参与人何时以及如何共享心理建构的理论。经典博弈论失灵的地方，演化博弈论却大获成功。策略互动的模拟演化分析有助于理解行为的涌现、转化和稳定性。在演化博弈论中，成功的策略在参与人群体中扩散，而不是由脱离实际的理性主体来归纳学习。而且，理性的个体甚至从不尝试学习针对复杂博弈的最优策略，而是复制他们所遇到的成功的主体的行为。所以，演化博弈计算机模拟得出了占优策略——跟风策略，而采取这种策略的个体将有更高的几率生存下去。相反，行为博弈才运用行为实验的方法，对个体的真实经济行为进行数据统计分析，然后基于这种数据资料的实证性和描述性发现了一种特殊的人类行为——强互惠行为。所以，演化博弈与行为博弈的差异性主要体现在方法论层次上。演化博弈分析是基于有限理性人假设的逻辑推理，而行为博弈分析是基于行为实验的实证研究。演化博弈注重演绎，而行为博弈注重实验结果。在主流博弈理论中，逻辑推理的分析范式一直处于主导地位，而对实验方法重视不够，这就导致了理论与现实之间的差距，即博弈理论并不能解释真实的经济行为。如果缺少一套广泛的事实体系来加以理论化，就必然存在着某种花过多时间建立精巧模型然而和实际行为却毫无联系的危险。[32]目前，实证知识是严重不足的，数据对于博弈论来说尤为重要，因为均衡一般有多个，而均衡的实现过程并不清晰，只运用数学的逻辑推理并不能解决这一问题。

（二）互补性

实验数据表明传统的非合作博弈理论、合作博弈理论和进化博弈理论的理论框架并不能单独对人的实际经济行为做出可靠的解释，但若结合行为博弈中的实证知识，多数行为均可被很好的理解。所以，演化博弈与行为博弈之间的关系可以被理解为理论与数据之间的关系，演化博弈理论指明了研究方向，而行为博弈则细化并修正了这一方向。正如波普尔所说，开展科学研究应该遵循证伪主义的原则，即在理性批判的思想指导下，采取试错法进行研究。[33]演化博弈理论表现为一种全称判断，而行为博弈实验是一种个别现象，个别事例无论重复多少次，都不能证实一个全程判断。所以，行为博弈是对演化博弈理论的一种修正、一种支持，而演化博弈的研究也应该建立在行为博弈实验的基础之上，两者之间是一种互补关系。

五、结论与展望

（一）一个新概念：生物理性

行为博弈从实验经济学的途径出发通过广泛的行为经济学实验来分析个体行为的真实状态，发现了强互惠是人们在社会互动中经常采用的行为方式，而这种行为方式却违反了传统经济学中的“经济人”假设，从这个角度来看，“强互惠”行为是非理性的。相反，演化博弈运用计算机模拟实验对个人之间的策略博弈进行了分析，并得出结论：跟风策略是最优策略。这种分析视角可以认为是一种演化的视角，是行为人过程理性的体现。通过比较强互惠行为和跟风策略可以发现，强互惠行为是行为人的一种本能表现，而这种本能表现是以生物演化过程中的占优策略——跟风策略为基础的。也就是说，强互惠行为的生物基础和演化基础是占优策略，即从演化角度来看，强互惠则体现了个人的过程理性，并不能简单地把它归结为非理。

在行为人的非理中，存在一些过程理，虽然从短期来看，这些行为是非理，但是从长期来看却是过程理性的体现，这是演化理在生物体中的内化表现，可以看成是一种潜意识反应，甚至可以看成是基因的外在行为体现，这类行为体现了人的生物理性，即这些行为的产生及扩散是以提高生命体的适存度为目的的。

生物理性或演化理性，是自然给人类设定的一个“理性”。这个“理性”可以完全形成于自然环境之中，也就是说，完全由相互作用的无情数学规律，通过自然选择的多次筛选形成。人们肯为自己的亲人做出自我牺牲的行为或者说强互惠行为的产生，有着生物学上的根源。此类行为只是所谓“自私的基因”的一个表现，其结果是使载有与自身相似基因的个体获益。

如果有人认为，这种彼此合作的强互惠形势并不是博弈论的数学结论导致的，而是由人类的情感因素决定的。但是，在自然界中，跟风策略的广泛存在有力地反驳了这一观点。[34]生物学中的证据表明，吸血蝙蝠、棘鱼、猿猴，甚至病毒，都会遵循“跟风”规律行事。认为病毒也信奉利他主义，那是肯定说不通的，它们的行为，完全是进化选择的结果。这就是说，遗传因子中存在造成类似于“跟风”行为的生命体，会在进化过程中获得优势，因此自然选择会朝着有利于它们的方向进行，从而使这样的遗传类型得到更好的传递。这意味着，人类也是天生含有合作基因的。爱德华·o·威尔逊认为，随着人类文明的发展，这样的行为模式，会从本能冲动转变为社会习惯，进而又演化为法律约束，并最终成形为道德准则。

（二）展望

1.强互惠行为是一种生物理性，而且在不同的环境中，强互惠程度存在种种差异：市场化程度越高的社会表现出越高的强互惠程度。这种现象又体现出强互惠的另一种特征，即强互惠者的增加是一种集体效应，需要相互作用的累计：单个强互惠者不能侵入背叛者群体，只有满足一定条件的强互惠群体才能侵入。从这方面对强互惠行为展开延伸性研究是非常必要的，它有助于我们更好和更全面地认识强互惠行为。

2.从配对博弈到n人博弈。现有的演化博弈研究有严格的前提假设，比如在阿克塞尔罗德的计算机模拟实验中，研究的范式是两人重复囚徒困境博弈，即相互作用的策略始终是以配对形式出现的，是一种典型的配对博弈。这种分析范式简化了博弈局面，存在很大的局限性，应该逐步扩展到n人之间的博弈，即考虑三个以上策略之间的互动。跟风策略在配对博弈中是占优的，那么它在n人博弈中能否继续占有呢？这是一个有待回答的问题。

3.从互惠到空间互惠。空间效应能极大地改变频率制约选择的结果。如果考虑空间效应，那么原本在同质环境中相互排斥的策略是有可能共存的。传统的强互惠行为只是在一一配对的行为博弈实验中发现的，一旦扩展到空间博弈，将会发现一种新的合作进化机制，即空间互惠（SpatialReciprocity）。[35]

通过比较行为博弈与演化博弈的分析范式以及强互惠行为与跟风策略，本文认为，行为博弈和演化博弈在方法论的选择上存在较大的差异：前者重视数据资料，后者重视逻辑推理；同时，行为博弈和演化博弈之间体现出很强的互补性：前者以后者为导向，后者以前者为基础，是一种猜想与反驳的关系。此外，强互惠行为与跟风策略的殊途同归，证明了强互惠行为的生物理性本质，从侧面说明了行为博弈与演化博弈的逻辑联系。所以，行为博弈与演化博弈一个较好的研究路径是：演化博弈以行为博弈为基础，利用行为博弈实验的数据不断修正自身理论推理的缺陷，以更好地解释真实的经济行为；行为博弈以演化博弈为指导，利用演化博弈理论成果来理清行为实验的方向，以提高经济学实验的针对性。只有二者的良性互动，才能促进这两种博弈理论的理性发展。

参考文献：

[1]martina.nowak.evolutionaryDynamics：exploringtheequationofLife[m].wilsonBinding：Belknappress，2006.

[2]J.F.nash.non-cooperativeGames[m].princeton：princetonUniversitypress，1950.

[3]DavidKreps.Gametheoryandeconomicmodeling[m].London：oxfordUniversitypress，1990.

[4]ColinF.Camerer，GorgeLoewenstein.psychologicalperspectivesonJustice：theoryandapplications[m].Cambridge：CambridgeUniversitypress，1993.

[5]J.w.weibull.evolutionaryGametheory[m].massachusetts：mitpress，1995.

[6]金迪斯，鲍尔斯.走向统一的社会科学：来自桑塔费学派的看法[m].浙江大学跨学科社会科学研究中心，译.上海：上海世纪出版集团，2005.

[7]w.Güth，R.Schmittberger，B.Schwarze.anexperimentalanalysisofUltimatiumBargaining[J].JournalofeconomicBehaviorandorganization，1982，（3）：367-388.

[8]ernstFehr，m.Klaus.Schmidt，atheoryofFairness，Competition，andCooperation[J].QuarterlyJournalofeconomics，1999，（114）：817-868.

[9]t.Bewley.aDepressedLabormarketasexplainedbyparticipants[J].americaneconomicReview，1995，（85）：250-254.

[10]D.Kahneman，J.Knetsch，R.thaler.FairnessasaCoonstraintonprofit-Seeking：entitlementsinthemarket[J].americaneconomicReview，1986，（4）：728-741.

[11]R.m.Steers，L.w.porter.motivationandworkBehavior[m].Fifthedition，newYork：mcGraw-Hill，1991.

[12]JohnR.Carter，michaelD.irons.areeconomistsDifferentandifSo，why？[J].Journalofeconomicsperspectives，1991，（5）：171-177.

[13]VanHuyck，B.John，RaymondC.Battalio，Frederickw.Rankin.SelectionDynamicsandadaptiveBehaviorwithoutmuchinformation[m].texas：a&mUniversitymanuscript，2001.

[14]elizabethHoffman，KevinmcCabe，KeithShachat，VernonL.Smith.preferences，propertyRightsandanonymityinBargainingGames[J].GamesandeconomicBehavior，1994，（7）：346-380.

[15]BrunoFrey，irisBohnet.institutionsaffectFairness：experimentalinvestigations[J].Journalofinstitutionalandtheoreticaleconomics，1995，（2）：286-303.

[16]DonjaDarai.FacingaDilemma：CooperationBehaviorandBeauty[R].noeconwp082，eCn-workingpapersfromDepartmentofeconomics-UniversityofZurich，2012.

[17]BradleyRuffle，RichardH.Sosis.Doesitpaytopray？evaluatingtheeconomicReturntoReligiousRitual[R].experimentalfromeconwpa，2003.

[18]StephanieSeguino，thomasStevens，markLutz.GenderandCooperationBehavior：economicmanRidesalone[J].Feministeconomics，1996，2（1）：1-21.

[19]alvine.Roth，Vesnaprasnikar，masahirookuno-Fujiwara，ShmuelZamir.BargainingandmarketBehaviorinJerusalem，Ljubljana，pittsburghandtokyo：anexperimentalStudy[J].americaneconomicReview，1991，（81）：1068-1095.

[20]arminFalk，e.Fehr，UrsFischbacher.testingtheoriesofFairness-intensionsmatter[R].workingpaperno.63.instituteforempiricalResearchineconomics，UniversityofZurich，2000.

[21]e.Fehr，G.Kirchsteiger，anda.Riedl.DoesFairnesspreventmarketClearing？anexperimentalinvestigation[J].QuarterlyJournalofeconomics，1993，（108）：437-460.

[22]JosephHenrich，RobertBoyd，SamuelBowles，ColinCamerer，ernstFehr，HebertGintis，Richardmcelreath.insearchofHomoeconomicus：Behavioralexperimentsin15Small-ScaleSocieties[J].americaneconomicReview，2001，（91）：73-78.

[23]R.C.Lewontin.evolutionandthetheoryofGames[J].JournaloftheoreticalBiology，1961，（1）：382-403.

[24]J.maynardSmith，G.R.price.theLogicofanimalConflict[J].nature，1973，（246）：15-18.

[25]J.maynardSmith.thetheoryofGamesandtheevolutionofanimalConflicts[J].JournaloftheoreticalBiology，1974，（47）：209-221.

[26]黄凯南.演化博弈与演化经济学[J].经济研究，2009，（2）：132-145.

[27]J.w.weibull.evolutionaryGametheory[m].mitpress，1995.

[28]谢识予.经济博弈论[m].上海：复旦大学出版社，2010.

[29]anatolRapoport，albertm.Chammah.prisoner’sDilemma[m].annarbor：Universityofmichiganpress，1965.

[30]阿克塞尔罗德.合作的进化[m].吴坚忠，译.上海：上海人民出版社，2007.

[31]R.Dawkins.theSelfishGene[m].oxford：oxfordUniversitypress，1989.

[32]ericVanDamme.Gametheory：thenextStage[m].U.K.：oxfordUniversitypress，1999.

[33]赵敦华.赵敦华讲波普尔[m].北京：北京大学出版社，2006.

数学建模博弈论篇9

【关键词】互惠理论/生物学哲学/形而上学/利他主义/博弈论

【正文】

近几十年来，与生物学突飞猛进的发展相应，国际生物学哲学界的研究异常活跃，文献大量涌现，涉及的领域十分广泛。国内科学界和哲学界对于国际生物学哲学的活跃景象作出的反应不多。而在这不多的反应中，70—80年代主要是对分子生物学哲学问题的关注，80—90年代主要是视野向生命伦理学和生态哲学的扩展。这两个方面所涉及的生物学对象，从尺度上看分别是生命的微观结构和宏观现象，从性质上看分别是纯粹生命现象和生命与社会的关系。动物行为学（ethology）的研究对象无论是从尺度上还是从性质上看，均介于这二者之间。近20年来，以这门学科为中心，旁及理论生物学尤其是行为生态学（behavioralecology）等领域，新发现的科学事实、对这些事实的理论解释、关于这些解释的哲学分析相互交错，构成了科学观察、数学建模、方法论探讨共同推进的局面。这方面的研究迄今在国内学术界很少见诸文献。本文拟对这一领域中的互惠利他主义的博弈论模型及其形而上学预设进行哲学分析，以引玉之砖，促进国内哲学界对于动物行为学进展及其哲学问题的关注。

自然选择论与亲缘选择论的困难

达尔文生物进化论的核心是自然选择学说。按照这个学说，物种在生存斗争的过程中，经过自然选择的作用，逐渐产生新的物种，实现生物的进化。[1]自然界的有些现象可以用生存竞争直截了当地作出解释。南极洲帝企鹅在下水之前为了确定水中是否有海豹，有时相互往水中推拥。黑头鸥为了免除捉鱼之苦，往往趁附近成鸥不在巢中时捕食其雏鸥。雌螳螂为图觅食之便，甚至寻找机会吃掉与之交配的雄螳螂。这些都是生存竞争的极端例子。

但是，生物界似乎还存在利他行为。有不少鸟在察觉到捕食飞禽出现时，会发出警叫声让同伴逃避，自己因警叫却处于危险境地。汤姆森瞪羚在发现捕食者时，会通过跳跃向同伴发出信息，而使自己暴露在捕食者面前。鸟的警叫和瞪羚的跳跃看上去好像都是自我牺牲行为。但是，这些行为实际上也是个体的一种生存策略。察觉到捕食飞禽的鸟如果不发出警叫，其他仍在活动的鸟就会把捕食者的注意引向它自己周围，给包括自己在内的鸟群带来危险。因此，发出警叫比不发出警叫更好。当然，警叫还是有一定的危险，不过警叫时容易暴露声源的鸟会被自然淘汰。此外，捕食者首选的猎物是容易捕获者，因此瞪羚的跳跃是显示自己身强力壮，其目的在于让捕食者去捕食体弱无力者。这样看来，鸟的警叫和瞪羚的跳跃不过是“主观”为自己，客观为他者而已。

与鸟的警叫和瞪羚的跳跃相比，生物界还盛行着利他者甚至“主观”上也不为自己的自我牺牲行为。亲代付出精力、时间和能量孕育、喂养和保护子代，而自己一般不得益，这几乎是动物界的普遍现象。蜜蜂中的工峰自己不生育，只承担筑巢、采蜜、养幼蜂等工作。如果遇到掠夺蜂蜜者，工蜂还得刺螫掠夺蜂蜜者，自己却因刺螫中内脏拖出体外而死亡。对于这些纯粹的利他行为，经典的自然选择学说难以作出令人满意的解释，因为利他的有机体与那些不付出代价而在被帮助中受益的有机体相比，在生存斗争中应当有劣势而不能进化。所以初看上去，似乎接受自然选择说就不能承认利他行为的存在，而事实上这种行为确然存在。

为了解释利他行为的存在，汉密尔顿（williamHamilton）提出了亲缘选择理论，　并且建立了相应的数学模型[　2]，后来道金斯（RichardDawkins）对其基本思想作了进一步阐发[3]。简单说来，这个理论认为，近亲之间利他行为的存在和进化，是由于有机体只是基因的载体。自私的基因控制着个体的行为，使自己的拷贝得到保存和大量繁殖，而近亲具有共同基因的比例大，这就决定了近亲之间在必要时要采取利他行为。亲代生育和抚养子代自己不得益，是因为子代的基因来自父体和母体的各占1／2。工蜂自杀性地保护蜂蜜，是因为巢中与它有相同亲代的蜜蜂的基因有1／2与它的相同，并且这些蜜蜂的子代的基因还有1／4与它的相同。为了相同基因的利益，它必须做出牺牲。亲缘选择理论部分解释了近亲之间存在利他行为的现象，但是却不能解释非近亲有机体之间存在的利他行为。[4]

标准迭演囚徒困境博弈模型

面对经典自然选择说和亲缘选择说面临的困难，生物学家们诉诸互惠利他主义。初略地讲，互惠利他主义之所以进化，是因为一个有机体付出代价帮助另一个有机体，可以在下一次受益于另一个有机体的帮助，这样获益更大。这里，“互惠利他主义”是指两个有机体之间交换适合度（fitness）代价和利益的行为。为了精确地发展这一思想，生物学家们广泛使用博弈论模型。在这些博弈论模型当中，以二人迭演囚徒困境博弈最为基本。

囚徒困境博弈源自关于两个合伙犯罪者的传说。[5]这两个被捕的囚徒在警方面前要么合作（保持沉默），要么背叛（坦白），不可抗拒。如果二人都保持沉默，他们在受审期间就会处于禁闭状态，但在不长的时间比如说6个月之后就会获释。如果二人中的一人供出对同犯不利的证据，他（或她）就将作为证人逍遥法外，而另一个囚徒则不得不承担全部法律责任，譬如蹲5年监狱。如果两个囚徒都坦白，二者都将承担蹲2年牢的刑事责任。显然，背叛是最佳选择，但是，如果二人都沉默就会比二人都背叛的结果更好。于是，合作还是背叛，就成为一个二难困境。这个博弈刻划出博弈者利益部分冲突的情况，被许多研究领域作为一种有效的分析手段而广泛采用。据统计，迄1980年止，关于囚徒困境博弈的科学出版物已达数千篇（部）之多。[6]

特里弗斯（Roberttrivers）最早采用囚徒困境博弈，提出了描述互惠利他主义行为的自然选择模型。该模型说明了自然选择在系统中如何不利于骗子（非互惠者）。[7]阿克塞尔罗德（Robertaxelrod）与汉密尔顿[8]以囚徒困境博弈境况中的进化稳定策略概念为基础，发展了这个模型。这两篇论文已经成为现代经典，引用它们的文献已近千篇。在这两篇论文的基础上，关于互惠性的囚徒困境建模工作不断深入。

用囚徒困境博弈的语言来说，有机体的行为受其采取的策略支配，而这种策略就是使用合作与背叛手段的规则。譬如全背叛策略，博弈者在每一步博弈中都背叛。再如一报还一报策略，博弈者在第一步合作，然后采用其对手在上一步采用的手段。在非零和博弈中，孤立地看，不存在最佳策略。策略的优劣取决于该策略本身以及与之遭遇的种种策略的性质，还取决于遭遇到的各种策略相互作用的历史。阿克塞尔罗德组织了两次计算机竞赛，由自愿参赛者提交博弈策略程序参赛。两次竞赛中提交的程序分别有14和62个，结果都是一报还一报获胜。[9]一报还一报能够成功，是因为它引诱对手合作，而当帮助得到对手的有条件报答时，这样的帮助就有利。显然，这是一个基于合作的策略。进一步的理论分析表明，以互惠性为基础的合作能够在一个自私的世界中开始，还能够在与范围广泛的其他策略相互作用的同时兴盛起来，并且能够对抗其他策略的侵犯。[10]

一些观察结果进一步确证，没有亲缘关系的有机体之间的合作可以是稳定的。鲈鱼具有雌雄两性器官，充当雌性角色就要高投资（产卵），充当雄性角色则是低投资（给卵受精）。两尾鲈鱼之间的交配大致是轮流充当雌雄性角色，如果性角色分工不平等，那么这种关系就会破裂。[11]虹＠①群易于遭受肉食动物的进攻，所以有时就需要有一两尾虹＠①离群探察肉食动物是否有进攻的先兆。如果两尾虹＠①前往探察，那么每尾虹＠①都有接近该肉食动物（合作）和畏缩不前（背叛）两种选择。如果两尾虹＠①同时探察，那么两尾虹＠①被吃掉的危险就会减少。[12]

在动物行为学中，囚徒困境博弈可用以下支付矩阵表示：

附图

支付（payoff）是两个博弈者在实施一定的策略后出现的后果。R、t、p和S表示对有机体的适合度支付。每一对后果中的第一个字母表示对于博弈者1的支付，第二个字母表示对于博弈者2的支付。R是对二者合作的奖励（reward），t是对背叛的诱惑（temptation），p是对二者背叛的惩罚（punishment），S是对傻瓜（sucker）的欺骗。绝大多数生物学文献都认定，囚徒困境由两个必要条件决定，这就是：（1）对手合作，自己背叛结果最好，对手背叛，自己合作结果最差，双方合作比双方背叛结果要好，就是说支付值的大小顺序为t＞R＞p＞S。这是指令条件。（2）对双方合作的奖励比对背叛的诱惑和对傻瓜的欺骗的平均效果好，即R＞（t＋S）／2。这是反剥削条件。满足这两个条件的博弈，就被称为标准囚徒困境。在这两个条件中，指令条件使博弈者面临困境，反剥削条件使博弈者不能通过轮流互相剥削来摆脱困境。在单局性的以及局数一定的囚徒困境博弈中，虽然相互合作比相互背叛好，但每一个博弈者通过背叛却可以最大限度地增加自身的利益，行为自私的有机体应当比利他主义者做得更好。[13]合作之所以进化，是因为博弈双方还有相遇的机会，博弈还可以多次进行。在重复次数不定的博弈，即迭演博弈中，合作可以出现并且能够稳定下来。像一报还一报策略的成功，就解释了在亲缘和群体选择未发生的情况下合作可以变得稳定的原因。

互惠利他主义的必要条件

阿克塞尔罗德和汉密尔顿用标准迭演囚徒困境为分析互惠利他主义的进化奠定了基础之后，生物学家们对这个基础的坚实性曾经提出过一些疑问，其中最主要的批评有两点，一是认为单局囚徒困境表示的是互助而不是互惠，二是认为互惠利他主义需要利他滞后发生的机会。[14]针对这些批评，博伊德（RobertBoyd）提出，迭演囚徒困境中的互惠行为是滞后的并且发生于延续的时间之中，从而为囚徒困境作为互惠利他主义的恰当模型作了辩护。[15]最近，日本学者研究了点阵结构种群中合作的进化[16]，瑞典学者提出了研究迭演博弈的状态空间法[17]，等等。这些工作的基础，都是标准囚徒困境模型。[18]

然而，博伊德的工作只说明囚徒困境博弈至少可以用来建立某些情况下的互惠利他主义模型，但并不意味着建立一切情况下的互惠利他主义模型都必须利用这种博弈。为了探索其他形式的模型，哲学家斯蒂芬斯（ChristopherStephens）从一般意义上得出了互惠利他主义所必要的非形式条件，分析指出标准囚徒困境博弈的必要条件并不是互惠利他主义的必要条件，继而给出了互惠利他主义的必要形式条件。

互惠利他主义的非形式条件，就是不借助数学（这里是博弈论）模型来定义互惠利他行为所必须符合的决定性特征。而用博弈论语言表达这些特征，便得出互惠利他主义所必须满足的形式条件。

斯蒂芬斯提出，互惠利他主义的特征有四个。这就是：（1）该行为必须减少某个供体（即提供帮助者）的与某个自私的抉择有关的适合度；（2）受体（即接受帮助者）的适合度相对于非受体必须被提高；（3）该行为的完成必须不依赖于某个直接利益的接受；（4）条件（1）、（2）和（3）必须适用于参与互惠帮助的两个个体。这里，条件（1）和（2）是使该行为互惠的条件。条件（3）把互惠利他主义与互助主义区别开来，因为在互助主义中只有受体同步提供某个回报利益，供体才采取行动。条件（4）使利他主义互惠。这四个特征分开是互惠利他主义的必要条件，合起来是互惠利他主义的充分条件。但是，仅有这4个条件还不够，互惠利他主义要能够进化，还必须有进一步的条件限制。斯蒂芬斯提出，互惠利他主义进化要满足的必要条件是：（5）必须存在察觉“骗子”的机制；（6）必须存在交换帮助的大量（不定）机会。显然，没有条件（5），非利他主义者就会总是占利他主义者的便宜，这样互惠利他主义就不会进化；有了这个条件，利他主义者就有了惩罚不合作的有机体的办法。没有条件（6），博弈就是单局的，博弈者占主导地位的选择就是背叛；有了这个条件，就保证了博弈的局数不定。

根据互惠利他主义及其进化的上述6个必要非形式条件，分析标准迭演囚徒困境博弈的必要条件，可以发现本文第二节提到的反剥削条件即R＞（t＋S）／2并不是囚徒困境所必要的，而且指令条件即t＞R＞p＞S也不是互惠利他主义所必要的。就是说，可以把标准囚徒困境博弈模型放到互惠利他主义进化模型之一，甚至是囚徒困境模型之一的位置上，而不是互惠利他主义的一般模型的位置上。我们从分析反剥削条件开始。这个条件是为了保证困境的存在，因为对双方合作的奖励比对背叛的诱惑和对傻瓜的欺骗的平均效果好，但是在迭演的情况下如果R≤（t＋S）／2，困境仍然存在。R≤（t＋S）／2意味着一对有机体轮流获得t（诱惑）和S（欺骗）回报的效果不会比轮流获得R（报偿）的效果差，这是一个允许博弈者交替剥削的条件。通俗地说，这次你吃亏下次我吃亏，有时会比两次你我都不吃亏的平均效果还好。因此，去掉反剥削条件，不会削弱合作的基础。实际上，交替剥削成了合作的一种形式。不过，这里的合作不是直接合作而是滞后合作，博弈者允许自己被剥削是为了交换剥削另一个博弈者的机会。当然，交替剥削要达到比双方合作好的效果，还需要一些条件规定4个支付值的相对大小，这就涉及到指令条件的突破。

把互惠利他主义行为的非形式条件形式化，可以得到如下支付矩阵：

附图

这里的值表示只是对博弈者1的适合度支付。显然，非形式条件（1）因为t＞R且p＞S而得到满足。条件（2）因为R＞S且t＞p或者仅仅使t＞p而有效。这些非形式条件，不论单独还是一起，都不必要求指令或反剥削条件。把这些非形式条件具体化，斯蒂芬斯得到包括标准囚徒困境模型在内的5个互惠利他主义模型。定义这些模型的条件分别是（注：斯蒂芬斯没有用缩写字母而是用中性字母表示4个支付值。本文不采用斯蒂芬斯的表示法，仍沿用通行的支付值表示字母。）：模型1：t＞R＞p＞S且R＞（t＋S）／2；模型2：t＞R＞p＞S且R≤（t＋S）／2；模型3：t＞p＞R＞S且p＞（t＋S）／2；模型4：t＞p≥R＞S且p≤（t＋S）／2；模型5：t＞p＞S＞R且p≤（t＋S）／2。模型1就是标准囚徒困境博弈。模型2是经斯蒂芬斯修正了的囚徒困境博弃。其他3个模型是斯蒂芬斯提出的“厨师困境博弈”。

修正的囚徒困境博弈模型和厨师困境博弈模型

在模型1的情况中以及模型2的某些情况中，利他主义表现为同步合作；在所有其他情况下，互惠利他主义表现为滞后合作。一般说来，帮助对于被帮助者甚至对于双方来说都是好事。但是，物极必反，有时过多的帮助反而糟糕。模型3－5刻划的就是这种情况，因为在这3个模型中同步合作的支付值（R）都小于同步背叛的支付值（p）。这就像过多的厨师会搞糟一锅汤一样。所以斯蒂芬斯把这种情况称之为厨师困境博弈。不过，在这种情况下，虽然同步合作不会使博弈者受益，但是非同步合作还是会相互受益的，所以互惠利他主义仍然存在。在3个厨师困境模型中，模型3是不稳定的厨师困境博弈，因为两个博弈者由于同步背叛而做得更好。模型4中R≤p，是强厨师困境博弈。相比较而言，模型5就只能称为弱厨师困境博弈了。修正的囚徒困境博弈和强弱厨师困境博弈即模型2、4和5，表示的就是滞后合作可能稳定的各种互惠利他主义。这3个模型可以用来分析和解释一些实际的观察结果。

帕克（C.packer）曾经报导，一种雄性橄榄色狒狒［即猎神狒狒（papioanubis）］形成联盟的行为满足互惠利他主义的判据。[19]一只雄狒狒为了与一只雌狒狒交配，在与竞争的狒狒的争斗中常常请求另一只雄狒狒的帮助。而被请求的雄狒狒则可以作出帮助与否的选择。在请求者（一只雄狒狒）接近雌狒狒的同时，被请求者（另一只雄狒狒）给予帮助不但自己不获利而且还使自己处于冒险状态。显然，这里的互惠帮助是非同步的，因为在一次帮助中只有一只狒狒得到报偿，另一只狒狒仅仅花费帮助代价。可以把单局博弈扩展为单迭演博弈，即以第一个博弈者的行动作为开始，以第二个博弈者的行动作为结束。于是，有机体甲在第一局博弈中帮助有机体乙而乙在第二局中帮助甲，就可以当作一次迭演来处理为二者都合作了。余类推。但是，用哪一种模型描述这种帮助较恰当，则取决于经验细节。如果在单迭演博弈中，提供帮助的雄狒狒冒的风险不大，即R＞（t＋S）／2为真，那么就要用标准模型来描述。但是，如果提供帮助的雄狒狒冒的风险大到R＜（t＋S）／2的程度，标准模型就无能为力，而要用修正的囚徒困境博弈模型了。

魑蝠以吸食其他动物的血为生，如果连续两夜吃不到血就会饿死。但是并非每只魑蝠每夜都能吸到血，没有从其他动物身上吸到血的魑蝠需要从有血的魑蝠那里得到血。威尔金森（GeraldS.wilkinson）在哥斯达黎加观察了野魑蝠的血液反哺行为。[20]一只魑蝠把血吐给其他正在挨饿的魑蝠是为另一只魑蝠的适应利益而牺牲自己的适应（在短期内）来分享血液的一种形式。血液的吐出与馈赠甚至发生在非亲属之间，而且，魑蝠不继续向那些不报答的个体馈赠血液。可见，这是互惠利他主义行为，斯蒂芬斯考虑到给出和接受血液视拥有和需要血液而定，同时考虑到健康获益与血液获益并非以线性方式相关，以致把一定量的血送给一只正在挨饿的魑蝠比送给一只有丰富血液的魑蝠更值得，由此给同步合作和同步背叛两种结果指定了相同的值。[18]由于p＝R，这个博弈就是一种强厨师困境。

斯蒂芬斯设想了一种情况。这种情况就是，一对有性繁殖的有机体配偶中的每个成员要么觅食，要么留在家里保护幼仔免遭捕食。觅食显然是合作行为。看家由于不必消耗能量采集食物或者冒捕食风险，可以看成非合作行为。假设成年有机体容易把该肉食者吓跑，而幼仔则不是该肉食者的对手。如果双亲都同时觅食，幼仔就处于被某个肉食动物捕食的危险之中，结果同步合作比一个有机体觅食而其配偶看家实际上要糟。最好的结果是一个有机体看家而其配偶去觅食；次好的结果是二者都看家；第三好的结果是该有机体去觅食其配偶看家；而对该有机体来说最糟的结果是二者都去觅食，留下不设防肉食者的巢。就是说，支付值的相对大小是t＞p＞S＞R。这就是弱厨师困境博弈的情况。

斯蒂芬斯还经过定量计算，比较了互惠利他主义的标准稳定动力学与他的新模型稳定动力学，限于篇幅，这里对此不作分析。但是，我们已经可以看出，他的工作为打破标准迭演囚徒困境博弈在互惠利他主义模型中一统天下的局面奠定了基础，为寻找各种新的模型提供了启示。

博弈论模型的形而上学预设

互惠利他主义的研究能够成为异常活跃的领域，得益于博弈论工具。但是，博弈论作为数学的一个分支，它本身并不直接提供对于实际问题的分析和解答。数学模型是数学工具与实际问题的结合。一般说来，数学模型具有3个特征：实际问题的数学表述、理想模型的概念基础、实际问题与数学结构的对应。[21]在互惠利他主义的建模过程中，有机体之间的关系被表述为非零和博弈，有机体被理想化为只有适合度的博弈者，而适合度的获益与博弈者的支付一一对应。由于非零和博弈与利他问题的联系，博弈论中的一些前提在这里发生了变化，于是互惠利他主义的博弈论模型就有了独特的形而上学预设。这种预设的基本点就是有机体的行为理性。

行为理性不同于国内学术界近年来讨论较为热烈的所谓工具理性和价值理性，因为工具理性与价值理性与博弈论中所说的理性基本上没有多少相悖之处。它们的唯一主体都是有意识的人或人的集团。博弈论中的博弈者是有意识的局中人，是有利害关系的对局者，是唯一只关心自己的支付的理性主体。但是，在互惠利他主义的博弈论模型中，这两个特性已经大大弱化甚至消失，因为这些模型并不需要有机体有主观动机，只需要它们有行为。譬如，细菌并没有大脑，但是它们对其化学环境却高度敏感。当然，我们在前面的讨论中曾经强调，在单局性博弈中，虽然博弈双方都合作比它们都背叛的结果要好，但占优势的选择仍然是背叛。要保证合作能够进化，必须保证这种博弈是迭演的，而且局数不定。这似乎就对有机体提出了两个要求：第一，这些有机体必须具有相互识别的能力，以保证它们下次相遇时不至于搞错对象，张冠李戴；第二，它们必须能够记住以往的博弈史，以保证它们不上骗子的当，同时对施惠者给以回报。其实，这两个要求并不是必须的，更不必要求有机体一定得有意识。人和某些动物固然具有辨识其他个体和记忆过往史的本领。但是，不具有这两种能力的有机体也可以通过某种机制来保证与其相互作用的是同一个个体。譬如，不同生物象巨蟹和海葵的互惠共生现象，就是实现这种机制的形式之一。再如，象雄性领地鸟在其稳定的领地中与其搭挡的高概率作用，也是这种机制的一种形式。这里，参与合作或背叛的有机体有行为而可以无意识。对于有机体来说，适合度支付是唯一有价值的东西。就是说，这里的理性，是生存意义上的。理性的博弈者理性的行为，一切都围绕适合度支付展开。不论是合作还是背叛，为了获得适应利益，不择手段。这些模型不考虑动机、友谊、忠诚、品质、良心等等。博弈者只顾自己的所得，不管其对手的所失。当然，博弈者的对手也是理性的，也只按自己的适合度利益采取行动。每个博弈者所碰到的都是一个手段不分上下的对手。

在行为理性预设的基础上，互惠利他主义的博弈论模型就有了一些必须的基本假定。譬如，博弈者在生存博弈中实施威胁或作出许诺没有任何意义，所以它们可以采取任何策略，当然面对的也是有可能采取各种策略的对手。全背叛、全合作、一报还一报，两报还一报、合作－背叛交替、赢－停与输－转等等，各种策略都会支配有机体的行为。再如，不存在元对策的假定。这个假定排除了确定对手在博弈中采取某种策略的可能性，也排除了从对手与其他博弈者的博弈中形成的信誉来确定自己的策略选择的可能性。因此，有机体可能利用的唯一信息就是与同一个对手相互作用的历史。其他一些假定，如不能中途退出对局、不能消灭对手、不能改变自己和对手的支付值等等，也都与行为理性预设有关。

行为理性预设当然冲击了我们通常的理性概念，这是需要认真研究的。不过，我们在这里要强调的是，这个预设在互惠性的研究中显示出方法论优势。我们知道，关于有机体合作的问题，早就有人注意到。无政府主义者克鲁泡特金曾经提出过互助论，主张生物进化的动力是合作。但是，除了对于合作作用的过分强调之外，他关于合作本身的描述和解释也很模糊。借助于博弈论，互惠性的描述与解释变得精确起来。在博弈论模型中，只考虑行为不考虑动机，这就突出了其中的本质性问题，并且使之得到简化，为有效地利用演绎方法提供了可能性。而演绎出的蕴涵，避免了特设性假说，因此是完全具有可检验性的。这种模型与计算机手段结合起来，设计出不同的策略的竞争[9]以及对策略竞争的生态学模拟[22]，便是一种间接检验。而人们对多种动物合作和背叛行为的实验室观察和野外观察，则可以确证或否证相关模型。由于这种优势，互惠利他主义的博弈论建模工作才呈现出目前高手云集、成果迭出的局面。及时把握这个领域的进展，无疑会发掘出新的哲学问题，大大开阔我们的哲学视野，丰富哲学研究内容。

参考文献

[1]　达尔文著，周建人、叶笃庄、方宗熙译，叶笃庄修订，《物种起源》，北京：商务印书馆，1995年，第145页。

[2]　Hamilton，w.H.，"the　Genetical　evolution　of　SocialBehaviour"，JournaloftheoreticalBiology，Vol.7(1964)，no.1，pp.1-52.

[3]

Dawkins，Richard，　the　Selfish　Gene，　2nd　ed，oxford/new/York:oxfordUniversitypress，1989.

[4]　trivers，Robert　L.，"the　evolution　of　Reciprocalaltruism"，theQuarterlyReviewofBiology，Vol.46(1971)，no.1，pp.35-57.

[5]　poundstone，w.，theprisoner'sDilemma，　new　York:Doubleday，1992.

[6]　Smale，S.，"the　prisoner's　Dilemma　and　DynamicalSystemsassociatedtononcooperativeGames"，econometrica，Vol.48(1980)，pp.1617－34.

[7]　trivers，Robert，L.，"the　evolution　of　Reciprocalaltruism"，theQuarterlyReviewofBiology，Vol.46(1971)，no.1，pp.53-57.

[8]　axelrod，Robert，　and　Hamilton，　william　D.，"theevolutionofCooperation"，Science，Vol.211(1981)，no.4489，pp.1390-96.

[9]　axelrod，Robert，"effectiveChoiceinthe　prisoner'sDilemma"，JournalofConflictResolution，Vol.24(1980)，pp.3-25;"moreeffectiveChoiceintheprisoner's　Dilemma"，　JournalofConflictResolution，Vol.24(1980)，pp.379-403.

[10]　axelrod，Robert，theevolutionofCooperation，　newYork:BasicBooks，inc.，1984，pp.55-70.

[11]　Fischer，erica.，"the　Relationship　between　matingSystemandSimultaneousHermaphroditismintheCoralReelFish，Hypoplectrumnigricans(Serranidae)"animalBehavior，Vol.28(1980)，pp.620-33.

[12]　Dugatkin，L.a.，"DoGuppiesplaytitFoR　tat　duringpredator　inspection　Visits?"，

Behavioral　ecology　andSociobiology，Vol.23(1988)，no.6，pp.395-99.

[13]　williams，G.C.，adaptation　and　natural　Selection，princeton:princetonUniversitypress，1966.

[14]　packer，C.，"whateverHappedtoReciprocalaltruism?"，trendsinecologyandevolution，Vol.1(1986)，pp.142-43.

[15]　Boyd，Robert，"istheRepeated　prisoner's　Dilemma　aGoodmodelofreciprocalaltruism?"，ethologyandSociobiology，Vol.9(1988)，no.2-4，pp.211-22.

[16]　nakamaru，m.，matsuda，　H.　and　iwasa，　Y.，"theevolutionofCooperationinaLattice-Structuredpopulation"，JournaloftheoreticalBiology，Vol.184(1997)，no.1，pp.65-81.

[17]　Leimar，olof，"Repeated　Games:a　State　approach"，JournaloftheoreticalBiology，Vol.184(1997)，no.4，pp.471-98.

[18]

Stephens，　Christopher，"modelling　Reciprocalaltruism"，BritishJournalforthephilosophyofScience，　Vol.47(1996)，no.4，pp.533-51.

[19]　packer，C.，"Reciprocalaltruisminpapio　anubis"，nature，Vol.265(1977)，no.5593，pp.441-43.

[20]　wilkinson，Geralds.，"Reciprocal　Food　Sharing　intheVampireBat"，nature，Vol.308(1984)，no.5955，pp.181-84.

[21]　孙小礼，“模型——现代科学的核心方法”，《哲学研究》，1993年第2期，第20—26页。

数学建模博弈论篇10

【关键词】手机出版产业链构建博弈论

经济学中的博弈理论在众多学科中的应用已屡见不鲜。从博弈论的角度看，手机出版产业的发展和变化实质上是利益相关方竞争与合作的结果。在遵循产业规则的前提下，博弈各方运用各种策略以达到自身利益的最大化，从而促进了手机出版市场的成熟和发展。正是在这一认识的指导下，本文着重采用博弈论的相关理论对手机出版产业链中参与的各方进行博弈分析，并尝试提出一条较为合理并能最终实现共赢的产业链模型。

一、我国手机出版产业现状

近几年手机已由早期的移动通讯工具逐渐演变成一种多媒体通讯工具。语音通话、文字短信及多媒体彩信、无线上网娱乐、收发电子邮件、听音乐、玩游戏、看电影、拍照等功能都给手机出版产业提供了发展平台。

当今学界尚未对手机出版做出一个明确的定义，但较多学者认为手机出版是指“以通信网络和互联网作为信息的传播途径，将著作、图画、声频、视频、符号等多种媒体形式的内容数字化，以无线数据传输技术发送到手机移动用户终端,供公众浏览、阅读、使用的实时传播行为。①”手机出版由于其自身具有受众范围广、传播速度快、互动性强等特点越来越受到出版界的重视，手机出版的产业链构建也日益成为业界讨论的热点话题。

二、理论构架

博弈论又被称为对策论，是研究具有斗争或竞争性质现象的理论和方法，它既是现代数学的一个新分支，也是运筹学的一个重要学科。②任何一种博弈都包括三个基本要素：博弈方、得益和策略。每一种博弈包括两个或两个以上博弈方，不同的博弈方采用不同的策略，最终获得不同程度的得益。博弈通常分为无限博弈和有限博弈、合作博弈和非合作博弈，非合作博弈又包括动态博弈和静态博弈、零和博弈和非零和博弈、完全信息博弈和不完全信息博弈等。

三、手机出版产业链五环节

1、移动运营商。我国三大移动运营商为中国移动，中国联通，中国电信。笔者认为，手机出版产业发展潜力巨大，运营商在产业链上占据有利位置，其可以通过版权保护切入手机出版业务，通过优质服务增强对读者的吸引力，通过内容开发增强对作者的吸引力，从而增强在产业链上的影响力，整合手机阅读产业链。

2、内容服务提供商。“从产业链来讲，手机媒体有一个很大的链条还没做起来，尤其在内容服务提供商这方面。如果他们真正做起来了，对整个产业链发展是非常有意义的，目前他们提供给用户的内容体验不够丰富。”中国人民大学新闻学院教授匡文波表示，要让3G从单纯的技术演变成市场价值，被广大用户接受，关键需要解决内容服务提供商和移动运营商之间的利益分成矛盾。笔者认为最理想的利益分配方式是渠道运营商、内容提供商和技术提供商之间三三分成，这样能够保证每一方的积极性。内容提供商是产业链上重要的一环，应该坚持给内容提供商合理的分成，只有这样才能长久维持手机出版的价值链，否则对任何参与方都不公平。

3、终端设备制造商。伴随android系统手机和iphone手机的销量提升，终端设备制造商为抢占新系统平台用户，在不同手机系统均推出手机阅读客户端，同时智能手机销量的提升也促使用户转变成为手机阅读的最终用户。因此，终端设备制造商已经为手机出版产业的井喷式发展做好了充足的准备。

4、技术提供商和服务提供商。手机出版产业链中的网络服务提供商和技术提供商代替了传统出版中的实体书店和印刷厂，尽管国内整个手机出版行业的盈利模式尚未清晰，但并不意味着该产业需要技术提供商参与到内容资源的建设中来。反之，那样很容易导致技术提供商与传统出版单位的立场对立。因此，技术提供商应坚持数字出版技术的角色定位与报业集团、出版社等内容提供商建立合作关系，坚持走电子报纸和电子图书的开发制作路线。与此同时，其还应与终端设备制造商合作，推出基于各类智能手机系统的阅读终端软件，同时开发出非智能手机的相关应用产品，成为进入手机出版领域的技术保障方。

5、最终用户。据易观智库最新数据显示，2010年第4季度中国手机阅读市场用户数达2.33亿，环比增长7.03%，相比于2009年第4季度，同比增长幅度达44.60%。③庞大的受众群体为手机出版产业的发展提供了坚实基础。

四、手机出版产业链构建中的博弈分析

1、移动运营商与终端设备制造商之间的合作博弈。合作博弈是指博弈双方的利益都有所增加，或者至少是一方的利益增加，而另一方的利益不受损害，因而整个社会的利益有所增加。从通信行业来说，移动运营商和终端设备制造商是相互依存的，但移动运营商一般更具有优势，就好像中国联通规定夏普等手机生产商制造的部分手机打上联通的品牌一样。终端设备制造商在手机上预置移动运营商增值服务相关软件，如彩信群发软件、彩铃下载软件、电子书阅读软件、动漫阅读器等，一方面为最终用户提供了便利的增值服务，另一方面也为相关移动运营商带来了相对固定的受众群，这种合作博弈的方式可以同时为终端设备制造商和移动运营商带来可观的经济利润。

2、服务提供商之间以及与最终用户的完全信息博弈。手机出版产业中的服务提供商指无线网络中内容及应用服务的直接提供者。目前国内的服务提供商主要分为三大类：提供短信服务的门户型服务提供商，主要包括网易、中华网等门户型网站；以腾讯公司为代表的专项型服务提供商；以短信作为主要业务的专业型服务提供商。由于服务提供商面向的服务对象主要是终端用户，所以他们彼此之间就形成了一种完全信息博弈关系。完全信息博弈二者之间处于相互合作相互制约的竞争关系。服务提供商不能脱离最终用户独自闭门造车，而应根据最终用户的反馈实时调整自己的具体业务和服务内容，从而满足广大最终用户的需求。

除此之外，各类服务提供商之间也存在博弈。要想在手机出版产业分到一杯羹，他们彼此之间就要形成一种共赢的竞争模式。形成这种模式的关键在于彼此业务的差异化经营。门户型服务提供商由网站提供的短信服务，内容主要包括文字、新闻、铃声、图片、游戏等，这些需要不断补充素材的服务是门户型服务提供商的特长；专项型服务提供商的代表是腾讯公司，和其他的短信服务商不同，腾讯没有常见的铃声、图片、游戏等业务，只专注于具有垄断优势的QQ衍生短信服务。专业型服务提供商则应把主要盈利点放在不断创新的技术和创意上。细分市场，针对自身的不同优势，制定适合自身的业务模块和发展方向，只有在这种合作化的博弈模式下，才能实现共赢，催进整个手机出版产业的繁荣。

3、内容提供商和移动运营商之间的非零和博弈。在手机出版产业目前的产业链中，移动运营商和内容提供商之间的博弈一直是重头戏。目前移动运营商已经开始涉及手机出版产业的内容制造，但多局限于彩铃、短信、手机报等领域。而传统的内容提供商却因为对此产业的不熟悉而采取观望态度。传统出版社等内容提供商与移动运营商相比无论是在市场走势还是受众需求方面都掌握着更准确的市场动态，所以传统内容提供商在手机出版产业中如何立足是手机出版产业链构建的关键所在。

非零和博弈是一种非合作下的博弈，博弈中各方的收益或损失的总和不是零值。在这种状况下，博弈一方的所得并不与博弈另一方的所失大小相等，即使伤害他人也可能“损人不利己”，所以博弈双方存在“双赢”的可能，进而合作。在手机出版产业中，传统出版社拥有版权和编辑权，主动将核心资源信息化，以合理的价格提供给运营商。此外，运营商通过了解终端用户的需求，从而整合出版社的内容资源，并且进行加工处理，最终以合理的形式传递给终端用户。在这种非零和博弈模式下，双方对出版资源进行重组，各取所需，从而实现双赢。

4、最终用户与内容提供商和移动运营商之间的动态博弈。动态博弈是指参与方的行动有先后顺序，而且后者可以观察到前者的选择，并据此做出相应的选择。

内容提供商借助移动运营商提供的手机出版平台把自己的部分图书书目及内容发送给最终用户，而最终用户根据自己对图书内容的喜好程度给出相应的互动反馈。随后移动运营商将整合后的回馈统一反馈给内容提供商。最终，内容提供商根据得到的反馈数据调整自己的出版战略。在这种动态的博弈模式下，内容提供商可以有效地减少流通周期，节约流通成本，降低库存压力，移动运营商也可以在相对有限的出版平台上得到利润的最大化，而最终用户也可以订制适合自己的手机出版物。

四、我国手机出版产业链的理想模式

我国目前的手机出版产业链仅仅包括三个环节：移动运营商、内容提供商和终端设备制造商。移动运营商在提供网络的同时，完全承担了移动支付功能，并且有意独立完成服务和内容的提供。而本应由技术和平台提供商从事的阅读平台设计工作却由终端设备制造商完成。可见，目前我国手机出版产业链的构建是不合理的。

产业链环节的缺失导致了某些博弈方跨界操作。移动运营商占据了主导地位，成为手机出版产业的幕后决策者和内容把关人，并且强制性地从最终用户向内容提供商支付的费用中抽取高份额的手续费。由于缺少专业的技术提供商，导致终端设备制造商各自开发的平台之间不兼容，用户们则需要安装不同版本的阅读器，使用起来极不方便。除此之外，不同的图片和排版在不同的终端设备上显示也不相同，这些都制约了我国手机出版产业的发展。

因此，构建我国成熟合理的手机出版产业链，首先就要打破移动运营商的霸主地位，促使各个环节良性、均衡的发展。移动运营商应该根据最终用户的实际需要来提供服务。同时，建立专业的技术和网络服务提供商，开发适合各种手机的阅读器，补全产业链中缺失的环节。专业的内容提供商，尤其是传统出版单位更要积极地参与到手机出版产业中来，提供高水准的手机出版物，降低出版物的同质化概率。除此之外，实现第三方监管也必不可少。

只有手机出版产业中的博弈各方全部参与其中的产业链才是合理成熟的产业链。技术提供方提供传播渠道，内容提供商负责内容和版权，移动运营则致力于相关内容的转换与整合，第三方监管从全局的角度保障手机出版产业的健康运营。只有做到产业链中的博弈各方相互协作，各司其职，才能催进手机出版这个潜力巨大的市场繁荣、稳定，从而最终实现产业链弈各方的共赢。

参考文献

①莫林虎、王一，《手机出版产业现状及运营模式的比较分析》[J].《出版发行研究》,2009（5）

②吴学秋，《在“博弈”中“协同”发展》[oL].

③易观智库，《2010年第4季度中国手机阅读用户调研》[oL].

数学建模博弈论十篇

数学建模博弈论篇1

数学建模博弈论篇2

数学建模博弈论篇3

数学建模博弈论篇4

数学建模博弈论篇5

数学建模博弈论篇6

数学建模博弈论篇7

数学建模博弈论篇8

数学建模博弈论篇9

数学建模博弈论篇10

相关作文

小学作文

初中作文

高中作文

作文体裁