标准式博弈的混合战略十篇

发布时间：2024-04-29 16:19:03

标准式博弈的混合战略篇1

摘要：“治乱世用重典”可能存在一个可以令人接受的感性认识：既然轻刑无济于事，那就只好用重刑；用轻刑不能抑制犯罪时，用更轻的刑罚更不可能抑制犯罪。本文通过构建博弈模型来分析犯罪率，指出如果犯罪率达到一个均衡点，更重的刑罚不会更多的减少犯罪的发生，这时司法机关如能从查处犯罪中获得更多的利益或者能够减少查处成本，将对犯罪有一定的抑制作用。

关键词：博弈论；混合战略纳什均衡；犯罪率

引言：意大利著名学者恩里科·菲利曾提出著名的“犯罪饱和法则”，他指出：“就像我们发现一定数量的水在一定的温度之下就溶解为一定数量的化学物质但并非原子的增减一样，在一定的自然和社会环境之下，我们会发现一定数量的犯罪。”[1]

美国学者波斯纳认为：“一个人参与犯罪的原因是犯罪这一活动（或职业）能为行为人提供比其他任何可选择的合法职业更大量的净收益。”[2]

一、引入博弈论

犯罪是行为。从犯罪的形式概念上说，犯罪是符合犯罪构成要件、具有刑事违法性、应受刑罚处罚的行为。从实质意义上说，犯罪是具有社会危害性的行为。无论从形式特征还是实质意义角度来描述，犯罪概念的基础首先是行为。古典学派强调行为本身的现实意义，认为行为是直观的现实存在；近代学派认为客观行为本身不具有意义，行为只是行为者人格的征表。然而确立犯罪概念是以行为的观念为核心，这点毫无疑义。

关于人们行为的规律，不同的社会科学从不同的角度进行了广泛的研究，在这其中经济科学的研究成果最为显著。即使有如此众多的对人们行为规律的社会科学研究成果，也都不能各自完成对行为规律的整体把握，对于行为规律的理解仍是不完整的、零散的。但是，作为对人们行为规律系统研究的博弈理论的形成和发展正使这一局面得到极大改观。不仅如此，源自于数学的博弈理论“没有政治、道德的含义，它不作道德上的劝告，在伦理上是中性的”。[3]

二、建构博弈模型

“因为有犯罪并为了没有犯罪而科处刑罚”。[4]我国刑罚的目的是预防犯罪，预防犯罪的目的又分为一般预防和特殊预防。一般预防不是预防犯罪人，而是通过对犯罪人科处刑罚来对尚未犯罪的社会成员起到警戒与抑制作用，预防其实施犯罪。特殊预防是通过对罪行极其严重的犯罪人适用死刑、对其他犯罪人适用其他刑罚，或者剥夺其重新犯罪的能力，或者使其不敢不愿再犯罪来预防犯罪人重新犯罪。[5]因此，司法机关对于犯罪人科处刑罚是影响犯罪率的一个至关重要的因素。

现在通过使用一个传统的博弈理论模型——标准形式博弈来模型化潜在犯罪人与司法机关之间的相互作用，反映犯罪率是怎样受到影响发生变化的。标准形式博弈包括三个元素：1.博弈的参与人；2.参与人可能的战略；3.每一可能战略组合下参与人的收益。

在这里只有两个参与人：潜在犯罪人和司法机关。每个参与人可能选择的战略称为战略空间。潜在犯罪人和司法机关可能的行动范围是宽泛的，但在此模型中，每个参与人只有两个选择——犯罪和不犯罪，查处和不查处[注：此处的查处不仅指犯罪后被科处刑罚的查处，还包括犯罪前的预防查处]。标准形式博弈的最后一个元素是收益结构。在此构造的模型中，潜在犯罪人选择实施犯罪而司法机关查处了，潜在犯罪人将受到刑罚（此模型中刑罚为常量）获得-10个收益，司法机关因查处犯罪获得4个收益；潜在犯罪人选择实施犯罪而司法机关不查处，潜在犯罪人将因实施犯罪获得4个收益，司法机关获得0个收益；潜在犯罪人不实施犯罪而司法机关查处，潜在犯罪人获得0个收益，司法机关获得2个收益；潜在犯罪人不实施犯罪而司法机关不查处，潜在犯罪人获得0个收益，司法机关获得4个收益。

这样已经建构了一个标准形式博弈来反映潜在犯罪人和司法机关之间的相互作用。在模型化这种相互作用时，还要考虑参与人拥有哪些信息。在潜在犯罪人和司法机关的博弈中，博弈双方都既知道自己的收益，也知道对方的收益，同时还知道可供自己选择的战略以及可供对方选择的战略。但是对方具体选择了哪一种战略，是双方都不知道的。这是一个具有完全信息但不完美信息的博弈。

用一个二元矩阵（每一格有两个数字称为二元矩阵，通常的矩阵中每一格只有一个数字）来表示涉及两个参与人的标准形式博弈，二元矩阵的每一格给出了相应战略搭配下每个参与人的收益情况。在图中，假定潜在犯罪人是行位置的参与人，司法机关是列位置的参与人，每格中的第一个收益是潜在犯罪人的，第二个收益是司法机关的。

三、求解犯罪率

以上已将反映犯罪率和刑罚关系的潜在犯罪人与司法机关之间的相互作用归结为一个标准形式的博弈，接下来要求解这个博弈。先确认参与人可能选取的战略，然后预测博弈可能的过程。博弈是利用解的概念来求解的，解即为关于理性参与人将如何选择战略以及给定参与人的目标这些战略具备什么样的特征等。求解博弈即为确认参与人将选取哪一个战略的过程。

在这里需要对参与人如何决策做出一个基础性假定：参与人理性是指相对于更低收益的结果，参与人总是更偏好于更高收益的结果。有了这样一个参与人理性的假定，就可以来确认潜在犯罪人和司法机关可能选取的战略了。在这个博弈中，潜在犯罪人选择实施犯罪将获得-10或4个收益，这取决于犯罪是否被查处；不犯罪获得0个收益；司法机关选择查处犯罪将获得4或2个收益，不查处获得0或4个收益，这取决于潜在犯罪人是否犯罪。

在这个模型中，无论是潜在犯罪人还是司法机关都没有一个不论对方选取什么战略对于自己来说都是最好战略的占优战略。另一个求解博弈的方法得到的解被称为纳什均衡，它是基于下列原理：在参与人将选择的战略组合中，每个参与人选择的战略都是对对方所选战略的最优反应；在给定对方战略选择的情况下，没有参与人能通过选择其他战略而使状况变得更好。一个纯战略均衡是一个纳什均衡，其中均衡状态下的战略是确定地运用的或者是以1的概率运用的。当纳什均衡只包括确定地运用战略时，这时就有一个纯战略均衡。除纯战略均衡之外还有一种称为混合战略均衡，其中均衡状态中每个参与人随机地在许多纯战略中选取一个战略。由于无法确定哪个潜在犯罪人会真的实施犯罪，也不能让司法机关做到只查处犯罪不查处未犯罪，所以两参与人将选择混合战略。

那么如何找到该模型的混合战略纳什均衡？只有当参与人选择任何一个纯战略都没有区别时他才会在两个纯战略中随机地选取。当潜在犯罪人选择实施犯罪的收益超过不犯罪的收益时，潜在犯罪人将选取犯罪的纯战略；而当不犯罪的收益超过犯罪的收益时，潜在犯罪人就选取不犯罪的纯。战略。因此，只有当从两个纯战略中获得的收益相等时潜在犯罪人才愿意选取混合战略。司法机关同理。

回到矩阵图可发现，除非潜在犯罪人不犯罪，否则司法机关选择查处就更好；除非司法机关查处，否则潜在犯罪人选择犯罪收益更高。用p来表示选择犯罪的犯罪人占潜在犯罪人的比例即犯罪率，相应地不犯罪的人数占1-p。用Q来表示司法机关查处的概率，则不查处的概率为1-Q。

对于潜在犯罪人的犯罪率为p不犯罪的为1-p，则司法机关从查处犯罪中获得的收益为4p加上2（1-p），这一数量可能大于或小于司法机关从不查处犯罪中获得的收益，这取决于p的数值。

只有司法机关从犯罪中获得的期望收益与不查处犯罪获得的收益相等时，司法机关才会任意选择查处或不查处的战略。司法机关从不查处犯罪中获得的期望收益为0p加上4（1-p）。二者收益相等，求得p的值是1/3。当1/3的潜在犯罪人选择实施犯罪的混合战略，司法机关在查处犯罪和不查处犯罪之间就是无差异的；给定潜在犯罪人的混合战略，司法机关采取的任何战略包括混合战略都是一个最优反应。

对于司法机关以概率Q查处或1-Q不查处，则潜在犯罪人从犯罪中获得的期望收益为-10Q加上4（1-Q），从不犯罪中获得的期望收益为0Q加上0（1-Q）。同理，当潜在犯罪人从实施犯罪和不犯罪获得的期望收益相等时，潜在犯罪人才会选择任意战略，这时求得Q的值是2/7。

四、分析犯罪率的变化

（一）加重刑罚或提高犯罪成本

在原博弈中，潜在犯罪人因实施犯罪被查处受到刑罚获得的收益为-10，现在将刑罚加倍即-20。加重刑罚的目的是为了减少犯罪的发生，这样的目的是否能达到？

用二元矩阵图来表示刑罚加倍后的博弈，如下图：

用p*来表示犯罪率，不犯罪的为1-p*，则司法机关从查处犯罪中获得的收益为4p*加上2（1-p*），从不查处犯罪中获得的期望收益为0p*加上4（1-p*）。二者收益相等，求得p*的值是1/3，与刑罚加倍前的犯罪率相同。

观察二元矩阵图可得出，行位置的潜在犯罪人的犯罪率与列位置的司法机关的收益相关。因此，无论是用加重刑罚还是提高犯罪成本来减少犯罪收益的方法对犯罪率都没有影响。

（二）提高查处收益或减少查处成本

既然犯罪率与司法机关的收益相关，可以通过降低查处成本或者提高查处犯罪获得的收益来降低犯罪率。

如将提高查处犯罪获得的收益至5，此时求得的犯罪率为2/7，比原犯罪率1/3小。

假设降低1个查处成本，则原查处收益从2增加为3，求出犯罪率为1/5，也比原犯罪率小。

五、小结

博弈具有相同的参与人和相同可供选择的战略时，通过改变参与人的收益情况可以改变战略均衡解。例如，为了减少司法机关的工作量，可以加重刑罚（刑罚加倍后的博弈中，求得的司法机关查处概率为1/6，相较于刑罚加倍前的2/7小）。当然，将结论运用到现实中，还必须考虑到现代刑法精神，不能为了降低查处成本减小犯罪率，就再来个“连坐”制度。

就像所有的模型一样，博弈理论研究从给定社会状态的简化入手并通过舍弃与所研究问题无关或关联度不太高的许多细节而进一步深入。尽管对于模型做了很多假设条件，这可能导致与现实情况有所出入，但运用博弈理论来分析问题仍然是大有裨益的。

参考文献：

[1][意]恩里科·菲利.犯罪社会学[m].郭建安译.北京：中国人民公安大学出版社，2004.1

[2][美]理查德·a·波斯纳.法律的经济分析[m].蒋兆康译.北京：中国大百科全书出版社，1997.3

[3]姚海鑫.经济政策的博弈论分析[m].北京：经济管理出版社.2001.1

[4]张明楷.刑法格言的展开[m].北京：法律出版社，1999.1

标准式博弈的混合战略篇2

[关键词]雷达；抗干扰能力；定量表达式；评估计算

中图分类号：tp592.5文献标识码：a文章编号：1009-914X（2017）15-0358-01

雷达组网系统在信息作战中主要是依靠雷达电子防御功能进行战斗运动，而在电子战领域中电子的防御能力评估是重点研究的问题。对雷达抗干扰能力的评估，本文主要是对雷达组网系统中的抗干扰机理进行深入探讨与分析，根据文献对雷达组网系统抗干扰能力的评估，主要是通过博弈论建立矩阵模型，并将其应用到单雷达的反干扰决策中[1]。国外文献中已经明确记载了通过博弈论对战争进程影响程度等相关内容，但国内对雷达组网系统中抗压制干扰能力的评估方法仍比较少，考虑到雷达抗干扰能力主要是与雷达组网系统的配置与布站等诸多因素有关，因此本文建立定量表达式，对雷达抗干扰能力的相关问题进行研究。

一.博弈论基本理论

博弈现象是指具有竞争性或对抗性的活动，而敌对双方为了对信息优势进行争夺而展开的电子干扰与抗干扰则是典型的一种博弈现象。博弈现象本质上需要包括局中人、支付函数与策略集等基本要素信息，一般将其表示为矩阵博弈函数，G={Ⅰ，Ⅱ，S1，S2，a}。而Ⅰ，Ⅱ表示为两个不同的局中人，其中局中人Ⅰ，Ⅱ的策略集分别表示为S1={α1，α2，…，αm}、S2={β1，β2，…，βn}，也是局中人完整的行动方案[2]。相对于零和博弈来说，一般局中人Ⅰ的支付矩阵为a=（aij）m×n，局中人Ⅱ的支付矩阵是-a。局中人会随机选择相应的策略，使对方猜测不透自己的想法和采用的策略，从而获得信息优势。对于矩阵博弈函数，应该对S1设置对应的概率分布，X=（x1，x2，…，xm），（Xi≥0），该函数是局中人Ⅰ的混合策略。同理可得，Y=（y1，y2，…，yn），则是局中人Ⅱ的混合策略，Y是对应于S2的概率分布。

二.建立支付函数模型

（一）单雷达检测度量模型

随着信息化时代的发展，信息技术在我国高技术局部战争中占据着重要的地位，通过信息技术对雷达组网系统的抗干扰能力进行评估，反应出雷达组网系统信息对抗能力[3]。而单雷达检测度量模型，是根据雷达信号的检y理论，当雷达系统输入端只存在高斯噪声，那么输出信号概率密度函数则为

当雷达系统输入端不仅存在高斯噪声，同时还存在信号，那么输出信号的概率密度函数则为：

假设y（t）中无目标回波的情况，用H0表示，而H1则代表有目标回波的情况，根据鉴别信息理论可知，y（t）中倾向于有目标回波情况的平均信息量为：

（二）雷达组网系统检测能力模型

在雷达组网系统中一种基本的数据融合方式则是点迹融合，可以假设单雷达间的目标回波点迹在时间上是统一的，雷达组网系统需要对各个单雷达之间的输出点迹进行融合，根据多传感器的分布式检测理论知识，雷达组网系统检测概率pdo与虚警概率pfo一般表示为：

也就是说，当所有的单雷达都没有检测目标时，那么单雷达检测结果也目标目标，当只有噪声时，雷达组网的虚警概率联合概率密度函数则为：

如输入存在目标则雷达组网系统的检测概率密度函数则为：

根据鉴别信息可加性原理，雷达组网倾向于有目标的平均信息量函数则为：

三.矩阵对策最优解与结果的仿真分析

根据线性规划对雷达组网系统的最优化混合策略进行求解，解得α1=0，α2=0.2，653，α3=0.4159。那么敌对干扰机最优化的混合策略则为L1=0.6528，L2=0.2688，L1=0。矩阵对策博弈值V=0.9282。

在支付博弈的计算过程中发现，单雷达R1会随着天线增益的减小，波束宽度越大，抗干扰的措施较少，在博弈过程中则会受到很大的干扰，因此在博弈中只R1具有牵制作用，使干扰机对米波段造成干扰，降低了其他频段干扰功率与干扰时间[4]。而单雷达R2、R3则会由于波束的宽度较窄，天线增益较大，抗干扰能力较好，对信号的处理方法较为先进，在干扰环境下充当主要的作战装备。根据支付矩阵发现，在不同的干扰位置下，干扰机对雷达的干扰效果不同，如果干扰机采用L1策略，那么干扰机是在敌机进攻正上方位置，R2、R3应在进攻方向两侧，从而形成最大的对敌机交叉探测之势，避免对接收机的干扰；如果干扰机采用L2策略，那么干扰机是在敌机进攻的一侧位置，对另一侧雷达进行干扰，R2、R3应在干扰机同一侧，避开干扰机干扰方向[5]。从干扰机混合策略来看，干扰机主要是在主攻方向区域内进行巡航，对主攻方向两侧进行雷达干扰，如果分别采用L1和L2策略，基本上可以对实例雷达组网进行压制。

四.结语

在我国军事电子信息系统弈论得到广泛的应用，主要是用于对电子信息系统的作战效能进行评估，本文根据鉴别信息理论概念，通过博弈论对雷达组网系统的抗干扰能力进行评估，根据仿真结果发现，此种方法对雷达组网系统的抗干扰能力评估较为适用，其中雷达组网系统的抗干扰能力主要影响因素是单雷达部署与干扰机干扰位置，其他因素本文尚未进行考虑，在策略集的分析中进行探索与研究。

参考文献：

[1]向龙，丁建江，王文松.雷达组网系统抗干扰能力评估原则与准则研究[J].空军雷达学院学报，2010，04：267-270.

标准式博弈的混合战略篇3

摘要本文从博弈论的角度出发，阐述了在网球比赛中如何运用博弈论的混合策略，取得最大的得益。

关键词博弈论网球比赛战术

博弈论，英文为gametheory，是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题。博弈论是一种方法论，它是一种思维方式、技术方法和理论体系，应用的范围不仅包括经济学，而且包括政治、军事、外交、体育等。

一、运用混合策略的依据

在二人零和博弈下，如果参与人a总偏好采用某个特定的纯策略，那他的行动就会被对手准确地估计，从而参与人B可以很容易地选择某个策略来使a的收益最小化。因此参与博弈各方必须给对手造成不确定性，于是采用混合策略，即在各自的策略空间下按特定概率随机地选择某个纯策略。

二、混合策略的样板

策略的随机性是博弈论早期提出的一个深谋远虑的观点。“剪刀、石头、布”这一传统游戏作为形象的样板可以为我们提供混合策略的思路。在这样一个游戏的博弈中，不存在纯策略均衡。对每个孩子来说，出“剪刀”、“石头”还是“布”的策略应当是随机的，不能让对方知道自己的策略，甚至是策略的倾向性。一旦对方知道自己出某个策略的可能性增大，那么在游戏中输的可能性就增大。因此，每个小孩的最优策略是采取每个策略的可能性是1/3。这一解决方案就是混合策略的运用，它反映了个人随机混合自己策略的必要性

三、网球比赛中混合策略的运用

为了具体阐明如何通过混合策略有效突破路径依赖问题，在此我们模拟一场网球比赛加以说明。比赛情形：运动员a占据场上优势在底线调左右调动运动员B。假如运动员B的预计正确，他的正手接回击球有90%的成功率，而反手回击球只有60%的机会获得成功。当然，假如他预测失误，那么回击球质量会明显下降；假如他跑向正手一方，而a击出的球飞向他的反手一方，他能及时转向而成功回球的概率只有20%；反过来，他的成功率只有30%。

调动一方的运动员a的目标是让对方回球成功的概率越低越好；回击者运动员B的目标恰恰相反。我们在此对这一分的争夺中双方各自最佳战术策略分析如下：

a假如a100%击球到对手的正手，回击者B就会预计到球会朝自己的正手而来，从而有90%的概率回球成功。

B假如击球者a100%击球到对手的反手，回击者B也能预计到球会朝自己的反手而来，从而有60%的概率回球成功。

因此，a若想打破B一直正确预判的优势，必须通过击球线路的随机化而使B一直处于猜测中。如果击球者a采取50:50混合策略，B不管猜测向哪一方向跑动，猜测准确的概率都是50%。假如B向反手位移动，猜测准确的时候反手回球成功率是60%；猜错的话，B及时转向而成功回球的概率只有30%。因此，他的整体成功概率是：1/2X60%+1/2X30%=45%。

通过类似的计算可以知道，若是向正手方移动，他的整体成功概率是：l/2X90%+1/2X20%=55%。

在击球者a采取50:50混合策略的前提下，回击者B若是从自己的角度出发，就能选出最佳回应策略。他应该向正手方向移动，这么做，成功回球的概率达到55%。而在a看来，这个成绩与他永远将球击向一方得到的结果相比己经有所改善。对比一下，假如击球者a永远将球击向一方，分别是回击者B的正手方和反手方，那么，回击者B的成功回球概率分别为90%和60%。

另一个显而易见的问题是，击球者a的最佳混合策略是什么?要回答这个问题，我们可将不同的混合策略的结果列成一个图表，如下图所示。击球者a击球向对方正手方向的概率是一条从0到100%的水平线。对于所有这些混合策略，图中有两条线，一条显示回击者B准备向正手方移动的成功回球概率，另一条则显示他准备向反手方移动的成功回球概率。

两条直线交于一点，在这一点上调动着a只有40%的时间将球调向对手正手位。在交点的左边，回击者B若是预计对方会将球发向反手方，那么他的成功回球概率就会提高；而在右边，他若是预计对方会将球击向正手位，成功回球概率也会提高。可见，向正手位和向反手位击球维持在40:60的混合策略，是惟一不会让回击者B用上述方法占到便宜的选择。只有选择这种混合策略，回击者B无论选择正手还是反手，其成功回球概率都是一样的。两种情况都会留给回击者B48%的成功回球概率。击球者a若是采取其他任何一种混合策略，只要回击者纳达尔善加利用，就能使自己的成功回球概率沿着图中的两条直线上升到交点之上，也就是超过48%。因此，“40%的时间将球调向对方的正手”，就是调动者a的最佳策略。

四、结束语

采用混合或者随机策略，并不等于毫无策略的“瞎出”，这里面有很强的策略性。比如，对网球运动员，只是知道采取多管齐下的混合策略时而攻击对方正手，时而攻击对方反手，还远远不够，他还应该知道他应该将40%的时间还是90%的时间用于攻击对方的正手，以及应该怎样根据场上双方的力量的对比做出调整。

参考文献：

[1]李益群,谢亚龙.体育博弈论[m].北京:北京体育大学出版社.2002.

标准式博弈的混合战略篇4

关键词跨国并购中国企业本土联盟博弈纳什均衡

1跨国公司在华并购与中国企业应对策略的博弈

1.1在并购中可应用的经典博弈范例

（1）囚徒困境博弈中，（坦白、坦白）是纳什均衡，而且是——占优均衡，即不论对方如何选择，个人的最优选择是坦白，个人理性和集体理性产生矛盾，参与人的（不坦白、不坦白）帕累托改进无法达到，纳什均衡并不一定是帕累托最优。例如：跨国公司通过并购扩大生产规模；并购中中国企业不合作，也可能陷入两败俱伤的囚徒困境。

（2）在性别战博弈中，有两个纳什均衡和一个混合战略纳什均衡，博弈的最后结果是（足球，音乐）还是（音乐、足球），要看聚点作用、事先廉价磋商或相关均衡等的作用。这种博弈是合作比不合作好的一个典型例子，是在合作的前提下如何对收益进行分配的问题。这里，先动的一方具有先动优势。这种博弈可用于对并购行为的描述：并购是一种合作博弈，双方都要合作，并购后得到的支付都比不并购大。

1.2从纳什均衡的多重性来探讨目标企业的策略行为

非合作博弈理论的根本基础，一是贝叶斯理性问题，另一是纳什均衡的多重性问题。对存在多个纳什均衡的博弈，究竟谁更合理、更可能出现，并无一般的结论。多数情况下，并购双方相互作用的收益恰恰来自合作而非冲突。这里，信息和预期是博弈的关键因素。

并购双方可能使用某些被博弈模型抽象掉的信息来达到一个“聚点均衡”，这些信息源于共同的文化背景、习惯、知识、理解、并购历史、事物特征、权力关系等。要产生“聚点均衡”，参与人要有合作的态度和行为。并购开始前不花多少成本的“廉价磋商”或低成本的“有偿磋商”，可使纳什均衡出现，所以并购双方的前期接触很重要，它有可能导致合作和协调，增加并购双方的得益。并购中，要先考虑风险占优，然后考虑支付占优。“相关均衡”是一种参与人选择战略前协调彼此行动的方法，适于参与人拥有部分共同的利益，需设计一种信号机制，参与人可根据这个信号的出现来选择行动，这就是显示原理。目标企业的被并购策略如“适度均衡”所描述的：对参与人带来较大损失的偏离，参与人会格外小心，偏离的可能性很小；而对参与人带来较小损失的偏离，参与人常因不小心造成偏离，偏离的可能性较大，根据偏离均衡为参与人带来损失的大小，规定偏离的可能性差异并进行排列，如果原均衡对这些偏离仍是稳定的，则是适度均衡。“合同均衡”，描述的是，如果参与人的相关战略满足个人理性，所有参与人在合同上签字是加入合同博弈问题的纳什均衡，但实际上，形成并签订合同是困难的，而且签署合同并不意味着遵守；合同均衡改善了双方的支付，通过合作达到了双赢，但这些均衡不是唯一的，合作仍有多种可能性；如果达不成共识，合作无法实现，解决这类合作均衡选择问题的途径有仲裁和谈判；并购意向书中的锁定条款具有法律效力，并购合同是双方经讨价还价后得到的双方满意的最优纳什均衡。其他还有“进化稳定均衡”、“强均衡”、“防联盟均衡”、“防联盟相关均衡”等。

上面这些概念和分析方法分别适于不同情况和局部问题，但并购双方在纳什均衡多重性的选择方面进行有效合作是解决问题的关键；要得到有效率和稳定的博弈结果，参与人必须进行深入合作。中外双方进行合作博弈才能实现双赢，损人不利己的不稳定均衡往往达不到并购目的。所以，跨国公司与中方目标企业之间的策略有以下几种：

（1）并购双方愿意进行合作，博弈的支付结果是（t，S），显然，t>0且S>0，只有双赢才能达成并购交易。其中，t表示目标企业的支付结果，S表示主并企业的支付结果，支付结果是双方获得的净收益。

（2）主并企业看好目标企业，即使目标企业对抗也坚持要进行并购，目标企业可假意对抗以提高身价，支付结果为（t+t,S-S），但是主并企业由于目标企业的假意阻挠多花费成本或出较高的买价而减少了的收益。显然，目标企业采取假意对抗所获收益要大于进行合作的收益。

（3）主并企业坚持不并购，看不上目标企业，并购行为就不可能发生，博弈的支付结果是（0，0）。

（4）主并企业看好目标企业，即使目标企业对抗时也坚持进行并购，目标企业认为并购对自己不利，并购后自己的净收益<0。即不如自己经营的预期收益，或者有其他机会带来的收益大于反并购成本后的净收益，目标企业可运用一系列反并购措施坚持对抗使主并企业放弃并购。支付结果为（-t1，-S1），其中，t1为目标企业的反并购成本，S1为主并企业的搜寻、调查、谈判等相关费用。由于放弃并购，主并企业这些费用成为沉淀成本。

所以，当主并企业提出并购请求时，目标企业的决策是对自己有利则接受，采取合作态度，或进行假意对抗，以获取更大的好处，这是纳什均衡（假意对抗，并购）；如果目标企业认为对自己不利，采取强硬的反并购措施对抗，使主并企业放弃并购，这是纳什均衡（坚持对抗，放弃）。

主并企业有并购战略，目标企业也有被并购与否的对策，还可制定选择主并企业的标准进行搜寻和筛选，主动要求主并企业并购，以实现股东价值的最大化。目标企业也可能接受并购或假意对抗，利用信息不对称来设置并购陷阱。

2跨国公司在华并购与中国企业本土联盟的博弈

被并购企业对跨国并购的选择除了自身策略外，还可联合其他企业进行对抗，即接受并购，继续在余下的市场进行准完全竞争；不接受并购，结成本土战略联盟抵制。跨国公司也会根据本土企业的上述反应来决定对策。因此形成了二者之间的博弈，双方根据预期而采取不同的行为方式形成了博弈的过程。

（1）开始阶段。以成本（Cost）、收益（Return）作决策依据，现以下标t表示跨国公司（transnationalCorporation），下标n表示本土企业（nativeCampany），m表示跨国公司进行并购（m&a），R表示本土企业的联盟抵制（Resistance）,GR表示本土企业的非联盟抵制（GiveupResistance），跨国公司的选择以eRt（m）表示跨国公司收益期望值，eCR（m）表示跨国公司的进入成本，跨国公司的净收益为：

et=eRt(m)-eCt(m)

eRt(m)>eCt(m)，跨国公司选择并购；eRt(m)≤eCt(m)，跨国公司不选择并购。

本土企业的选择：以eRn（R）表示本土企业进行本土联盟的预期净收益，eRn（GR）表示本土企业不进行本土联盟的预期净收益。eRn（R）>eRn（GR），本土企业选择本土联盟；eRn（R）≤eRn（GR），本土企业不选择本土联盟。

（2）博弈阶段。以eRt（m，R）表示跨国公司预测本土企业联盟后进行并购的预期收益，eCt（m，R）表示相应成本，eRn（R，m）表示本土企业预测跨国公司并购后进行联盟的收益，eRn（GR，m）表示本土企业预测跨国公司并购后放弃联盟的收益。eRt（m，R）>eCt（m，R），跨国公司选择并购；eRt（m，R）≤eCt（m，R），跨国公司不选择并购；eRn（R，m）>eRn（GR，m），本土企业选择联盟；eRn（R，m）≤eRn（GR，m），本土企业不选择联盟。

（3）从准完全竞争到垄断。如果eRt（m，R）≤eCt（m，R），eRn（R，m）≤eRn（GR，m）同时发生，跨国公司不进行跨国并购，本土企业也不选择本土联盟，东道国的市场处于原有的静态均衡，如附表中*1所示。

如果eRt（m，R）>eG（m，R），eRn（R，m）>eRn（GR，m），同时发生，跨国公司选择跨国并购，本土企业也选择本土联盟，东道国市场处于动态调整过程，直到形成新的静态均衡，因此形成寡头垄断。

主并企业与目标企业双方既联合又斗争，存在一种博弈关系，可应用博弈论来解释。博弈分合作博弈与非合作博弈，前者强调集体理性、效率、公正和公平；后者强调个体理性、个体最优决策。双方在达成一定的并购意向后，实际上进行的是讨价还价过程，减少了双方的选择空间，属于合作博弈范畴。

合作博弈是一种明确纳入谈判过程和执行合作协议的强制过程的特殊情形的非合作博弈；如何在联盟内分配支付，是合作博弈的研究内容，合作、双赢、多赢是理想的结局。合作博弈是博弈的发展趋势，能满足个人理性约束（iR）及激励相容约束（iC）。并购要解决逆向选择问题，目标企业相当于方，主并企业相当于委托方。

纳什均衡是现代博弈论的核心内容。纳什证明了每个有限战略型博弈至少存在一个纯战略或混合战略的纳什均衡；威尔逊证明了奇数定理，几乎所有有限博弈都有奇数个纳什均衡。在给定对方的战略时，每个参与者的战略都最好，此时没人愿意改变战略，是一种“不后悔”均衡、理性预期均衡和只有达到了纳什均衡，并购双立的合作才稳定；否则，并购中存在毁约或失败。

参考文献

1布瑞德福特,康纳尔.张志强,王春香译.公司价值评估——有效评估与决策的工具[m].北京：华夏出版社，2001

2肯尼迪，w·克拉克森，罗杰·勒鲁瓦·米勒.华东化工学院经济发展研究所译.产业组织:理论、证据和公共政策[m].上海：上海三联书店出版,1995

3维高.兼并，资本运营核心论[m].北京：中国物资出版社，1997

4马宏涛.中国并购市场前景透析[n].21世纪经济报道，2003-12-22

5周煊,程立茹.跨国公司价值网络形成机理研究[J].经济管理，2004(11)

标准式博弈的混合战略篇5

关键词：纳税遵从；税收管理；博弈

一、引言

纳税遵从，是指纳税人遵照税法及税收政策，向国家正确计算缴纳应缴纳的各项税收，并服从税务部门及税务执法人员符合法律规范的管理行为。纳税遵从反映了税收征管的质量和效率，是税收征管的最终目标。税收管理与纳税遵从是税收征管最本质、最核心的两大因素，在税收征管现代化的进程中，由于征纳双方各自利益最大化的差异性，再加上双方信息不对称等因素的长期客观存在，纳税遵从与税收管理两者博弈是一个永恒的话题。经济决定税源，但税源不等于税收，在税源一定、税法不变的前提下，税源转化为税收的多少主要取决于征管能力和水平的高低，而税收征管水平和纳税主体遵从程度是紧密联系的。

二、纳税遵从与税收管理博弈分析

在传统的纳税遵从经济学分析中，逃税问题通常被视为一种资产组合选择：申报的收入被看作是一种零回报的安全性资产，而隐瞒的收入则被看作是一种有回报的风险性资产。假定纳税人和税务机关的目标都是追求预期收益的最大化，纳税人所选择的遵从形式是向税务机关如实申报应税收入，所选择的不遵从形式是故意低报应税收入。故意低报收入被查获后不仅要补税，而且要受到处罚。为了便于分析，还假定税收管理便捷、高效，因而纳税人的遵从成本很小，可以忽略不计；税务机关的检查能力足够强，并且高度廉洁，依法治税，因而违法的纳税人不可能通过贿赂等手段使税务执法人员徇私舞弊。根据博弈论原理，可构建税务机关和纳税人的博弈模型，列出对应于不同策略组合的效用矩阵。

1、博弈模型基本假设。设纳税人的实际应税收入为i，向税务机关申报的应税收入为d（d小于或等于i），适用比例税率t（t1），纳税人的逃税概率为r，税务机关的查获概率或者逃税被查获的概率为p（0t），税务机关的检查成本为c，纳税人的预期收益以其税后净收入（或者税后可支配收入）来表示。首先来看纳税人的预期净收益。在欺骗税务机关的情况下，如果未受到查处，其预期收益为i-td；如果受到查处，其预期收益为（1-t）i-ft（i-d），而纳税人在诚实申报的情况下，不管是否受到检查，其预期收益均为（1-t）i（不考虑纳税人受到检查时的遵从成本）；再看税务机关的预期收益，在纳税人逃税的情况下，检查与不检查的预期收益分别为ti+ft（i-d）-c和td；在纳税人不逃税的情况下，检查与不检查的预期收益分别为ti-c和ti。

2、混合战略纳什均衡。根据双方博弈的假设条件，得到征纳博弈的收益矩阵，如表1所示。（表1）

在征纳博弈中，参与者所选择的战略既可能是纯战略，也可能是混合战略。在纯战略选择的情况下，由于检查概率和逃税概率要么为0，要么为1，因而征纳双方的博弈不存在均衡解。现在分析博弈双方选择混合战略情况下的均衡问题，即参与人以某种概率分布随机选择不同行动达到的均衡状态。对纳税人和税务机关而言，选择混合战略就是分别选择一定概率的遵从或者不遵从和一定概率的检查或者不检查，也就是说检查概率p和逃税概率r都不等于0。当纳税人在欺骗与不欺骗情况下所获得的预期收益相等，并且税务机关在检查与不检查情况下所获得的预期收益也相等时，两者间的博弈就达到了一种混合战略纳什均衡，可以求出两者间的均衡解。

（1）检查概率的均衡解。给定检查概率p，纳税人选择逃税和不逃税时预期收益分别为：

选择逃税时的预期收益：

g1=［（1-t）i-ft（i-d）］p+（i-td）（1-p）

选择诚实纳税时的预期收益：

g2=（1-t）ip+（1-t）（1-p）

令g1=g2，解得p=1/（f+l）

（2）逃税概率的均衡解。给定纳税人的逃税概率r，税务机关选择检查与不检查的预期收益分别为：

选择检查时的预期收益：

r1=［ti+ft（i-d）-c］r+（ti-c）（1-r）

选择不检查时的预期收益：

r2=trd+ti（1-r）

令r1=r2，解得r=c/t（f+l）（i-d）

根据求解结果可知，当税务机关以p=1/（f+l）的概率进行检查，纳税人以r=c/t（f+l）（i-d）的概率逃税时，征纳双方的博弈达到均衡状态。这一均衡解意味着，逃税程度随着税务检查的边际成本的提高而提高，随着处罚率的提高而降低。

3、博弈均衡的启示。首先，税收管理广度与纳税遵从度具有相关性，税务机关检查的概率越大，纳税人偷逃税的机会成本就越大，相对来说纳税遵从度越高；其次，税收管理深度与纳税遵从度有很大的相关性，查获率与偷税概率成反比；再次，处罚力度越大，违法风险越大，违法成本越高，纳税遵从度越高。在适度管理中，管理与遵从呈正比关系，在过度管理或管理不到位情况下，管理与遵从则呈反比关系。要在征纳博弈中取得最佳效果，必须正确把握管理与遵从的阀值，也就是博弈均衡点，使之从强制型遵从向自觉型遵从转变。

三、纳税遵从影响因素具体分析

征纳博弈的结果就是能够达成征纳双方都接受的一种均衡，但在现实中，纳税人对税务部门的行为、信息了解得比较清楚，而税务部门对纳税人的信息了解得相对不够，这种信息的不对称，使得纳税人有机可乘。有研究数据显示，在我国现有纳税人中，40%的纳税人自觉遵从税法，30%的纳税人通过辅导遵从税法，还有30%的纳税人遵从度不高。应当说，这一遵从度与发达国家相比差距不小，造成这一状况的因素主要有以下几个方面：

1、税收管理因素。在管理措施上，主要表现在征管力量分布不均，税源管理比较薄弱，征管力度不够，导致偷逃税成为部分纳税人经常使用的小伎俩，初犯转变成惯犯，形成心理适应。同时，影响原本具有良好税收遵从意识的纳税人，造成其心理失衡，从纳税遵从转变不遵从，形成恶性循环；在管理手段上，稽查查获率与涉案定罪率偏低，处罚率低。在现实征管中绝大部分都取最低限处罚，没有根据偷税性质、情节、数额大小等标准进行处罚，这对少数存在侥幸心理不依法纳税的企业，根本起不到震慑作用。

2、纳税遵从成本因素。纳税人遵从成本高而不遵从成本低是重要原因。征管业务流程较为繁琐，纳税人面对两税务征管机构，使遵从成本偏高。而纳税人不遵从成本较低，对不遵从税法所受到的处罚偏轻和罚款数量规定上的弹性安排，加之税管人员的主观随意性，使纳税人的不遵从成本微乎其微，在一定程度上助长了纳税不遵从的主观故意。

3、法制因素。税收法律环境是规范征纳关系的刚性环境，能促使税务机关依法治税，纳税人依法纳税，而我国还没形成良好的法律环境，表现为：税收法律制度不够健全和完备，这给了纳税人钻法律空子的机会，引发了懒惰性不遵从行为；税收执法程序不规范，税收执法手段软化，纳税人逃税成本小于遵从成本；税收司法保障体系不健全，纳税人偷漏税的侥幸心理增强。

四、基于税收管理影响提升纳税遵从的建议

尽管纳税遵从受到法律制度等客观因素的影响，但税务机关与纳税人的博弈分析告诉我们，优化税收管理能够有效提升纳税人的遵从度。理解税法是遵从的基础，降低办税难度是遵从的保障，而严厉打击不遵从则是对遵从的最好鼓励。

1、树立“人性化”征管理念，提供“专业化”税务咨询。提高纳税遵从首先要从税务人员理念的转变上着手，要建立有效的纳税人诉求和反馈机制，充分倾听并汲取纳税人的意见，以“更容易、更节省、更人性化”为核心制定遵从规划。要从方便纳税人办税而不是从方便内部管理出发来设计征管流程和相关信息系统。要本着公开、负责的态度与纳税人交流潜在的不遵从风险并指导其主动纠正，而不是利用信息不对称保持手中权力的神秘感。其次，税务部门应根据纳税人个体情况，从复杂的税法体系中梳理出适合的部分，提供“个性化、专业化、人性化”的辅导，并加强后续的跟踪管理。

2、开展流程再造，降低办税难度。办税流程越复杂，纳税人承担的时间成本、货币成本、心理成本等遵从成本就越高，纳税人遵从度也越低。因此，我们需要以纳税人为中心开展流程再造，简化纳税程序，统一报表资料报送要求，实现纳税人一次提交资料，后台信息共享。要加强业务部门之间的统筹，避免各业务部门与同一纳税人多点接触，多头管理，让纳税人在设定的办税流程中以较低的成本获得较优质的服务。要加强征管手段的信息化建设，扩大网上申报的税种，扩充申报表填写引导、自动计算、自动等功能。此外，应尽快完善信誉等级管理，通过为诚信纳税人提供“绿色通道”以显示对税收遵从者的鼓励。

3、加大查处力度，增强税法威慑力。纳税人受不完全信息和认知能力的限制，对一项税收不遵从行为将面临多大风险是无法完全准确判断的。如果纳税人能高估违法受罚的风险，那么其从事不遵从行为的风险爱好动机将减弱。这种高估，一方面取决于法定的处罚标准；另一方面根据其他违法纳税人实际受到的处罚程度来定，特别是在法定处罚标准弹性比较大的情况下更是如此。因而，要加强对故意不遵从的打击，对轻微的涉税犯罪，也不轻易放过，增大税收不遵从压力，使纳税人内化税收威慑。

主要参考文献：

[1]刘振彪.我国税收遵从影响因素的实证分析[j].财经理论与实践，2010.5.

标准式博弈的混合战略篇6

随着我国对科技投入的不断加大，科研项目经费的不断增加，使得科技项目经费的管理问题也备受关注。目前，由于我国科研项目管理的相关法律法规过于粗放，造成科研经费管理宽松，经费舞弊的操作空间很大，客观上对政府监管工作的开展造成了一定困难。现今国内尚无学者利用进化博弈的方法对政府监管部门和科研项目团队之间相互博弈策略进行分析，而静态博弈模型在市场参与者非完全理性的现实中有很大的局限性。针对此，本文拟从进化博弈理论出发，建立科技项目财政资金使用方（科研项目团队）和政府监管部门经费舞弊及治理的博弈模型，对双方动态进化策略进行分析，并根据分析的结果提出一些治理及防范科研项目团队舞弊使用经费的措施。

二、研究假设

在科技项目资金使用及监管过程中存在两个基本当事人：科技项目资金使用方（科研项目团队）和科技项目资金监管方。他们可选择两个纯战略，即科研项目团队可能“舞弊”，也可能依法“遵规”；监管方可以选择“严格监管”，也可以选择“监管失范”。若将R和i分别定义为科研项目团队和监管方可选择的战略集合，科研项目团队和监管方第i个纯战（i=1，2）用Ri和ii来表示，则R={R1，R2}={舞弊，遵规}，i={i1，i2}={严格监管，监管失范}。同时本文作如下假设：

假设1：在某个项目中科研项目团队的科研经费为Y。使用者舞弊非法所得为a，a∈[0，Y]，实施经费舞弊行为过程中所付出的物质耗费成本为c1（几乎为零）

假设2：如果监管方发现科研项目团队有经费舞弊行为，则给予一定的惩罚，假设惩罚的法定成本为c2（包括停止拨款、追回款项、终止项目、通报批评、行政处分以及刑事责任等）。即如果经费使用者有舞弊所得为a，一旦被发现，则不仅要追回舞弊所得a，同时还须承受法定成本c2

假设3：如果科研项目团队有舞弊行为，监管方也实行严格监管且能查处，严格监管成本c3（c3>0），那么c3

根据上述前提可以得出博弈双方收益矩阵，如表1所示：

三、科技项目资金监管与使用双方规制遵从的静态博弈分析

分析博弈收益矩阵表可看出：静态博弈过程中，若监管方遵从规制，按照法规选择严格监管i1时，科研项目团队选择R2是最优战略；若监管方选择i2，科研项目团队会选择R1；而若科研项目团队选择R1时，监管方选择i1是最优战略；若科研项目团队选择R2，监管方会选择i2。由于双方会一直循环的选择最优战略，占优战略在这个博弈中并不存在，根据纳什均衡存在性定理，所以本博弈中存在一个混合战略纳什均衡。

假设监管方选择严格监管的概率用n表示，科研项目团队选择舞弊的概率用m表示，则监管方的混合战略为n=（n，1-n），科研项目团队的混合战略为m=（m，1-m），那么，监管方严格监管的收益期望值e（n）为：

e（n）=m（a+c2-c3）+（1-m）（-c3）（1）

监管方不监管的收益期望值e（1-n）为：

e（1-n）=m（-a）+（1-m）×0（2）

科研项目团队舞弊的收益期望值e（m）为：

e（m）=n（-c1-c2）+（1-n）（a-c1）（3）

科研项目团队遵规的收益期望值e（1-m）为：

e（1-m）=n×0+（1-n）×0（4）

不管科研项目团队如何选择战略，在纳什均衡前提下监管方严格监管或监管失范的收益期望值是相同的；类似地，不管监管方如何选择战略，科研项目团队舞弊或遵规的收益期望值也是相同的。如果用（n*，m*）表示纳什均衡时的混合战略，那么可得到下列等式：

e（n*）=e（1-n*）e（m*）=（1-m*）（5）

计算可得n*=（a-c1）/（a+c2），m*=c3/（2a+c2）。

通过分析，如果m>m*，监管方就应选择严格监管，即m=1；如果mn*，科研项目团队就应该选择合规，即n=0；如果n

四、项目财政资金监管与使用双方遵从规制的进化博弈分析

进化博弈的参与者并不具有完全理性，甚至理性程度较低，类似于生物的进化，他们在博弈中不断通过学习，重复调整战略选择，从而逐渐找到一个更好的战略。在生物进化论的复制动态机制中，一种适应度更高的新策略会逐渐被越来越多的参与者采用，而适应度更低的策略就被逐渐淘汰，这种参与者的动态调整可以用生物进化中的复制动态机制来模拟。假设群体中采用策略k的比例为n，选择策略k能得到的收益为ek，群体的平均支付为e，这种动态调整过程用动态微分方程表示就是：

在这里，监管方群体中采用“严格监管”的比例可以用监管方严格监管的概率n表示，科研项目团队群体中采用舞弊的比例可以用科研项目团队“舞弊”的概率m表示，因此监管和科研项目团队双方采用两种策略得到的期望收益与第二部分相同，同时这里所做的模型假设也与前面静态博弈分析假设相同，在此不再赘述。

那么，监管方群体的平均期望值e（i）为：

科研项目团队群体的平均期望值e（R）为：

若将动态微分方程应用在监管和科研项目团队双方，则可以得到监管方群体采用严格监管比例n的复制动态方程：

同样得到科研项目团队采用舞弊战略比例m的复制动态方程：

因此，可以得到以下推断：

（1）监管方适当提高法定的惩罚成本有助于降低舞弊比例。监管方严格监管的概率和科研项目团队舞弊的概率都是法定惩罚成本的减函数。一旦被发现舞弊，科研项目团队不仅要退回舞弊所得经费，还要承受额外的法定成本c2，而舞弊的法定惩罚成本越高，科研项目团队就越不会舞弊，这也是符合现实情况的。对于监管方来说，一方面随着法定惩罚成本的上升，舞弊概率会减小，因此会逐渐疏于严格监管；另一方面较低的法定成本促使科研项目团队出现侥幸心理而趋向舞弊，舞弊概率上升，就会促使监管人员严格监管的概率也提高。

（2）监管方降低监管成本与提高监管水平可降低舞弊比例。科研项目团队舞弊的概率随着监管方监管成本的降低而降低。这是因为越低的监管成本和越方便的监管方式显然会使得监管人员更便于严格监管，而科研项目团队在双方博弈中会考虑到监管方的这种心理，舞弊概率会减小。另外，监管方严格监管的概率随着科研项目团队舞弊耗费物质成本的升高而降低，而这个模型假设中舞弊成本几乎为零，这与实际情况也相符，这里就不做分析。

（3）科研项目团队偏好小额经费舞弊。监管方严格监管的概率与科研项目团队舞弊非法所得呈正相关，即舞弊非法所得越大，监管方严格监管的可能性就越高；并且科研项目团队舞弊的概率与其舞弊非法所得呈负相关，即舞弊非法所得经费数额越大，科研项目团队越不敢舞弊。由于监管方和舞弊所得额两个方面的影响，想要舞弊的科研项目团队以较小的金额舞弊的可能性增大。这原因一方面可能是科研项目团队觉得大额的经费舞弊很容易被监管人员发现和处罚；另一方面也可能是认为监管人员考虑到工作效率和监管成本的问题会有选择的忽略小额舞弊经费。

（4）改善科研项目团队规制遵从是个缓慢过程。当监管方严格监管的概率较高时，科研项目团队出于为了回避风险的，其舞弊的概率m*会较低。而监管方在监管过程中发现舞弊的事件减少之后，会逐渐松懈或者适当降低对科研项目资金的监管概率，即n*降低；当n*降低时，科研项目团队又会提高舞弊的概率m*。即提高科研项目团队遵规度是一个动态调整而且十分缓慢的过程，非一朝一夕就能实现，通过复制动态策略的分析，可以得出这样的结论：保持监管方严格监管的概率n>n*，可以使得m尽量维持在较低的水平，尽可能降低科研项目团队的舞弊概率。

五、科技项目财政资金舞弊治理对策

（1）降低监管方的监管成本，改进与创新监管手段，使监管更为方便灵活，能以更小成本提高监管方的监管比例。这样对于理性的科研项目团队而言，如果舞弊越多，金额越大，那么被发现的概率就越高，从而迫使他们遵守相应的法规，减少经费舞弊案件的发生。

（2）强化项目经费监管的法律法规建设，加大经费舞弊的惩罚力度。修订和完善有关科研经费使用的法律法规，从制度上防止和治理利用科研经费监管漏洞来非法牟利的团队。在法律层面上确立科研资金来源及运用的原则及管理架构、管理机构的职责等。加大对科研项目团队舞弊使用科研经费的惩罚力度，使其惧怕因违反法律法规而承担的高额风险和罚款，从而降低舞弊发生的概率，减少国家财政资金流失。

（3）建立内外监管相互制衡的监督管理体系。开展科研机构与纪检司法机关的廉政共建活动，积极探讨和创新内外监管方式方法，例如检察机关或公正机关可全程监督科研院所重大科研项目的招投标过程。同时可适时引入公共参与机制，资金使用方按有关规定定期公告重大科研项目经费的使用情况，披露经费使用明细，还可以聘请会计、审计等中介机构对项目出具审计报告，媒体和社会公众可以随时监督和提出异议，消除了各市场主体的信息不对称。从而形成内部监督与会计、审计等中介部门、纪检司法及社会舆论的外部监督相结合并且能相互制约的监督体系。

（4）完善科研项目合规性内控制度设计，规范内部责任范围和实行问责制，加强绩效审计。首先增强团队领导的内控意识，领导设计和实施内部控制制度。特别需要注重建立健全单位资金内部控制，明确资金岗位职责分工和收付审批权限，保证科研经费的合理合法使用，同时对出现滥用和挪用科研经费问题的课题负责人和岗位负责人加大问责力度。项目经费使用的各阶段（包括申报、批准、发放等）应公开透明化，不仅要重视事中审计，更要加强绩效审计。

（5）大力提高监管者（审计人员）的专业水平与高知群体法制、道德素质。应当加强政府监管人员的专业知识培训、精神文明和职业道德建设，提高监管人员专业水平、思想和职业修养。开展专业培训提高监管人员专业水平，促使他们改进和创新监管水平进一步降低监管成本，将道德规范和行为准则的建设纳入监管人员培训的范畴，督促监管人员在监管中按照较高的道德标准来增强其责任感。同时通过各种形式的法制宣传，强化科研院所高知群体和科研人员的法制意识和学术道德修养。

（6）善于把他律转化为自律。自律是指制度的具体要求、标准和内容已转化为科研团队内在的目标、标准和需要。经费制度的执行不是“要我这样”，而是“我要这样”，是通过科研团队自我调节、自我约束、自我“立法”来体现的。科研团队经费舞弊行为的自我约束力量用公式表示为：自律力量V=C*m（V：抑制经费舞弊的自律力量即自我约束、自我控制的力量；C：承担的经费舞弊风险值即违规失败承担的受罚成本；m：被追究的可能性即违规失败的概率）。如果制度严格，监管严格，对科研团队经费舞弊行为处分很重，追究率很高，舞弊行为失败的可能性和承担的成本就会变得很大，这可以有效地抑制舞弊行为的产生，同时也有利于净化学术研究不良的社会风气，取得最佳绩效。

参考文献：

[1]陈玉聪：《科研课题经费存在问题及改革思路》，《中国科技信息》2005年第23期。

[2]乔飞鸽：《博弈模型分析：处罚监管者优于对违规者的处罚》，《经济问题》2010年第7期。

[3]熊勇立：《税收征纳双方的进化博弈分析》，《税务研究》2009年第5期。

[4]邓力平、安然：《纳税人遵从的演化博弈分析》，《涉外税务》2006年5期。

[5]曹均锋：《强化科研项目经费管理的思考》，《河北农业科学》2009年第13期。

[6]明海翔、郭峰：《铁路建设项目质量监管进化博弈分析》，《中外建筑》2009年第5期。

标准式博弈的混合战略篇7

【关键词】小产权房博弈激励的悖论

小产权房问题由来已久，早在上个世纪90年代，以北京为主要代表部分大型城市就已经出现了在农民集体所有土地上建设、向本集体以外城镇居民出售的小产权房。据国土资源部（2010）不完全统计，全国小产权房建筑面积已超过66亿平方米（相当于中国房地产业近10年来的开发总量），小产权房在各类城市周围、经济开发区、旅游风景区、大学新城等区域都已具备相当规模。即使有国家的明令禁止，建设部的明确警示，法院的严厉判决，小产权房的建设势头仍然未能被遏止住，在短短几年间如雨后春笋，遍布全国，业已形成了一条完整的建设、销售、交易转让产业链。同时官、学、商、民各说各话，激烈博弈，问题日趋复杂，小产权房的解决也越来越紧迫。利弊共生的小产权房折射出我国社会现存的诸多矛盾，如何辩证地分析小产权房问题具有重要的现实意义。

一、小产权房产生的原因分析

（一）小产权房的根本成因

我国宪法规定：城市土地归国家所有，农村土地归集体所有。但同是土地公有制，二者并非同地、同权、同价，具体表现在：集体土地所有者不能买卖其土地；集体土地使用权必须首先在集体成员内部进行初始配置。除了宅基地使用权不能抵押和转让给集体成员外，农地的承包权亦不能抵押，其流转也受到一定限制；农民在自己的宅基地上以及村民集体在集体建设用地上建设的住房只能卖给本村居民，如果卖给外村特别是城市居民，则被视为小产权房，不受法律保护。

因此，城乡二元土地制度导致的结果为：农村由于受到集体土地的买卖的限制而继续停留在耕地与种植的农业经济中，相较依靠城市商品房高速发展的城市经济落下了一大截。在现有自留地大量出现空余与农村经济迫切需要发展的情况下，农民为了追求更高的收益，开始集体发展小产权房。这对矛盾即成为“小产权房”屡禁不止的主要原因。

（二）小产权房的现实成因

低廉价位优势。小产权房最大的优势就是其低廉的价格。尽管近几年价格一直呈上升态势，但是对比大产权房高昂的房价，大量低收入者成为了购买小产权房的主流群体，不少工厂为了节省成本甚至自行提供以集宿楼形式为主的小产权房，供本厂工人住宿。

农村区位优势。小产权房的最初的购买动机是低收入群体追逐低廉的价位，而近几年开始，随着小产权房别墅的兴起，不少城市白领由于城市环境恶化，开始将购买目光投向位于湖滨与田地之间的农村小产权房，许多农村与开发商也看到了其优良环境条件，纷纷开始建造别墅这类小产权房。

中国法律的不完善和监管部门的执法不严。《中华人民共和国宪法》第八条规定，“参加农村集体经济组织的劳动者，有权在法律规定的范围内经营自留地、自留山”。《中华人民共和国土地管理法》第四十三条规定，“任何单位和个人进行建设，需要使用土地的，必须依法申请使用国有土地；但是，兴办乡镇企业和村民建设住宅经依法批准使用本集体经济组织农民集体所有的土地的，或者乡（镇）村公共设施和公益事业建设经依法批准使用农民集体所有的土地的除外”。正是法律法规中许多模棱两可地方的存在，给小产权房建设留下了打“球”的空间。而监管部门的执法不严更是助长了小产权房的蔓延，如果监管部门能够在小产权房刚开始建设时就将其遏制，小产权房就不会发展到如今进退维谷的局面。

二、博弈分析与模型建立

严格来说，小产权房牵涉到的博弈方很多，本文认为，主要包括政府监管部门，房地产开发商，村镇，农民和购买者。

（一）博弈分析

对政府监管部门：一方面，小产权房的存在有利于缓解普通商品房供不应求，能有效抑制房价的高速增长。另一方面，小产权房冲击着地方政府对土地市场的掌控，造成政府土地出让金收益的大额损失，财政吃紧，同时小产权房以非法身份存在无疑对政府形象造成了破坏。总之，小产权房对政府监管部门是弊大于利的。

对房地产开发商：小产权房的扩张冲击了房地产市场价格体系，开发商无钱可赚，纷纷选择退出行业，将造成我国房地产行业的大幅度萎缩。

对乡镇政府：小产权房的开发有利于增加乡镇政府的收益，提升乡镇整体生活水平，有助于乡镇政府的政绩建设。

对农民而言：小产权房的出现维护了农民的基本权益。土地若被国家征用，农民只能获得少量补偿金，若是被开发成小产权房并上市交易，土地得到巨额增值，农民收益显著提高。

对购买者而言：小产权房的存在一定程度上解决了低收入人群购房难的问题，他们以远低于商品房的价格购买到一套可以居住几十年的房产，虽然承担了没有房产证明的风险，但满足了基本需求。

总体来说，政府监管部门在这场博弈中受损最多，而农民则成为最后的赢家。对此，我们为了简化模型，仅从政府监管部门和农民来分析他们在小产权房出现过程中是如何博弈的。

（二）假设条件

博弈的参加者：监管部门与农民。各博弈方各自可选择的全部策略或行为的集合：监管部门选择检查还是不检查小产权房，农民选择开发还是不开发小产权房。博弈的次序：监管部门以概率p选择不检查，1-p选择检查小产权房；农民以概率q选择开发，1-q选择不开发小产权房。所以这种策略选择方式为“混合策略”。本博弈中两博弈方策略得符合两个原则：第一，不能让对方知道或猜到自己的选择，因而必须在决策时利用随机性；第二，他们选择每种策略的概率一定要恰好使对方无机可乘，即让对方无法通过针对性地倾向某一策略而在博弈中占上风。

博弈方的得益：监管部门的检查成本C（检查要耗费大量的人力，物力和财力）；监管部门的收益包括：违法建设罚款F，监管部门透明执法的形象收益L，开发农民对监管部门的贿赂R，小产权房不开发要比开发多一笔土地出让金收益S。农民的开发成本：我国特有的城乡二元土地制度，使农民的开发成本在巨大的开发收益面前可以忽略不计；农民的收益包括：开发收益m，不开发自用或被国家征用收益n。显而易见，F>m，因为只有监管部门的违法建设罚款超过农民的开发收益，才能有足够的惩罚力度来抑制小产权房的开发。同时，m>R，农民的开发收益必须大于开发农民对监管部门的贿赂，否则就没有足够大的利润来驱使农民开发小产权房。另外，L

（三）得益矩阵及其分析

监管部门和农民的博弈收益矩阵

用划线法很容易发现它不存在纯策略纳什均衡，也即任何一个纯策略组合都有一个博弈方可通过单独改变策略而得到更好的得益。

政府监管部门检查的期望收益：U1=q*（L-C+F）+（1-q）*（L+S-C）

政府监管部门不检查的期望收益：U1’=q*（R-L）+（1-q）*S

根据混合策略博弈的第二个原则，农民选择开发和不开发的概率q和1-q一定要使监管部门选择检查的期望收益和选择不检查的期望收益相等，即U1=U1’，经计算得q=（C-L）/（L+F-R）。如果q>（C-L）/（L+F-R），监管部门会检查，如果q

农民开发的期望收益：U2=（1-p）*（m-F）+p*（m-R）

农民不开发的期望收益：U2’=（1-p）*n+p*n

根据混合策略博弈的第二个原则，政府监管部门选择不检查和检查的概率p和1-p一定要使农民选择开发的期望收益和不开发的期望收益相等，即U2=U2’，经计算得p=（n-m+F）/（F-R）。如果p>（n-m+F）/（F-R），农民会开发，如果p

所以本博弈的混合策略纳什均衡为q=（C-L）/（L+F-R），p=（n-m+F）/（F-R），农民选择以概率q选择开发，政府监管部门以概率p选择不检查。

三、结论

政府监管部门和农民之间的混合策略博弈，还可以揭示一种“激励的悖论”，对此我们采用图解分析。

容易说明该线与横轴的焦点q*就是农民选择开发概率的最佳选择，选择不开发的最佳概率则为1-q*。首先S到（R-L）连线上每一点的纵坐标，就是在农民选择该点横坐标表示的开发概率q时，政府监管部门选择不检查策略的期望收益

U1’=q*（R-L）+（1-q）*S。加重对在农民开发小产权房时，政府监管部门不检查的处罚，即L增大使得（R-L）下降到（R-L）’。此时，如果农民开发的概率保持不变，那么政府监管部门不检查的期望收益将会变为负值，政府监管部门肯定会选择检查。政府监管部门检查农民只能减少开发，直到q*下降到q*’，此时政府监管部门又会恢复混合策略，达到新的混合策略均衡。这就是说，加重对失职政府监管部门的处罚而使监管部门真正尽职只是短期效果，但在长期中并不能使监管部门更尽职，监管部门的尽职程度不是由（R-L）决定的。加重处罚失职监管部门的长期效用，恰恰是会降低农民开发小产权房的概率。

同样的，加重对开发农民的处罚意味着F会增加，从而使（m-F）下降到（m-F）’。如果政府监管部门在混合策略中保持其概率分布不变，此时农民开发小产权房的期望收益变为负值，因此农民会停止开发。但是在长期中，农民减少开发会使得监管部门更多地选择不检查，最终监管部门会将不检查的概率提高到p*’.达到新的均衡，而此时农民开发的期望收益又恢复到0，他会重新选择混合策略。由于农民的混合策略概率分部是由图二决定的，并不受（m-F）的影响，因此加重对开发农民的惩罚在长期中并不能达到抑制开发的目的，最多只能抑制短期发生率，但却起到了使政府监管部门节省检查成本的作用。

三、对策

（一）加强监管力度，鼓励第三方监督

目前全国小产权房面积已达66亿平方米，数字惊人，严重冲击18亿亩耕地的红线，光靠中央政府下达政策，地方政府执行还是远远不够的。政府监管部门应该下放部分权利给乡镇政府乃至农村，并做到责任到人，如果存在村内有农民开发小产权房而没有上报的情况，给予乡（镇）长或村长降级或撤职的处分。同时还要鼓励群众积极举报开发小产权房的情况，对于成功举报的群众给予适当奖励。通过监管部门和群众的通力合作，小产权房的增长势头必将受到有效的遏制。

（二）区别对待类型不同的小产权房，加大惩罚力度

对于国内如此大规模的小产权房，“一刀切”的做法显然是不明智的，因为很多小产权房的住房质量均达到合格标准，强行拆除将造成无谓的损失与浪费，同时因牵涉到的利益群体众多，此举也可能引起社会混乱或暴动。我们必须理性对待，分类处理。本文认为，对在建的小产权房，必须做到严打增量，严格土地管理，对新增小产权房进行没收充公或，对已建成的小产权房补交费用予以确权，对转让环节进行限制或补交规费、出让金等有条件转让。

参考文献：

[1]谢识予.经济博弈论[m].上海：复旦大学出版社，2006.

[2]张丽娟.解题小产权房[J].城市开发，2007，（07）.

[3]时寒冰.为了民生，请给小产权房一条出路[n].上海证券报，2007，（07）.

[4]严焰.“小产权房”的形成原因与出路探究[J].对策与战略，2008，（02）.

[5]郝建国.小产权房不能一刀切[n].华商报，2008，（03）.

标准式博弈的混合战略篇8

关键词：征地制度;中央政府;地方政府;博弈

一、引言

征地问题一直是国土工作的难点和热点问题[1]。征地制度改革的提出本质上是由于中央政府与地方政府在征地过程中的博弈，导致被征地农民的合法权益遭到侵害，农民的维权行动造成了一系列的影响才使得政府意识到“问题”确实存在，中央政府才“承认”并着手解决征地制度改革问题[2～3]。

二、土地征收过程中政府相关利益主体的博弈分析

（一）征地主体中政府相关利益主体的行为假设

在博弈过程中的假设包括：局中人假设，即中央政府和地方政府。理性经济人假设，中央政府目标是全国范围内整体的社会效益和经济效益最大化，地方政府的目标是所管辖区内的社会效益和经济效益最大化[4]。纯策略空间假设，中央政府的纯策略是监管土地征收或不监管土地征收;对于地方政府而言，有两种选择，即按规定征地或者违规征地。完全信息静态假设，博弈中的信息是完全的，即中央政府和地方政府对自己和对方的策略空间和在各策略空间下所获得的收益具有共同认识，并同时做出策略选择。支付函数假设，中央政府、地方政府在采取不同的行为策略后，各自都会得到与之相应的收益。对中央政府而言，监管需要付出成本C（人力成本、财力成本和时间成本），其值越大表示制定，监管工作力度越大或者难度越大，如果不监管，那么支付成本为零，但如果地方政府违规征地，中央政府将会损失社会效益F1;地方政府违规征地可得利润R1（土地增值效益以及二次出售的价值减去土地征地价格以及安置补偿费等），但需要承担风险成本F2（即带来的负面社会效应以及中央政府对地方政府的处罚等），地方政府按规征地可得利润R2（R1>R2）。

（二）博弈模型建立及求解

由以上假设可以得出中央政府与地方政府的博弈支付矩阵（见图1）。

图1中央政府与地方政府的博弈支付矩阵

1.纯策略纳什均衡分析。地方政府按规征地，中央政府倾向于不监管，这样中央政府可以不用支付监管成本，即策略组合（不监管，按规征地）是中央政府最理想的结果，但此时地方政府按规征地的收益必定小于违规征地时的收益;对地方政府而言，如果中央政府不监督，则倾向于违规征地，这时不仅可以获得额外利润，也不用承担罚款等的风险成本，即（不监督，违规销售）是地方政府最理想的结果，但此时中央政府的收益最小，所以这两种策略组合不是地方政府和中央政府的纯策略纳什均衡;如果中央政府监管，地方政府倾向于按规征地，此时双方收益都是最小的，所以策略组合（监管，按规征地）也不是地方政府和中央政府的纯策略纳什均衡，而策略组合（监管，违规征地）在现实中显然不符合常理。所以在这个监督博弈中，不存在稳定的纯策略纳什均衡，因此需要进一步分析地方政府与中央政府的混合纳什均衡。

2.混合策略纳什均衡分析。实际上，地方政府与中央政府并不一定会一成不变地只选择一种特定的行动，他们更可能在不同条件下选择不同策略，以实现最优的策略组合，使期望效用最大化，这就需要引入概率求解混合战略纳什均衡。假设中央政府监管的概率为p（0≤p≤1），不监管的概率为1-p;地方政府按规征地的概率为Q（0≤Q≤1），违规征地的概率为1-Q。

（1）地方政府的混合战略纳什均衡分析。给定Q，中央政府采取以p=0和p=1的两种策略[4]，此时中央政府的期望收益分别为：

e1（0，Q）=-（1-Q）F1（1）e1（1，Q）=-QC+（1-Q）（-C-F1+F2）（2）

令（1）式=（2）式得：Q=（F2-C）/F2（3）

Q=（F2-C）/F2;地方政府选择以（F2-C）/F2的概率按规征地即1-Q=C/F2;地方政府选择以C/F2的概率违规征地。

当地方政府按规征地的概率Q>（F2-C）/F2时，中央政府选择不监管，期望收益最大;当地方政府按规销售的概率Q<（F2-C）/F2时，中央政府选择监管，期望收益最大，此时，因为中央政府加强了监管，所以地方政府会提高按规征地的概率;当地方政府按规征地的概率Q=（F2-C）/F2时，中央政府随机选择监管或者不监管。所以地方政府的混合策略为[（F2-C）/F2，C/F2]。在混合策略下，选择违规征地的概率与中央政府的监管成本和罚款金额有关，即中央政府的监管成本越大，监管的概率就会减小，地方政府违规征地的概率就会增大[5];同时违规征地被处罚时力度越多，地方政府违规征地的概率会减小。

（2）中央政府的混合战略纳什均衡分析。给定p，地方政府采取以Q=0和Q=1的两种策略，此时地方政府的期望收益分别为：

e1（p，0）=p（R1-F2）+（1-p）R1（4）e2（p，1）=pR2+（1-p）R2（5）

由（3）式=（4）式得：p=（R1-R2）/F2（6）

p=（R1-R2）/F2;中央政府选择以（R1-R2）/F2的概率监管，即1-p=（F2+R2-R1）/F2;中央政府选择以（F2+R2-R1）/F2的概率不监管。

当中央政府监管的概率p>（R1-R2）/F2时，地方政府选择按规征地期望收益最大;当中央政府监管的概率p<（R1-R2）/F2时，地方政府选择违规征地期望收益最大。此时，中央政府放松了监管，所以地方政府会提高违规征地的概率。当中央政府监管的概率p=（R1-R2）/F2时，地方政府随机选择违规征地或者按规征地。所以中央政府的混合策略为[（R1-R2）/F2，（F2+R2-R1）/F2]。在混合策略下，中央政府选择监管的概率与地方政府违规征地被查处后的罚款力度有关、与地方政府违规征地的额外利润有关，即罚款金额越高，地方政府按规征地的概率就会越大，中央政府监管的概率就越低;地方政府违规征地的额外利润越大，中央政府监管的概率越大。

三、结论分析与对策

综上所述，地方政府与中央政府的博弈不存在纯策略纳什均衡，只有唯一的混合策略纳什均衡，即中央政府的混合策略为[（R1-R2）/F2，（F2+R2-R1）/F2]，地方政府的混合策略为[（F2-C）/F2，C/F2]。

由以上分析结果可知，可以从以下几方面规范地方政府的征地行为：

1.加大中央政府监管的力度。应从制度、法律等方面建立一个完善的监管系统，对征地的申请、审批、复核等环节进行严厉督查。加大监管的力度必然会受到监督管理成本的影响，因此中央政府要提高工作效率，研究新的监管办法和法律制裁措施，从而在一定程度上降低地方政府违规征地的概率，确保征地过程合法化。

2.加大对地方政府违规征地的处罚力度。对于地方政府违规征地的行为进行严厉地经济制裁，同时对当地官员进行行政处罚，对社会造成严重损失的给予撤职或者追究法律责任。

3.中央政府要严格界定公共利益界限，缩小征地范围[6]。制定出一套符合我国国情的，适应经济发展的征地情况目录及标准，建立土地征收目的合法性的审查机制。对于非公共利益建设用地应遵循市场化原则，建立城乡统一的建设用地流转市场，农民与建设用地使用方自行谈判补偿安置费用，允许被征地农民以土地使用权入股、出租等方式参与土地开发，分享土地增值带来的收益，从而保障农民利益不受损害。

参考文献：

[1]惠静夷.不同地区农用地基准地价评估比较研究[D].沈阳：沈阳农业大学硕士学位论文，2007.

[2]高超.我国征地制度及征地实践中的问题研究[D].天津：天津大学硕士学位论文，2008.

[3]谭术魁.中国频繁暴发土地冲突事件的原因探究[J].中国土地科学，2009，（6）.

[4]韩玉堂.生态工业园中的生态产业链系统构建研究[D].青岛：中国海洋大学硕士学位论文，2009.

标准式博弈的混合战略篇9

本届北京车展上，在宝马两辆电动车的侧后方有一个小小的展台，平时就只有一位老外男士站在那里，他手拿着一堆材料，时刻准备派发给周围路过的观众。这是宝马开发的一套充电系统，他提醒我尤为值得注意的是，这套系统得到了厂商们的共同认可，已经形成了标准。

这些厂商包括了奥迪、宝马、克莱斯勒、戴姆勒、福特、通用、保时捷和大众。这些厂商的Logo被统一印在印刷宣传册的下方，显得颇有气势。这位先生特地指了指这些Logo，强调这些充电技术已经得到了全球最知名汽车公司的认可。

车展上这匆匆的一幕，并不没有像随后那些“硅胶”一样引人注目。不过在5月7日～9日在洛杉矶举行的第26届世界电动车大会，上述来自德国和美国的世界8个主要汽车厂商正式了新的统一充电接口标准，充电接口兼容4种充电模式，能够满足不同情况下的充电需求。

德美两国汽车制造商现在的推广联合充电系统(CombinedChargingSystem)，能够兼容4种直流和交流充电模式，包括单相交流电、快速三相交流电、家用直流电以及公用超快直流电。这四种充电方式能够通过一个统一的充电接口完成，能够让使用者在不同的情况下完成充电。更重要的是，该装置还能够完成15-20分钟的快充操作。

在业内有句老话：三流的企业做产品、二流的企业做技术、一流的企业做标准。由于整个工业制造体系，实际上在改革开放以后是学习欧、美、日。因此，在标准方面留下了大片的真空区，不得不用上述国家的既成标准填补。比如，关于汽车制造的几乎所有标准。

有关充电标准正在上演一出“三国志”，除了上文提到的欧美联盟外，在日本，东京电力是普及“直流快速充电”方式的主力，包括丰田汽车在内的日本汽车厂商和部件厂商已于2010年3月成立了“直流快速充电”方式普及促进团体。日产和三菱的电动汽车也都采用该充电方式。

截至今年4月，日本国内已经有1154处、国外有239处设置了“直流快速充电”方式的相关充电设备。目前，日产在世界电动汽车市场领先一步，在2016年之前将推出7款电动汽车，以推动日系标准成为国际标准。

在中国，充电标准的统一工作也与世界几乎同步进行。2010年11月10日工业和信息化部装备工业司公布了《电动汽车传导充电用连接装置》等三项系列推荐性国家标准，向社会征求意见，试图为和能源企业在电动汽车充电标准方面各自为战的混乱局面画上句号。

去年年底，国家标准化管理委员会又了2011年第21号公告，批准GB/t20234.1-2011《电动汽车传导充电用连接装置第1部分：通用要求》等4项国家标准，并规定于今年3月1日开始正式实施。

不过，这项工作的国内推动遭遇了很大困难，关于标准统一及对抗欧美日的问题，仍要从两个层面来看。首先从标准本身来看，所谓“一流企业”做标准仍旧值得商榷，一项标准如果技术落后，不能得到广泛认可，那么它即便是我们自己的“标准”也很难推动。

因此，无论采用本国标准还是他国标准，关键在于它能否遵循市场化的原则，降低消费者的使用成本，降低生产者的成本，不能动辄就让普通人为国家的战略布局买单。

标准式博弈的混合战略篇10

一、目标企业的博弈行为实质

（一）博弈论与并购

并购中，主并企业与目标企业之间存在一种博弈关系，双方既联合又斗争，可博弈论来解释和描述，博弈可分为合作博弈与非合作博弈：前者强调集体理性，强调效率、公正、公平；后者强调个体理性、个体最优决策，结果往往是无效率的。并购双方在达成一定的并购意向后，双方实际上进行的是讨价还价过程，属于合作博弈范畴，减少了双方的选择空间。

合作博弈可看成是非合作博弈下明确纳入谈判过程和执行合作协议的强制过程的一种特殊情形的非合作博弈；但如何在联盟内分配他们的支付则是合作博弈所特有的，合作、双赢、多赢的思想深入人心，合作博弈是博弈论的趋势。要满足人的参与约束或个人理性约束（iR）、激励相容约束（iC）。并购中，主要应解决逆向选择，一般目标企业相当于方，主并企业相当于委托方，主并企业应充分认识目标企业进行包装、以次充好的逆向选择，对目标企业传递来的并购信号，认真进行信息甄别，以免落入并购陷阱。

纳什均衡概念是博弈论（包括合作博弈）的核心内容和重要基础，在给定对方的战略时，每个参与者的战略都是最好的，此时，没有人愿意改变自己的战略，它是一种“不后悔”均衡、一种理性预期均衡。也只有达到了纳什均衡，并购双方的合作（协议并购）才是稳定的；否则，可能存在毁约。纳什（1950）证明了每个有限战略型博弈至少存在一个纳什均衡（纯战略或混合战略的）；威尔逊（1971）证明了如下的奇数定理：几乎所有的有限博弈都有奇数个纳什均衡。

（二）若干经典例子在并购中的应用

在囚徒困境博弈中，（坦白，坦白）是纳什均衡，且是一个占优均衡，即不论对方如何选择，个人的最优选择是坦白，个人理性和集体理性产生矛盾，参与人的（不坦白，不坦白）这个帕累托改进无法达到，纳什均衡并不一定是帕累托最优，如两寡头企业通过并购扩大生产规模；并购中，若双方不合作，也可能陷入两败俱伤的囚徒困境。

在性别战博弈中有两个纳什均衡和一个混合战略纳什均衡，博弈的最后结果是（足球，）还是（音乐，足球）要看聚点作用、或事先廉价磋商、或相关均衡等能起的作用。该博弈明显是合作比不合作好的一个典型例子，只是在合作的前提下如何对收益进行分配、谁多谁少的问题，这里，先动的一方具有先动优势。该博弈案例可对并购行为进行粗略描述：并购是正的变和的合作博弈，双方需要合作，并购后其各自的支付都要比不并购时大。

智猪博弈中，大猪按、小猪等待是纳什均衡。在搜寻并购信息方面，主并企业相当于大猪，目标企业相当于小猪，　“按”相当于找到并购信息，它需要成本。目标企业主要是等待主并企业上门来谈并购，可以搭便车。

此时，双方的行为可用上述智猪博弈来描述。

斗鸡博弈中，每只公鸡有进和退两种选择，最好的结果是：自己进，对方退，但可能两败俱伤。两个纳什均衡是（进，退）和（退，进），但关键是谁进和谁退。

斗鸡博弈又叫鹰鸽博弈或胆小鬼博弈，消耗战博弈类似于反复进行的斗鸡博弈。鹰鸽博弈中鹰鸽双方的得益是不对称的，但不博弈的结构和均衡结果，　（鹰进、鸽退）是纳什均衡。两家主并企业争抢一家目标企业时就类似于斗鸡博弈，若两家主并企业的实力有些差异，就类似于鹰鸽博弈。并购中，目标企业采取可置信的反并购措施，可迫使主并企业不敢并购自己。

买卖博弈是一个讨价还价过程，并购就是一种股权买卖过程，　（卖成，买成）是纳什均衡。该博弈可解释为什么在现实中，讨价还价后买卖能做成的原因，因对双方来说都是最优选择。并购是一种交易行为，只不过用来交易的产品是目标企业，很多情况下，并购双方选取（买成，卖成）这个双赢的纳什均衡，对并购双方都有好处。但在并购发生的前提下，如何多地获取合作剩余是任何一方的期望，因此双方会对选取何种并购方式要进行讨价还价。

猎鹿博弈中，两参与人都希望双方共同去猎鹿，因猎鹿的效用值比猎兔的效用值大。但每个人都担心对手不信任自己，从而自己也不信任对方，该博弈不存在纳什均衡。要想获得更好的效用（保证出现帕累托均衡结果），参与人需要进行深入合作以取得皆大欢喜的结果。

并购中，双方需要达成一定意向，否则会出现猎鹿博弈中的不良结果。其他还有少数者博弈、骑虎难下博弈（即进、退都不是；故王佐断臂及时退出并购是明智选择）等经典案例。

（三）从纳什均衡的多重性看目标企业策略行为

关于非合作博弈的根本基础，有两个重要问题，一个是贝叶斯理性问题，另一个是纳什均衡的多重性问题。对于存在多个纳什均衡的博弈，究竟哪一个更合理、更可能出现，并没有一般的结论。实验证据颇具说服力地否定以下观点：在简单的策略相互作用中不会出现协调问题。很多情况下，并购双方相互作用的得益恰恰来自协调或合作而非冲突，这里，信息和预期是关键因素。

并购中，双方可能使用某些被博弈模型抽象掉的信息来达到一个“聚点均衡”，这些信息可以来源于共同的文化背景、习惯、知识和理解、和参与人过去并购的，也可以是其他比较容易共同向导的事物特征、某些特殊的量、位置关系等。要产生“聚点均衡”，参与人必须要有合作的态度和行为。参与人在并购开始前进行不花多少成本的“廉价磋商”或低成本的“有偿磋商”，可能使纳什均衡实际出现，故并购双方的前期接触非常重要，它有可能导致合作和成功的协调，增加并购双方的得益。并购中，应先考虑风险占优，然后考虑支付占优。

“相关均衡”是一种参与人选择战略之前协调彼此行动的，它适于参与人拥有部分共同的利益，需要设计一种信号机制，参与人可能根据这个信号的出现来选择自己的行动，这一事实称为显示原理，如下面的目标企业的被并购策略所描述的。“适度均衡”：对于参与人带来较大损失的偏离，参与人会格外小心，偏离的可能性很小；而对于参与人带来较小损失的偏离，参与人常因不小心造成偏离，偏离的可能性较大。根据偏离均衡为参与人带来损失的大小，规定偏离的可能性差异并进行排列，若原均衡对于这些偏离或颤抖仍是稳定的，则此均衡为适度均衡。“合同均衡”：如果参与人的相关战略满足个人理性，则所有参与人在合同上签字是加入合同博弈问题的纳什均衡，但实际上，有时形成并签定合同是困难的，而且签署合同并不意味着遵守。合同均衡改善了双方的支付，通过合作达到了双赢，但这些均衡不是唯一的，合作仍存在多种可能性；若达不成共识，合作仍然无法实现，解决这类合作均衡选择问题的途径有仲裁和谈判。并购意向书中的锁定条款具有效力，并购合同是双方经过讨价还价后得到的双方满意的最优纳什均衡。其他还有进化稳定均衡、强均衡、防联盟均衡、防联盟相关均衡等。

以上这些概念和方法分别适于各种不同情况和局部问题，但它们表明，并购双方在纳什均衡多重性的选择方面进行有效合作是解决问题的关键和出路；要想得到有效率且稳定的博弈结果，参与人必须进行深入合作。并购双方进行合作博弈才能实现双赢，损人不利己的不稳定均衡往往达不到并购的目的。

二、目标企业的并购应对策略

（一）股权转让和增资扩股的区别

股权转让和增资本扩股都是并购的一种方式，但二者存在较大区别：

1.增资扩股使企业规模扩大，而股权转让仅是股东变化，企业规模不变。

2.从投融资服务的实践来看，投资方或并购方更愿意采取增资扩股方式进行投资或并购，而项目方一般愿意股权转让（至少是部分）套现减少风险。套现是项目方对公司未来信心不足的一种表现，投资者一般较为反感，投资方或并购方不太了解项目的发展情况，并购双方存在信息不对称及信任和判断问题。这里的项目包括实业项目和目标企业产权。

3.从博弈论的角度说，股权转让是一次性博弈，增资扩股是多次重复博弈，投资方或并购方和项目方的利益捆在一起，因此，增资扩股方式更能避免项目方套现的短期行为和信息不对称可能造成的对投资方或并购方的损害，初始的信息不对称程度将随着双方多次重复博弈的进行而逐渐减小。

泽尔腾的连锁店悖论和实际情况并不符合，我们认为只要参与人认为将来可进行足够多次博弈（次数不定的有限次，人的一生是有限的，无限次只是纯粹的理论概念），就可能形成合作博弈。正如行商容易缺斤少两，而坐商都号称童叟无欺一样。

（图1　目标企业的并购应对策略，略）

（二）并购双方的博弈过程

图1系统地刻画了目标企业的并购应对策略，目标企业决不是等闲之辈，为了其最大利益，会千方百计地研究对付主并企业的各种策略。协议被并购中，主并企业有并购与不并购两种选择，目标企业也有接受被并购与对抗被并购两种选择。当主并企业坚决进行并购时，目标企业有假意对抗和坚决对抗两种策略。博弈进行到哪一步、出现哪种结果，需要各自的收益。并购双方就能否合作进行如图1的动态博弈的分析如下：

1.不管目标企业接受与对抗，只要主并企业坚持不并购，看不上目标企业，并购行为就不可能发生，博弈的支付结果都是（0，0），括号中第一个数字表示目标企业的支付结果，第二个数字表示主并企业的支付结果，这里，支付结果都是指双方获得的净收益。

2.当并购双方愿意进行合作，博弈的支付结果是（t，S），显然，t>0且S>0，只有双赢（至少并购时双方主观上都预期是合适的，虽然一方或双方并购后都可能惊呼上当，发现自己掉到了并购陷阱中）才能达成并购交易。目标方面有意隐瞒真实情况或设置并购陷阱的案例不胜枚举，如阿城钢铁请科利华人瓮；同样，主并企业方面存在陷阱的例子也不少，如空壳公司广东飞龙，冒充有实力的主并企业。2001年1月21日，成都市中级人民法院公开审理St联益公司（001696，现为st宗动）的40％法人股被广东飞龙诈骗一案。

3.当主并企业看好目标企业，即使在目标企业对抗时也坚持要进行并购，目标企业可假意对抗以提高自己的身价，支付结果为（t+t，S-S），这里，t+t>t>0且s-S>0，其中t>0，S>0，S是主并企业由于目标企业的假意阻挠而花费的成本或由于目标企业的假意阻挠而在并购中出较高的买价而减少的收益。显然，目标企业采取假意对抗所获收益（t+t）要大于直接进行合作的收益t，否则，没有必要进行假意对抗。

4.当主并企业看好目标企业，即使在目标企业对抗时也坚持要进行并购，目标企业认为并购对自己不利，并购后自己的净收益o，s1>0.

t1为目标企业的反并购成本，s1为主并企业为获取目标企业所花的搜寻、调查、谈判等相关费用。由于放弃并购，主并企业这些费用成为沉淀成本。

（三）主并企业坚决看好目标企业时的收益

1.设主并企业看好目标企业，目标企业接受被并购的可能性为p，不接受被并购的可能性为（1-p），在不接受被并购的可能性中假意对抗的可能性为ξ，坚决对抗的可能性为（1-ξ），则此时目标企业的预期收益Rt>o：

Rt=pt+（1-p）[ξ（t+t～（1-ξ）　t1

（1）

举例：当p=l/2，且ξ=1/2时，Rt=（3t+t—t1）/4，需要3t+t-t1>o，t>0，只需3t-t1>o即可，若目标企业的反并购成本t1不大（目标企业自己可以确定其大小），则上式容易满足，因而目标企业在和主并企业接触中应处于主动地位，原因在于其有被并购与否的选择权。（式1）可以帮助我们理解并购中讨论并购的绩效时，目标企业的超额收益一般为正，并占据大部分的并购溢价这个事实。

2.主并企业的预期收益Rs>o为：

RS=pS+（1-p）[ξ（S-S）-（1-ξ）S1

（2）

同样地，当p=1/2，且ξ=1/2时，Rt-（3S-S-S1）/4，需要3S-S-S1>0，否则，主并企业将得不偿失，这里，S和S1的大小还取决于目标企业的对抗程度和对抗技巧，其大小不好估计，3s-S-S1>0较难满足。原因在于主并企业看上目标企业后只有并购一种选择，并购双方还存在对目标企业信息拥有程度的不对称。（式2）可以帮助我们理解有关文献所谓的关于主并企业的超额收益不那么确定，主要有正收益、微弱正收益及负收益三种结论。即使主并企业的超额收益为正，它也只占据小部分的并购溢价。

可见，当主并企业提出并购请求时，目标企业的决策是对自己有利则接受，采取合作态度，或者进行假意对抗，以获取更大的好处，此时，（假意对抗，并购）是纳什均衡；若对自己不利，则采取强硬的反并购措施坚决对抗，以使主并企业放弃并购，此时，（坚决对抗，放弃）是纳什均衡。

主并企业有自己的并购战略；目标企业也有其被并购与否的对策，也可以制定选择主并企业的标准进行搜寻和筛选，主动要求主并企业并购自己，以实现目标企业的股东价值最大化，如科利华软件集团在1997—1999如日中天而还没有借壳上市时，先后有st中燕（600763）、st西化机（000838）等数家壳公司主动前来洽谈请科利华入主事宜。有时，目标企业也会采用负债比例来显示自己的质量，Ross（1977）得出越是好的企业，负债率越高。目标企业接受并购或假意对抗，利用信息不对称设置并购陷阱的案例很多，如阿城钢铁（600799）看中了科利华的和软件概念，非科利华这个“大款”不傍，阿城钢铁巧妙利用了科利华急于想成为上市公司的心理，引诱科利华来收购自己，科利华没有认真对目标企业阿城钢铁进行尽职调查，就仓促拍板收购。并购后，目标企业方的内部职工股增值30多倍，可谓大获全胜；而科利华在借阿城钢铁的壳上市后不到三年，就沦为“St”一族，原因就是借壳上市时背上了沉重的债务负担。2004年12月7日，其股票的收盘价仅为1.53元，这与2000年初的38元多存在天壤之别。

有关对科利华收购阿城钢铁前因后果的详细，请参见专著《并购投资致胜——目标企业选择论》。

2001年全球股灾难时，网易公司曾请求金山公司收购自己，金山公司没看到网易公司的前（钱）景拒绝收购；现在的网易却不可同日而语，随时可以收购金山，这说明目标企业会积极进行被并购，主并企业有时也会错过好的目标企业，主并企业和目标企业之间并没有必然的界线，不同时期是可以换位的。“师夷长技以制夷”，本论文对主并企业了解和消除关于自己和目标企业之间的信息不对称、避免并购陷阱也具有重要的借鉴意义。

文献：

[1]Davidp.Baron.　tenderoffersandmanagementResistance.JournalofFinance，Vol.38，no.2，may1983，pp331—343.

[2]Gunthertichy，Vienna.whatdoweknowaboutSuccessandfailure0fmergers.eUnipb.doc，26.11.2001，　Journalofindustry，Competitionandtrade1（4），pp347—394.

[3]DrewFudenberg＆Jeanrirole，Gametheory，mitpress，1991.

[4]ericRasmusen，Gamesandinformation（2ndedition），oxford：BasilBlackwell，1994.

[5][美]J.纳什著，张良桥译。纳什博弈论论文集[m].首都贸易大学出版社，2000.

[6][美]J.海萨尼，郝朝艳译。海萨尼博弈论论文集[m].首都经济贸易大学出版社，2003.

[7][德]莱因哈德。泽尔滕著，黄涛译。策略理性模型[m].首都经济贸易大学出版社，2000.

[8][美]罗杰。B.迈尔森著，于寅译。博弈论——矛盾冲突分析[m].经济出版社，2001.

[9][加]马丁小奥斯本等著，魏玉根译。博弈论教程[m].中国出版社，2000.

[10][美]史蒂文。J.布拉姆斯等著，王雪佳译。双赢之道[m].中国人民大学出版社，2002.[11][美]R.艾克斯罗德。对策中的制胜之道——合作的进化[m].上海人民出版社，1996.

[12]张维迎。博弈论与信息经济学[m].上海三联书店与上海人民出版社，1996.

[13]李保明。效用与纳什均衡选择——对协凋与合作的探讨[m].经济科学出版社，2003.

[14]黄旭。论兼并中目标企业经营者的理性行为[J].中国城市，2000，n0.2，p37—39.

标准式博弈的混合战略十篇

标准式博弈的混合战略篇1

标准式博弈的混合战略篇2

标准式博弈的混合战略篇3

标准式博弈的混合战略篇4

标准式博弈的混合战略篇5

标准式博弈的混合战略篇6

标准式博弈的混合战略篇7

标准式博弈的混合战略篇8

标准式博弈的混合战略篇9

标准式博弈的混合战略篇10

相关作文

小学作文

初中作文

高中作文

作文体裁