博弈论定义十篇

发布时间：2024-04-29 17:30:50

博弈论定义篇1

关键词：新闻传播学博弈论方法

问题的由来

新闻传播学比之其他社会人文学科，方法论的研究尚未深入，本文所要论及的新闻传播学研究中的博弈论方法，就表现得比较典型。

将博弈论与新闻传播学相交叉的思路，在上个世纪80年代社会科学方法论讨论最热烈的时候，新闻理论界尚无人提到。后来新闻学与文化学、新闻学与心理学、新闻学与美学、新闻学与社会学等的研究，开始陆续出现。但新闻理论界在新闻交叉边缘学科研究过程中，一直没有很好地重视新闻传播博弈学的研究。作者在1997年复旦大学新闻学院做访问学者一段时间，涉猎了一些有关博弈论的论著，产生了新闻学、传播学与博弈论之间关系的简单联想。这种联想主要是对新闻文化学建构来讲的，从新闻文化的外延角度来看，新闻传播的竞争生态研究，不能缺少博弈论的思想。

上个世纪90年代之后，有关博弈论的书籍开始增多，后来出现了普及性的博弈论读物，这些书籍大都将社会生活、经济领域、历史经验等方面内容，与各种博弈类型相类比，说明博弈论的道理，但也带来某些副作用，即博弈论的庸俗化。在这样一种背景下，“博弈”一词在新闻报刊、文章论著中出现的频率比较高。新闻传播与博弈的关系，真正被新闻传播理论界重视，是在2004年第八次传播学研讨会上，会上提出“传播即博弈”的观点，并存在争议。2008年10月，孙光海、陈立生的《传媒博弈论》由三联书店出版，有论者认为这是我国第一部把博弈论引入传媒领域的成功力作。

从新闻传播理论界涉及新闻传播与博弈论关系的话题，或在文章论著中有意识地使用“博弈”概念来看，可以分为以下三种情况：

一是狭义基础上的理解。仅仅从传媒市场竞争的角度，来研究新闻传播的博弈。如《传媒博弈论》一书，“将四大主流门户网站、两家中央重点新闻网站、四大城市的13家都市报作为研究对象，对各大媒体平时新闻报道及当时的社会背景和特定环境进行分析，从新闻到版面到受众再到发行，通过大量案例剖析与实战推演，总结出各大媒体在不同环境下，针对不同的竞争对手以及竞争对手采取的策略，从而制定最佳策略。内容包括网络媒体博弈、都市报博弈、网络媒体与传统媒体博弈、热点新闻与冷门新闻、大新闻与小新闻博弈等”。当然，从最严格意义上来看，该书许多内容还停留在下文所提及的第三种认识上。但就分析比较到位的有关传媒博弈的内容来看，完全是从社会主义市场经济的媒体之间竞争策略着眼，探求媒体的生存之道。

二是广义基础上的理解。从博弈论的广义思想出发，来探讨新闻传播领域中，如何把握新闻活动的规律，有学者称之为“大博弈的思维观”。实事求是地说，新闻传播理论界在这方面的论述还较少。人们由于对博弈论的跨学科性质意义尚不十分了解，所以对这种广义理解还持较为消极的态度。传播与博弈是两个概念，但并不意味着传播不能用博弈观点去研究。小约翰将博弈论研究归入人际传播理论，说明他已经把博弈论纳入到传播学视野了，不存在谨慎与否的问题。小约翰在《人类传播理论》的前面部分特别提到传播学的学科边界问题，即所有社会科学理论都存在传播的问题，传播学强调传播的双向性，恰好说明了与博弈论的紧密联系。另一位讨论者强调：“用博弈论解释一般传播现象的做法不可取。”这是基于“传播即博弈”这一命题而得出的观点。应该说“传播即博弈”是不对的，但“传播之中有博弈”，“博弈之中有传播”，在一般的传播现象中存在部分博弈现象，也是不争的事实。而且，我们注意到，在正常的新闻传播过程中，传受双方理性的情况还是较为普遍的。那种强调博弈论研究对象必须是理性的，从而认定传播学一般现象无法以博弈论进行解释，不尽妥当。我们知道，传播模式研究的前提，也要求理性的状态。[www.]

三是日常通俗语义基础上的理解。一般是指事物之间相互影响、制约，或传统哲学所说的作用与反作用意义层面，来使用“博弈”概念。诚然，博弈论研究确实离不开这些因素，但所有事物间的这些因素，不一定都是博弈论所讲的博弈。也有在互动反馈意义层面，来理解博弈的，比起前者进了一层，然而也不十分确切。如诸多文章中的“不同文化与黄色新闻的博弈”、“媒体道德与新闻价值的博弈”、“新闻规律与媒体利益的博弈”、“隐私权与新闻自由的博弈”、“政府与新闻界的博弈”、“博弈海量信息”等。其中有些文章也道出了某些新闻传播博弈行为，但存在将博弈论泛化的情况。如有论者把主观上的意识与客观上的行为看做一组博弈现象，把社会上普遍存在的观念或做法与某一具体的观念或行为看做一组博弈现象，这都是与博弈论不相契合的。我们只能说是直觉地使用了博弈这一名词，而没有从博弈论的理论角度去进行规范的研究。

本文的重点不在于专门提倡新闻传播学研究的博弈论方法，而是力图客观地思考博弈论方法在新闻传播学研究中，究竟能否作为一种研究视角，起到对新闻传播学研究的建构作用，甚至形成新闻传播博弈论这一新闻传播学的分支学科。

博弈论在新闻传播学研究中的可能性德国著名数学家哥德尔1931年提出不完备性定理：第一不完备性定理———任意一个包含算术系统在内的形式系统中，都存在一个命题，它在这个系统中既不能被证明也不能被否定。第二不完备性定理———任意一个包含算术系统的形式系统自身不能证明它本身的无矛盾性。这个定律虽然是针对数学来说的，但是其革命意义远远涉及科学哲学、逻辑学，而这种情况也注定要影响社会科学研究领域。诚然，新闻传播研究中，也不能将博弈论看做是无所不能的理论。我们研究博弈论在新闻传播研究领域的运用可能性，目的主要是运用其基本思想，扩展研究视域，在新闻传播领域内最合适的地方，找到双方的契合点，从新的角度描述新闻传播现象与活动的规律，调整我们的传播行为，使社会信息资源得到有效的配置。

博弈论最基本的思想，其一，在同一活动中，某事物的行为效果如何，有赖于它事物的行为。其二，是均衡概念。其三，假设人是理性的。理性的人，指行动者具有一定的逻辑推理能力，进行决策选择策略的目的就是自身利益的最大化。现实生活中，人们在作决策时可能往往是有限理性。其四，博弈论是竞争与合作的游戏，一般有协议契约。根据以上的简单概括，随之需要思考的问题就是，新闻传播现象与活动过程中，有没有相类似的情况？其一，在同一新闻传播活动中，双方各自的行为要视对方的行为而定？其二，均衡概念在新闻传播过程中能否实现？其三，新闻传播活动的行为主体是不是理性的？情况允许的话，自己的利益最大化是否是追求的目标？其四，竞争与合作的契约关系，在新闻传播过程中能否建立？答案是倾向积极的。

有了上述基本思考，我们再从更大一些的方面来探讨运用博弈论的可能性：

哲学意义。马克思主义强调经济基础决定上层建筑、意识形态，即经济的因素在社会生活、交往关系中的普遍性、基础性。虽然，马克思主义承认社会历史的发展有着诸多的因素，正如恩格斯所说的“平行四边形”合力作用，但归根结底的因素是生产力与生产关系的矛盾对立统一。

博弈论之所以在经济领域呈现出活跃的情况，人们之所以在各类社会活动、人际关系中发现博弈的因素，是因为人们在生产劳动过程中结成的各种交往关系所决定的。新闻传播现象与活动，归根结底是由交往关系决定的。因此，博弈论在新闻传播研究领域的运用也具有一定的广泛性。

我国社会主义市场经济建立之后，包括新闻传播业在内的文化产业，亟须建立一套新型的适应这一体制状况的文化产业伦理。目前可以定义为在保证社会效益的前提下，力求社会效益与经济效益的双赢，这就和博弈论中核心理论之一的“均衡”概念相暗合。每一次新闻传播策划、新闻报道活动或具体的新闻传播行为，都存在博弈论的问题，因为在某一次传播活动中的传播者之间、传受之间等，都有一个行为对策选择的问题，在现实环境中不可能不追求利益的最大化。如果不追求个体局部利益的最大化，可能追求的就是整体国家民族利益的最大化，如我国文化产业的双赢策略，即博弈论的“均衡”。公益与私利、赢利的矛盾，在社会主义初级阶段会一直存在，博弈的均衡可达到社会发展的和谐。

社会科学理论范式也有一个工具理性与价值理性的统一问题。

方法论意义。我们知道，博弈论最初作为应用数学的一个分支，是运筹学下面的对策论。后来应用于经济领域。在西方发达国家，作为西方经济学前沿领域的博弈论，已逐渐变为一种占主流地位的基本分析工具，人们十分重视其方法论意义。

从中国的传统文化来说，经史子集弈的思想无处不在。过去曾有学者提出这样的观点，自然科学最基础的学科是数学，而社会科学的基础可以是博弈论。我们不能说它完全正确，但是至少应该承认有其一定的合理性。

从广义的角度看，传播应用学派的传播模式研究，实际上相当于博弈模型。在我国较为流行的英国人丹尼斯·麦奎尔、瑞典人斯文·温德尔合著的《大众传播模式论》中，许多传播模型十分典型地体现出这种情况。该书第一版介绍了35个传播模式，第二版介绍了66个传播模式。除了个别早期线性模式外，在控制论的反馈概念出现之后，传播模式越往后越具有博弈的性质，甚至可以这样说，研究当代传播模式离开了博弈的思维，其研究是存在欠缺的，虽然其模式可能并不能完完全全解决实际中的所有问题。

理论建构意义。新闻学、传播学以及中国化的新闻传播学，从它们的发生与发展的历史来看，是建立在众多人文社会科学基础上产生发展起来的。在自然科学、社会科学日益融合的时代，在需要破除自然与社会科学鸿沟的时代，谁也不能断然否定新闻传播学领域可以不要博弈论的参与。作为与社会实践互动频繁、联系紧密的社会科学之一的新闻传播学，从来不存在其他学科的不可逾越的障碍。

由于受经济学的影响，人们思考博弈论在新闻传播研究领域的运用时，可能认为仅仅反映在传媒的经营管理上。这种狭义的理解，导致产生了博弈论不适合一般新闻传播理论研究的观点。作者认为，新闻传播研究中重视运用博弈论，并不是要求新闻传播理论“范式”像经济学那样转向博弈论，并把它作为核心的理论分析工具，而是在理论体系建构中，对博弈论方法给予足够的重视，将其中合理的内容，吸纳到基础理论中来。更重要的是，将博弈思维作为指导理论研究的一个窗口，扩展新闻传播理论空间。当然，也可以建立新闻传播学下面的二级学科“新闻传播博弈理论”，进行专门的新闻传播学新领域探索。

结语

新闻传播研究对博弈论产生兴趣已有多年，但是博弈论在新闻传播研究领域被吸纳与运用的情况并不尽如人意，原因是新闻传播理论界对博弈论尚不太熟悉，对博弈论的理解也参差不齐，甚至还存在部分抵触心理，致使研究成果的质与量不甚理想。新闻传播研究需要理论创新，对理论与实践中出现的新情况、新问题提出新的解决路径。研究新闻传播博弈论，对理论研究者提出了知识更新的更高要求。

自然科学与人文社会科学、人文科学与社会科学、社会科学内部之间没有不可逾越的鸿沟。博弈论无论在广义、狭义还是方法应用上，在新闻传播研究领域都有用武之地，关键在于我们的观念。

参考文献

1.肯尼斯·赫文［美］、托德·多纳著：《社会科学研究的思维要素》，重庆大学出版社，2008年版。

2.施锡铨著：《博弈论》，上海财经大学出版社，2000年版。

博弈论定义篇2

[关键词]博弈论经典博弈模型博弈行为博弈决策

“博弈论”原本是数学的一个分支，但由于它较好地解决了对竞争等问题的可操作性分析，成为经济学中激荡人心的一个研究领域。可以说，“博弈论”已经改变了经济学的传统轮廓线。从对“博弈论”简要、通俗的介绍中可以发现，我们身边充满了博弈，或者说，我们身边的许多行为、现象都可用博弈来概括。“博弈论”不仅属于经济学，也理应属于社会学、政治学、心理学、历史学等，这些学科也有理由分享“博弈论”那旖旎的学术风光和精细的分析技巧。“博弈论”的英语原文是Gametheory，直译过来就是游戏论、运动论或竞赛论。譬如在足球比赛中，双方都想在努力巩固防守的同时，积极进攻以置对方于“死地”。这种行为就是一种博弈。“弈”在汉语中是下棋的意思，下棋中的双方行为特征也如同足球比赛中双方的行为。当然，扩展开来讲，企业之间的竞争、国家之间的角力等等，都是“游戏”，只是游戏的内容不同而已。

一、博弈简介

“博弈论”就是分析博弈行为和博弈决策的一门科学。

今年的诺贝尔经济学奖，已于前不久为“博弈论”研究专家罗伯特·奥曼和托马斯·谢林所获得，1994年度和1996年度的诺贝尔经济学奖，也分别由纳什、泽尔滕、海萨尼、莫里斯和维克瑞等“博弈论”专家分享。如此众多的“博弈论”研究专家的频频获奖，凸现了“博弈论”在主流经济学中日益重要的地位。

“博弈论”原本是数学的一个分支，但由于它较好地解决了对竞争等问题的可操作性分析，成为经济学中激荡人心的一个研究领域。可以说，“博弈论”已经改变了经济学的传统轮廓线。

我国古代有个“田忌赛马”的故事，说的是齐威王与大将田忌各出三匹马，一对一比赛三场，由于齐威王的最优、次优和较差的三匹马分别跑得比田忌的三匹马快，所以田忌总是以0∶3告负。后来田忌的谋士孙膑给田忌出主意，让最差的马去与齐威王最快的马比，而让最优的马去赢齐威王次优的马，让次优的马去赢齐威王最差的马，这样便以2∶1取胜。但我们还可进一步设想，如果齐威王知道了田忌的花招后，便会在以后的比赛中也更改出马的次序，当然田忌的出马次序也应改动。双方的出马次序怎样才是最合理的呢?这便是“博弈论”更深一层次研究的问题了。

二、一个非技术性的定义

博弈即一些个人、队组或其他组织，面对一定的环境条件，在一定的规则下，同时或先后，一次或多次，从各自允许选择的行为或策略中进行选择并加以实施，各自取得相应结果的过程。从定义我们可以看出，规定或定义一个博弈需要设定下面四个条件。

1.博弈的参加者。即在所定义的博弈中究竟有哪几个独立决策、独立承担结果的个人或组织。

2.各博弈方各自可选择的全部策略或行为的集合。即规定每个博弈方在进行决策时，可以选择的方法、做法或经济活动的水平、量值等。

3.进行博弈的次序。在现实的各种策略活动中，当存在多个独立决策方进行决策时，有时候需要这些博弈方同时作出选择，以为这样能保证公平合理，而很多时候各博弈方的决策又有先后之分，并且有时一个博弈方还要作不止一次的决策选择。

4.博弈方的得益。对应于各博弈方的每一组可能的决策选择，都应有一个结果表示该策略组合下各博弈方的所得或所失。

以上四个方面是定义一个博弈时必须首先设定的，确定了上述四个方面就确定了一个博弈。博弈论就是系统研究可以用上述方法定义的各种博弈问题，寻求在各博弈方具有充分或者有限理性、能力的条件下，合理的策略的选择和合理选择策略时博弈结果，并分析这些结果的经济意义、效率意义的理论和方法。

三、博弈的结构和博弈的分类

由于博弈研究的问题多种多样，因此博弈模型相互之间的差别可能会很大。这些差别可以理解为都是博弈问题的结果差别。当博弈结构有差别时，博弈的结果和分析方法往往也有不同，因此对博弈的结构特点有所了解是很有价值的，在此我们提出博弈论问题的分类和博弈理论的结构。

1.博弈中的博弈方：博弈中独立决策、独立承担博弈结果的个人或组织为博弈方。因此我们把博弈方分为“单人博弈”、“两人博弈”和“多人博弈”。这里的“单人博弈”和“两人博弈”，并不一定是自然人，而是指前面所说的博弈方，既可以是个人，也可以是经济社会组织。

2.博弈中的策略：博弈中各博弈方的策略内容称为“策略”。

3.博弈中的得益：得益即参加博弈的各个博弈方从博弈中所获得的利益，它是各博弈方追求的根本目标，也就是他们行为和判断的主要依据。

(1)零和博弈：它是常见的博弈类型，同时也是被研究得最早、最多的博弈问题。

(2)常和博弈：它也是很普遍的博弈类型。常和博弈可以看作零和博弈的扩展，零和博弈则可以看作常和博弈的特例。

(3)变和博弈：零和博弈和常和博弈以外的所有博弈都称为“变和博弈”。

(4)博弈的过程：博弈的过程也是博弈结构的重要方面。根据博弈过程方面的这些差异，博弈问题通常分为“静态博弈”、“动态博弈”和“重复博弈”几个大类。

①静态博弈：所有博弈方同时或可看作同时选择策略，采取行动的博弈是静态博弈。

②动态博弈：指博弈方的选择和行动有先后之分，后行者可以根据先行者的策略选择来决定自己的策略。

③重复博弈：所谓重复博弈实际上就是同一个博弈反复进行所构成的博弈过程。构成重复博弈的一次性博弈也成为“原博弈”或“阶段博弈”。

我们研究的大部分是重复博弈的原博弈都是静态博弈，或者说是由静态博弈构成的。这种由同样一些博弈方，在完全同样的环境和规则下重复进行的博弈，在现实中有很多实际的例子。如：体育竞技中的多局制比赛、商业中的回头客问题、企业之间的长期合作或竞争等等，如果不考虑环境条件方面的细小变化，都可以看作是重复博弈问题。

5.博弈的分类和博弈理论的结构

博弈结构这些方面的差异对博弈结果和博弈分析都有重要的影响，而且博弈分类相互之间都是交叉的，并不存在严格的层次关系，但我们还可以根据各种分类对博弈分析方法影响程度的大小排除大致的次序。

(1)是分为合作博弈与非合作博弈。如果各博弈方能达成某种有约束力的契约或默契，以选择共同的策略，此种博弈就是合作博弈。反之，就属于非合作博弈。

(2)是分为零和博弈、常和博弈与变和博弈。

(3)是分为静态博弈与动态博弈。

(4)是分为完全信息博弈与不完全信息博弈。在前一种博弈中，每一个参与者都拥有全部的相关信息，只拥有部分相关信息的便属于后一种博弈。

四、“博弈论”中的经典博弈模型

根据博弈定义，小到企业之间的竞争和合作，国家之间的倾销反倾销、制裁和报复等，都有可以归结为博弈问题。“博弈论”中有一些由点及面、发人深思的经典案例，这些案例不仅使专业研究人士如醉如痴，也使一些普通民众兴致盎然；不仅成为“博弈论”中的一道亮丽风景，也是整个经济学领域中的学术奇葩。

博弈论定义篇3

关键词：博弈论；田忌赛马；一般扩展式

一、什么是“博弈”

博弈论的思想最早可以追溯到18世纪，但真正作为一种理论研究则始于20世纪20年代，公认的开山之作是1944年出版的由科学家冯诺依曼和经济学家奥斯卡摩根斯坦恩合著的《博弈论与经济行为的理论》一书。此时，“博弈论”才作为一个完整的新名词被提了出来。此后，国内外对博弈论有了广泛的研究，博弈论取得了长足的发展。国内方面，关于博弈论的文章、专著不胜枚举，各位学者对“博弈”一词的认识或定义也存在偏差。

按照《现代汉语词典》的解释，“博”是丰富多彩的意思，而“弈”则指下棋、打牌等对抗性游戏，因而“博弈”就是指丰富多彩的对抗性游戏。①在英文中，“博弈”一词是“game”的复数，表示各种各样的游戏。因此，汉语中的“博弈”与英语中的“game”意思完全一致。“博弈”与“游戏”有这密不可分的联系。

学者王俊冰对“博弈”一词有着不同的理解。他指出：博弈的“博”字是竞争的意思，“弈”是对弈，是一种关于在竞争中选择策略，争取最好结果的技艺。②概括来讲，博弈是一种技艺。学者郭磊认为：博弈的基本意思是弈棋，博弈本身是一种游戏，但博弈更强调谋略……博弈则可能是一系列策略与行动的组合体，并且是一个由始而终并产生结果的完整过程。③可以理解为博弈是一个过程。还有学者认为：博弈即一些个人、队组或其他组织，面对一定的环境条件，在一定的规则下，同时或先后，一次或多次，从各自允许选择的行为或策略中进行选择并加以实施，各自取得相应结果的过程。④

二、“田忌赛马”概述

忌数与齐诸公子驰逐重射。孙子见其马足不甚相远，马有上、中、下辈。于是孙子谓田忌曰：“君弟重射，臣能令君胜。”田忌信然之，与王及诸公子逐射千金。及临质，孙子曰：“今以君之下驷彼上驷，取君上驷与彼中驷，取君中驷与彼下驷。”既驰三辈，而田忌一不胜而再胜，卒得王千金。于是忌进孙子于威王。威王问兵法，遂以为师。”⑤这是我国“田忌赛马”故事的原型。这个故事可谓是众所周知了，该故事发生在战国时期，齐威王和大将田忌赛马，根据马跑的速度双方各有上、中、下三种等级马各一匹，其中田忌的马比同一等级齐王的马跑得慢，但比齐王低一级的马跑得快。比赛规则为三局两胜制，每局比赛各出一匹马，负者向胜者支付黄金⑥一千，显然相比之下齐王的马占优势。在第一次比赛中，田忌以上等马对齐王的上等马，以中等马对齐王的中等马，以下等马对齐王的下等马，结果连负三局。在第二次比赛中，田忌采纳孙膑的建议，以下马对齐王的上马，以中马对齐王的下马，以上马对齐王的中马，结果胜两局负一局，赢齐王一千金，而自以为胜券在握的齐王反而输掉一千金。

首先要从语言上分析一下这个典故。“孙子见其马足不甚相远”这一句是前提，否则这个故事就不会发生。我们可以这样理解这句话，即“齐威王和田忌的马根据速度划分各有上、中、下三种等级各一匹，其中田忌的马比同一等级齐王的马跑得慢，但比齐王低一级的马跑得快”。假如齐威王的马按速度由快到慢分为a1、a2、a3，田忌的马由快到慢分为B1、B2、B3，那么这六匹马由快到慢依次是a1、B1、a2、B2、a3、B3。另外，还有一处是学者研究中普遍遗漏的，即“及临质”三个字，这一句起到了至关重要的作用。这句话在这个故事中应该翻译为“等到将要开始比赛的时候”，那么这句话告诉我们一个什么讯息呢？我认为是说孙膑献计田忌改变马的出场顺序这一情况并不为齐威王所知，这也成就了田忌在第二轮赛马中能够胜出的重要因素。“威王问兵法，遂以为师。”这一句也是关键所在，通过这一句话得知，齐威王并不知道自己是怎么输的，所以请教孙膑。假设如果齐威王知道其中玄机的话，那么田忌将必输无疑。以上三点是“田忌赛马”故事得以出现的基本前提。

而我国关于“田忌赛马”博弈论研究的相关论著可谓不少，但鲜有人认真透彻地分析这个故事的原型，殊不知这关系到“田忌赛马”是不是博弈、是怎样的博弈等问题。在以往的文献中，王俊冰在《白话博弈论》一文中指出“田忌赛马”是一个非合作博弈；詹国枢在《博弈处处有，几人能识之》中指出“田忌赛马”是博弈论的实际运用，是典型的博弈案例；周瀚光认为“田忌赛马”是一个“二人有限零和博弈”，⑦但他并没有首先从语言学的角度分析这个故事的前提；此外学者袁国强、和蔚、逯彦彦、郭鹏等等均指出“田忌赛马”是一个博弈，但没有深入分析它到底属于什么类型的博弈，是怎样博弈的等问题。

三“田忌赛马”的博弈论分析

前文分析了该故事的三个前提，一、田忌的每等级的马均次于齐威王同等级的马，但强于齐威王下个等级的马；二、齐威王事先不知道田忌临阵改变了马的出场顺序；三、齐威王不知道改变马出场顺序其中的玄机。本文以下的分析均基于此三前提。

首先要从博弈论定义上理解“田忌赛马”。很明显，“田忌赛马”确实符合“博弈”的定义，但现在言“田忌赛马”就是博弈还为时尚早。

其次需要分析“田忌赛马”是否具备博弈理论的基本要素。国内学术界对博弈论基本构成要素有分歧，基本分为两派。一派认为博弈论要素有四方面，即博弈的参加者、策略、进行博弈的次序、博弈的信息。但是主张博弈理论四要素这一派内部也有分歧，学者胡静认为博弈理论的第四个构成要素是“博弈方的得益”，⑧而不是博弈的信息；另一派认为博弈理论具有五方面的要素，即博弈的参加者、策略、进行博弈的次序、博弈的信息、博弈方的得益。可以清晰地看出后者对博弈理论的要素有了一个完整的归纳。那么“田忌赛马”是否具备五个要素呢？齐威王和田忌是博弈的参加者；策略选择按照排列组合来计算共有六种（这里不详细叙述）；博弈的次序是双方非同时决策，齐威王是先手；博弈的信息是不完全的，齐威王不知道田忌策略的变化；得益是每胜一局有一千金的奖励。通过分析这些要素，我们得出一个结论，即“田忌赛马”是一个完整的博弈。

最后要弄清楚“田忌赛马”到底属于什么类型的博弈。首先要了解一下博弈论的分类情况。（1）合作博弈与非合作博弈。如果各博弈方能达成某种有约束力的契约或默契，以选择共同的策略，此种博弈就是合作博弈。反之，就属于非合作博弈。（2）零和博弈、常和博弈与变和博弈。这是按得益情况划分的，一方得益必来自一方损失，这种博弈是零和博弈。常和博弈又叫非零和博弈，指博弈各方得益之和不为零。变和博弈中各方得益之和不确定，这是最一般的博弈，常和博弈和零和博弈是它的特例。（3）静态博弈与动态博弈。根据博弈的次序，即参加者策略选择并行动的先后次序博弈可以分为静态博弈和动态博弈。静态博弈指参加者可同时决策并行动的博弈，并不考虑决策的次序问题。动态博弈指参加者先后、依次决策并且后行动者能够观察到先动者所选择的策略和行动。⑨（4）完全信息博弈与不完全信息博弈。在前一种博弈中，每一个参与者都拥有全部的相关信息，只拥有部分相关信息的便属于后一种博弈。⑩博弈理论按照不同的标准基本可分为以上四种情况。

“田忌赛马”这个典故是非合作博弈，也是零和博弈，这在上文中已经提到。同时，依据上文的三个前提，它同时也是一种不完全信息状态下的动态博弈。

四“田忌赛马”博弈的一般扩展式及其序列均衡

上文我们提到“田忌赛马”博弈是非完全信息动态博弈，而这种博弈则是博弈论中最为复杂的模型，也称动态贝叶斯博弈。序列均衡是非完全信息动态博弈的核心概念。

一个动态贝叶斯博弈的扩展式为=﹛n，H，p，i，p，u﹜，其中n为参与者集合，n=﹛0，1，2，…，n﹜，0代表自然。B11H为全历史集合，即从博弈开始到博弈结束所有可能的行动序列﹛a0，a1，…，am﹜，m为任一自然数，表示一个全历史包含的行动次数。p为参与者函数即对于每一个子历史h，p（h）将其映射成自然或是其他参与者。i为信息空间。p为自然的概率分布函数，其表示当自然行动时，自然以多大概率选择某个行动。u表示参与者的偏好，其定义是在全历史结果上的收益函数。B12

在“田忌赛马”博弈中，参与者集合n=﹛0，1，2﹜，0代表自然。H是全历史集合，表示所有可能的行动序列﹛上中下，上下中，中上下，下上中，下中上，中下上﹜，即共有六个可能的行动。在此博弈中，由于是齐威王先行动，所以无论马出场顺序如何，作为自然的孙膑总是可以帮助田忌，以下等马对上等马，以中等马对下等马，以上等马对中等马（顺序无先后），这样如果把三场全胜看做“1”的话，那么田忌总有“2/3”的收益。也就是说田忌有100%的可能获得2/3的收益。齐威王由于过分自信或者智商不高，未能识破此中玄机，所以败下阵来。但在现实生活中，一方的决策是严格保密的，作为自然的“孙膑”并不可能事先知道“齐威王”的决策，而齐威王有六种行动序列，相对应，“田忌”也有六种，我们说过，只有一种情况可以助“田忌”胜出，所以“田忌”获胜的概率仅为1/6。p为参与者函数即对于每一个子历史h，p（h）将其映射成自然或是其他参与者。在此博弈中，假设一个子历史“上中下”，那么p（h）作为一个映射将有六种；一共有六个子历史，所以p（h）应该有36种。i是信息空间。假设i1是齐威王的信息空间，i1=﹛上中下，上下中，中上下，下上中，下中上，中下上﹜，i2同i1，因为他同样不知道对方的策略。

在“田忌赛马”这个非完全信息动态博弈中，还有一个很重要的因素需要我们注意，即参与者可能临时改变策略，这也更带来了决策的复杂性和不稳定性。因为一场赛马是由三局比赛构成的（非同时进行），假设第一局结束后，参与者肯定要根据这一局得结果变换策略，同时也能观察到一部分对方的策略，这么说来，双方获胜的概率就不是齐威王5/6，而田忌1/6的概率了，需要更复杂的计算。

客观而言，直到今天理论界也没有找到能适用所有非完全信息动态博弈的均衡概念，也缺乏一个普遍的方法来求解动态博弈的序列均衡。B13

结论

“田忌赛马”博弈不是人们想象中的那么简单的一个博弈，反而是博弈类型中最复杂的非完全信息动态博弈，应该对这个博弈有一个全新的认识。并且，在这个博弈中，至少包含着两个子博弈，这更加剧了此博弈的复杂性。博弈论思想虽然在实际生活中适用性差，但它教会我们一种思考问题的方法，对合理规避风险，获取最大收益还是有指导意义的。（作者单位：四川大学）

注解

①姚国庆：《博弈论》，北京：高等教育出版社，2007年，第1页。

②王俊冰：“白话博弈论”，《理论学习》，2006年第6期，第63页。

③郭磊：“博弈论简论”，《山东经济》，1999年第6期，第17页。

④胡静：“博弈论在数学中的应用”，《商情》，2006年第4期，第213页。

⑤《孙子吴起列传第五》，《史记》卷六十五，中华书局，2007年4月。

⑥“黄金”在古代是一种货币，不同于现代意义上的黄金；“黄金一千”只一千两黄金的意思。

⑦周翰光：“论孙膑的对策论和辩证法”，《齐鲁学刊》，1984年第3期，第36页。

⑧胡静：“博弈论在数学中的应用”，《商情》，2008年第5期，第213页。

⑨逯彦彦：“博弈论前瞻探讨”，《商丘职业技术学院学报》，2009年第1期，第33页。

⑩胡静：“博弈论在数学中的应用”，《商情》，2008年第5期，第213页。

11“自然”指在动态贝叶斯博弈中参与博弈，无收益，但可以决定不同历史发生概率的参与者。

博弈论定义篇4

【关键词】互惠理论/生物学哲学/形而上学/利他主义/博弈论

【正文】

近几十年来，与生物学突飞猛进的发展相应，国际生物学哲学界的研究异常活跃，文献大量涌现，涉及的领域十分广泛。国内科学界和哲学界对于国际生物学哲学的活跃景象作出的反应不多。而在这不多的反应中，70—80年代主要是对分子生物学哲学问题的关注，80—90年代主要是视野向生命伦理学和生态哲学的扩展。这两个方面所涉及的生物学对象，从尺度上看分别是生命的微观结构和宏观现象，从性质上看分别是纯粹生命现象和生命与社会的关系。动物行为学（ethology）的研究对象无论是从尺度上还是从性质上看，均介于这二者之间。近20年来，以这门学科为中心，旁及理论生物学尤其是行为生态学（behavioralecology）等领域，新发现的科学事实、对这些事实的理论解释、关于这些解释的哲学分析相互交错，构成了科学观察、数学建模、方法论探讨共同推进的局面。这方面的研究迄今在国内学术界很少见诸文献。本文拟对这一领域中的互惠利他主义的博弈论模型及其形而上学预设进行哲学分析，以引玉之砖，促进国内哲学界对于动物行为学进展及其哲学问题的关注。

自然选择论与亲缘选择论的困难

达尔文生物进化论的核心是自然选择学说。按照这个学说，物种在生存斗争的过程中，经过自然选择的作用，逐渐产生新的物种，实现生物的进化。[1]自然界的有些现象可以用生存竞争直截了当地作出解释。南极洲帝企鹅在下水之前为了确定水中是否有海豹，有时相互往水中推拥。黑头鸥为了免除捉鱼之苦，往往趁附近成鸥不在巢中时捕食其雏鸥。雌螳螂为图觅食之便，甚至寻找机会吃掉与之交配的雄螳螂。这些都是生存竞争的极端例子。

但是，生物界似乎还存在利他行为。有不少鸟在察觉到捕食飞禽出现时，会发出警叫声让同伴逃避，自己因警叫却处于危险境地。汤姆森瞪羚在发现捕食者时，会通过跳跃向同伴发出信息，而使自己暴露在捕食者面前。鸟的警叫和瞪羚的跳跃看上去好像都是自我牺牲行为。但是，这些行为实际上也是个体的一种生存策略。察觉到捕食飞禽的鸟如果不发出警叫，其他仍在活动的鸟就会把捕食者的注意引向它自己周围，给包括自己在内的鸟群带来危险。因此，发出警叫比不发出警叫更好。当然，警叫还是有一定的危险，不过警叫时容易暴露声源的鸟会被自然淘汰。此外，捕食者首选的猎物是容易捕获者，因此瞪羚的跳跃是显示自己身强力壮，其目的在于让捕食者去捕食体弱无力者。这样看来，鸟的警叫和瞪羚的跳跃不过是“主观”为自己，客观为他者而已。

与鸟的警叫和瞪羚的跳跃相比，生物界还盛行着利他者甚至“主观”上也不为自己的自我牺牲行为。亲代付出精力、时间和能量孕育、喂养和保护子代，而自己一般不得益，这几乎是动物界的普遍现象。蜜蜂中的工峰自己不生育，只承担筑巢、采蜜、养幼蜂等工作。如果遇到掠夺蜂蜜者，工蜂还得刺螫掠夺蜂蜜者，自己却因刺螫中内脏拖出体外而死亡。对于这些纯粹的利他行为，经典的自然选择学说难以作出令人满意的解释，因为利他的有机体与那些不付出代价而在被帮助中受益的有机体相比，在生存斗争中应当有劣势而不能进化。所以初看上去，似乎接受自然选择说就不能承认利他行为的存在，而事实上这种行为确然存在。

为了解释利他行为的存在，汉密尔顿（williamhamilton）提出了亲缘选择理论，　并且建立了相应的数学模型[　2]，后来道金斯（richarddawkins）对其基本思想作了进一步阐发[3]。简单说来，这个理论认为，近亲之间利他行为的存在和进化，是由于有机体只是基因的载体。自私的基因控制着个体的行为，使自己的拷贝得到保存和大量繁殖，而近亲具有共同基因的比例大，这就决定了近亲之间在必要时要采取利他行为。亲代生育和抚养子代自己不得益，是因为子代的基因来自父体和母体的各占1／2。工蜂自杀性地保护蜂蜜，是因为巢中与它有相同亲代的蜜蜂的基因有1／2与它的相同，并且这些蜜蜂的子代的基因还有1／4与它的相同。为了相同基因的利益，它必须做出牺牲。亲缘选择理论部分解释了近亲之间存在利他行为的现象，但是却不能解释非近亲有机体之间存在的利他行为。[4]

标准迭演囚徒困境博弈模型

面对经典自然选择说和亲缘选择说面临的困难，生物学家们诉诸互惠利他主义。初略地讲，互惠利他主义之所以进化，是因为一个有机体付出代价帮助另一个有机体，可以在下一次受益于另一个有机体的帮助，这样获益更大。这里，“互惠利他主义”是指两个有机体之间交换适合度（fitness）代价和利益的行为。为了精确地发展这一思想，生物学家们广泛使用博弈论模型。在这些博弈论模型当中，以二人迭演囚徒困境博弈最为基本。

囚徒困境博弈源自关于两个合伙犯罪者的传说。[5]这两个被捕的囚徒在警方面前要么合作（保持沉默），要么背叛（坦白），不可抗拒。如果二人都保持沉默，他们在受审期间就会处于禁闭状态，但在不长的时间比如说6个月之后就会获释。如果二人中的一人供出对同犯不利的证据，他（或她）就将作为证人逍遥法外，而另一个囚徒则不得不承担全部法律责任，譬如蹲5年监狱。如果两个囚徒都坦白，二者都将承担蹲2年牢的刑事责任。显然，背叛是最佳选择，但是，如果二人都沉默就会比二人都背叛的结果更好。于是，合作还是背叛，就成为一个二难困境。这个博弈刻划出博弈者利益部分冲突的情况，被许多研究领域作为一种有效的分析手段而广泛采用。据统计，迄1980年止，关于囚徒困境博弈的科学出版物已达数千篇（部）之多。[6]

特里弗斯（roberttrivers）最早采用囚徒困境博弈，提出了描述互惠利他主义行为的自然选择模型。该模型说明了自然选择在系统中如何不利于骗子（非互惠者）。[7]阿克塞尔罗德（robertaxelrod）与汉密尔顿[8]以囚徒困境博弈境况中的进化稳定策略概念为基础，发展了这个模型。这两篇论文已经成为现代经典，引用它们的文献已近千篇。在这两篇论文的基础上，关于互惠性的囚徒困境建模工作不断深入。

用囚徒困境博弈的语言来说，有机体的行为受其采取的策略支配，而这种策略就是使用合作与背叛手段的规则。譬如全背叛策略，博弈者在每一步博弈中都背叛。再如一报还一报策略，博弈者在第一步合作，然后采用其对手在上一步采用的手段。在非零和博弈中，孤立地看，不存在最佳策略。策略的优劣取决于该策略本身以及与之遭遇的种种策略的性质，还取决于遭遇到的各种策略相互作用的历史。阿克塞尔罗德组织了两次计算机竞赛，由自愿参赛者提交博弈策略程序参赛。两次竞赛中提交的程序分别有14和62个，结果都是一报还一报获胜。[9]一报还一报能够成功，是因为它引诱对手合作，而当帮助得到对手的有条件报答时，这样的帮助就有利。显然，这是一个基于合作的策略。进一步的理论分析表明，以互惠性为基础的合作能够在一个自私的世界中开始，还能够在与范围广泛的其他策略相互作用的同时兴盛起来，并且能够对抗其他策略的侵犯。[10]

一些观察结果进一步确证，没有亲缘关系的有机体之间的合作可以是稳定的。鲈鱼具有雌雄两性器官，充当雌性角色就要高投资（产卵），充当雄性角色则是低投资（给卵受精）。两尾鲈鱼之间的交配大致是轮流充当雌雄性角色，如果性角色分工不平等，那么这种关系就会破裂。[11]虹＠①群易于遭受肉食动物的进攻，所以有时就需要有一两尾虹＠①离群探察肉食动物是否有进攻的先兆。如果两尾虹＠①前往探察，那么每尾虹＠①都有接近该肉食动物（合作）和畏缩不前（背叛）两种选择。如果两尾虹＠①同时探察，那么两尾虹＠①被吃掉的危险就会减少。[12]

在动物行为学中，囚徒困境博弈可用以下支付矩阵表示：

附图

支付（payoff）是两个博弈者在实施一定的策略后出现的后果。r、t、p和s表示对有机体的适合度支付。每一对后果中的第一个字母表示对于博弈者1的支付，第二个字母表示对于博弈者2的支付。r是对二者合作的奖励（reward），t是对背叛的诱惑（temptation），p是对二者背叛的惩罚（punishment），s是对傻瓜（sucker）的欺骗。绝大多数生物学文献都认定，囚徒困境由两个必要条件决定，这就是：（1）对手合作，自己背叛结果最好，对手背叛，自己合作结果最差，双方合作比双方背叛结果要好，就是说支付值的大小顺序为t＞r＞p＞s。这是指令条件。（2）对双方合作的奖励比对背叛的诱惑和对傻瓜的欺骗的平均效果好，即r＞（t＋s）／2。这是反剥削条件。满足这两个条件的博弈，就被称为标准囚徒困境。在这两个条件中，指令条件使博弈者面临困境，反剥削条件使博弈者不能通过轮流互相剥削来摆脱困境。在单局性的以及局数一定的囚徒困境博弈中，虽然相互合作比相互背叛好，但每一个博弈者通过背叛却可以最大限度地增加自身的利益，行为自私的有机体应当比利他主义者做得更好。[13]合作之所以进化，是因为博弈双方还有相遇的机会，博弈还可以多次进行。在重复次数不定的博弈，即迭演博弈中，合作可以出现并且能够稳定下来。像一报还一报策略的成功，就解释了在亲缘和群体选择未发生的情况下合作可以变得稳定的原因。

互惠利他主义的必要条件

阿克塞尔罗德和汉密尔顿用标准迭演囚徒困境为分析互惠利他主义的进化奠定了基础之后，生物学家们对这个基础的坚实性曾经提出过一些疑问，其中最主要的批评有两点，一是认为单局囚徒困境表示的是互助而不是互惠，二是认为互惠利他主义需要利他滞后发生的机会。[14]针对这些批评，博伊德（robertboyd）提出，迭演囚徒困境中的互惠行为是滞后的并且发生于延续的时间之中，从而为囚徒困境作为互惠利他主义的恰当模型作了辩护。[15]最近，日本学者研究了点阵结构种群中合作的进化[16]，瑞典学者提出了研究迭演博弈的状态空间法[17]，等等。这些工作的基础，都是标准囚徒困境模型。[18]

然而，博伊德的工作只说明囚徒困境博弈至少可以用来建立某些情况下的互惠利他主义模型，但并不意味着建立一切情况下的互惠利他主义模型都必须利用这种博弈。为了探索其他形式的模型，哲学家斯蒂芬斯（christopherstephens）从一般意义上得出了互惠利他主义所必要的非形式条件，分析指出标准囚徒困境博弈的必要条件并不是互惠利他主义的必要条件，继而给出了互惠利他主义的必要形式条件。

互惠利他主义的非形式条件，就是不借助数学（这里是博弈论）模型来定义互惠利他行为所必须符合的决定性特征。而用博弈论语言表达这些特征，便得出互惠利他主义所必须满足的形式条件。

斯蒂芬斯提出，互惠利他主义的特征有四个。这就是：（1）该行为必须减少某个供体（即提供帮助者）的与某个自私的抉择有关的适合度；（2）受体（即接受帮助者）的适合度相对于非受体必须被提高；（3）该行为的完成必须不依赖于某个直接利益的接受；（4）条件（1）、（2）和（3）必须适用于参与互惠帮助的两个个体。这里，条件（1）和（2）是使该行为互惠的条件。条件（3）把互惠利他主义与互助主义区别开来，因为在互助主义中只有受体同步提供某个回报利益，供体才采取行动。条件（4）使利他主义互惠。这四个特征分开是互惠利他主义的必要条件，合起来是互惠利他主义的充分条件。但是，仅有这4个条件还不够，互惠利他主义要能够进化，还必须有进一步的条件限制。斯蒂芬斯提出，互惠利他主义进化要满足的必要条件是：（5）必须存在察觉“骗子”的机制；（6）必须存在交换帮助的大量（不定）机会。显然，没有条件（5），非利他主义者就会总是占利他主义者的便宜，这样互惠利他主义就不会进化；有了这个条件，利他主义者就有了惩罚不合作的有机体的办法。没有条件（6），博弈就是单局的，博弈者占主导地位的选择就是背叛；有了这个条件，就保证了博弈的局数不定。

根据互惠利他主义及其进化的上述6个必要非形式条件，分析标准迭演囚徒困境博弈的必要条件，可以发现本文第二节提到的反剥削条件即r＞（t＋s）／2并不是囚徒困境所必要的，而且指令条件即t＞r＞p＞s也不是互惠利他主义所必要的。就是说，可以把标准囚徒困境博弈模型放到互惠利他主义进化模型之一，甚至是囚徒困境模型之一的位置上，而不是互惠利他主义的一般模型的位置上。我们从分析反剥削条件开始。这个条件是为了保证困境的存在，因为对双方合作的奖励比对背叛的诱惑和对傻瓜的欺骗的平均效果好，但是在迭演的情况下如果r≤（t＋s）／2，困境仍然存在。r≤（t＋s）／2意味着一对有机体轮流获得t（诱惑）和s（欺骗）回报的效果不会比轮流获得r（报偿）的效果差，这是一个允许博弈者交替剥削的条件。通俗地说，这次你吃亏下次我吃亏，有时会比两次你我都不吃亏的平均效果还好。因此，去掉反剥削条件，不会削弱合作的基础。实际上，交替剥削成了合作的一种形式。不过，这里的合作不是直接合作而是滞后合作，博弈者允许自己被剥削是为了交换剥削另一个博弈者的机会。当然，交替剥削要达到比双方合作好的效果，还需要一些条件规定4个支付值的相对大小，这就涉及到指令条件的突破。

把互惠利他主义行为的非形式条件形式化，可以得到如下支付矩阵：

附图

这里的值表示只是对博弈者1的适合度支付。显然，非形式条件（1）因为t＞r且p＞s而得到满足。条件（2）因为r＞s且t＞p或者仅仅使t＞p而有效。这些非形式条件，不论单独还是一起，都不必要求指令或反剥削条件。把这些非形式条件具体化，斯蒂芬斯得到包括标准囚徒困境模型在内的5个互惠利他主义模型。定义这些模型的条件分别是（注：斯蒂芬斯没有用缩写字母而是用中性字母表示4个支付值。本文不采用斯蒂芬斯的表示法，仍沿用通行的支付值表示字母。）：模型1：t＞r＞p＞s且r＞（t＋s）／2；模型2：t＞r＞p＞s且r≤（t＋s）／2；模型3：t＞p＞r＞s且p＞（t＋s）／2；模型4：t＞p≥r＞s且p≤（t＋s）／2；模型5：t＞p＞s＞r且p≤（t＋s）／2。模型1就是标准囚徒困境博弈。模型2是经斯蒂芬斯修正了的囚徒困境博弃。其他3个模型是斯蒂芬斯提出的“厨师困境博弈”。

修正的囚徒困境博弈模型和厨师困境博弈模型

在模型1的情况中以及模型2的某些情况中，利他主义表现为同步合作；在所有其他情况下，互惠利他主义表现为滞后合作。一般说来，帮助对于被帮助者甚至对于双方来说都是好事。但是，物极必反，有时过多的帮助反而糟糕。模型3－5刻划的就是这种情况，因为在这3个模型中同步合作的支付值（r）都小于同步背叛的支付值（p）。这就像过多的厨师会搞糟一锅汤一样。所以斯蒂芬斯把这种情况称之为厨师困境博弈。不过，在这种情况下，虽然同步合作不会使博弈者受益，但是非同步合作还是会相互受益的，所以互惠利他主义仍然存在。在3个厨师困境模型中，模型3是不稳定的厨师困境博弈，因为两个博弈者由于同步背叛而做得更好。模型4中r≤p，是强厨师困境博弈。相比较而言，模型5就只能称为弱厨师困境博弈了。修正的囚徒困境博弈和强弱厨师困境博弈即模型2、4和5，表示的就是滞后合作可能稳定的各种互惠利他主义。这3个模型可以用来分析和解释一些实际的观察结果。

帕克（c.packer）曾经报导，一种雄性橄榄色狒狒［即猎神狒狒（papioanubis）］形成联盟的行为满足互惠利他主义的判据。[19]一只雄狒狒为了与一只雌狒狒交配，在与竞争的狒狒的争斗中常常请求另一只雄狒狒的帮助。而被请求的雄狒狒则可以作出帮助与否的选择。在请求者（一只雄狒狒）接近雌狒狒的同时，被请求者（另一只雄狒狒）给予帮助不但自己不获利而且还使自己处于冒险状态。显然，这里的互惠帮助是非同步的，因为在一次帮助中只有一只狒狒得到报偿，另一只狒狒仅仅花费帮助代价。可以把单局博弈扩展为单迭演博弈，即以第一个博弈者的行动作为开始，以第二个博弈者的行动作为结束。于是，有机体甲在第一局博弈中帮助有机体乙而乙在第二局中帮助甲，就可以当作一次迭演来处理为二者都合作了。余类推。但是，用哪一种模型描述这种帮助较恰当，则取决于经验细节。如果在单迭演博弈中，提供帮助的雄狒狒冒的风险不大，即r＞（t＋s）／2为真，那么就要用标准模型来描述。但是，如果提供帮助的雄狒狒冒的风险大到r＜（t＋s）／2的程度，标准模型就无能为力，而要用修正的囚徒困境博弈模型了。

魑蝠以吸食其他动物的血为生，如果连续两夜吃不到血就会饿死。但是并非每只魑蝠每夜都能吸到血，没有从其他动物身上吸到血的魑蝠需要从有血的魑蝠那里得到血。威尔金森（geralds.wilkinson）在哥斯达黎加观察了野魑蝠的血液反哺行为。[20]一只魑蝠把血吐给其他正在挨饿的魑蝠是为另一只魑蝠的适应利益而牺牲自己的适应（在短期内）来分享血液的一种形式。血液的吐出与馈赠甚至发生在非亲属之间，而且，魑蝠不继续向那些不报答的个体馈赠血液。可见，这是互惠利他主义行为，斯蒂芬斯考虑到给出和接受血液视拥有和需要血液而定，同时考虑到健康获益与血液获益并非以线性方式相关，以致把一定量的血送给一只正在挨饿的魑蝠比送给一只有丰富血液的魑蝠更值得，由此给同步合作和同步背叛两种结果指定了相同的值。[18]由于p＝r，这个博弈就是一种强厨师困境。

斯蒂芬斯设想了一种情况。这种情况就是，一对有性繁殖的有机体配偶中的每个成员要么觅食，要么留在家里保护幼仔免遭捕食。觅食显然是合作行为。看家由于不必消耗能量采集食物或者冒捕食风险，可以看成非合作行为。假设成年有机体容易把该肉食者吓跑，而幼仔则不是该肉食者的对手。如果双亲都同时觅食，幼仔就处于被某个肉食动物捕食的危险之中，结果同步合作比一个有机体觅食而其配偶看家实际上要糟。最好的结果是一个有机体看家而其配偶去觅食；次好的结果是二者都看家；第三好的结果是该有机体去觅食其配偶看家；而对该有机体来说最糟的结果是二者都去觅食，留下不设防肉食者的巢。就是说，支付值的相对大小是t＞p＞s＞r。这就是弱厨师困境博弈的情况。

斯蒂芬斯还经过定量计算，比较了互惠利他主义的标准稳定动力学与他的新模型稳定动力学，限于篇幅，这里对此不作分析。但是，我们已经可以看出，他的工作为打破标准迭演囚徒困境博弈在互惠利他主义模型中一统天下的局面奠定了基础，为寻找各种新的模型提供了启示。

博弈论模型的形而上学预设

互惠利他主义的研究能够成为异常活跃的领域，得益于博弈论工具。但是，博弈论作为数学的一个分支，它本身并不直接提供对于实际问题的分析和解答。数学模型是数学工具与实际问题的结合。一般说来，数学模型具有3个特征：实际问题的数学表述、理想模型的概念基础、实际问题与数学结构的对应。[21]在互惠利他主义的建模过程中，有机体之间的关系被表述为非零和博弈，有机体被理想化为只有适合度的博弈者，而适合度的获益与博弈者的支付一一对应。由于非零和博弈与利他问题的联系，博弈论中的一些前提在这里发生了变化，于是互惠利他主义的博弈论模型就有了独特的形而上学预设。这种预设的基本点就是有机体的行为理性。

行为理性不同于国内学术界近年来讨论较为热烈的所谓工具理性和价值理性，因为工具理性与价值理性与博弈论中所说的理性基本上没有多少相悖之处。它们的唯一主体都是有意识的人或人的集团。博弈论中的博弈者是有意识的局中人，是有利害关系的对局者，是唯一只关心自己的支付的理性主体。但是，在互惠利他主义的博弈论模型中，这两个特性已经大大弱化甚至消失，因为这些模型并不需要有机体有主观动机，只需要它们有行为。譬如，细菌并没有大脑，但是它们对其化学环境却高度敏感。当然，我们在前面的讨论中曾经强调，在单局性博弈中，虽然博弈双方都合作比它们都背叛的结果要好，但占优势的选择仍然是背叛。要保证合作能够进化，必须保证这种博弈是迭演的，而且局数不定。这似乎就对有机体提出了两个要求：第一，这些有机体必须具有相互识别的能力，以保证它们下次相遇时不至于搞错对象，张冠李戴；第二，它们必须能够记住以往的博弈史，以保证它们不上骗子的当，同时对施惠者给以回报。其实，这两个要求并不是必须的，更不必要求有机体一定得有意识。人和某些动物固然具有辨识其他个体和记忆过往史的本领。但是，不具有这两种能力的有机体也可以通过某种机制来保证与其相互作用的是同一个个体。譬如，不同生物象巨蟹和海葵的互惠共生现象，就是实现这种机制的形式之一。再如，象雄性领地鸟在其稳定的领地中与其搭挡的高概率作用，也是这种机制的一种形式。这里，参与合作或背叛的有机体有行为而可以无意识。对于有机体来说，适合度支付是唯一有价值的东西。就是说，这里的理性，是生存意义上的。理性的博弈者理性的行为，一切都围绕适合度支付展开。不论是合作还是背叛，为了获得适应利益，不择手段。这些模型不考虑动机、友谊、忠诚、品质、良心等等。博弈者只顾自己的所得，不管其对手的所失。当然，博弈者的对手也是理性的，也只按自己的适合度利益采取行动。每个博弈者所碰到的都是一个手段不分上下的对手。

在行为理性预设的基础上，互惠利他主义的博弈论模型就有了一些必须的基本假定。譬如，博弈者在生存博弈中实施威胁或作出许诺没有任何意义，所以它们可以采取任何策略，当然面对的也是有可能采取各种策略的对手。全背叛、全合作、一报还一报，两报还一报、合作－背叛交替、赢－停与输－转等等，各种策略都会支配有机体的行为。再如，不存在元对策的假定。这个假定排除了确定对手在博弈中采取某种策略的可能性，也排除了从对手与其他博弈者的博弈中形成的信誉来确定自己的策略选择的可能性。因此，有机体可能利用的唯一信息就是与同一个对手相互作用的历史。其他一些假定，如不能中途退出对局、不能消灭对手、不能改变自己和对手的支付值等等，也都与行为理性预设有关。

行为理性预设当然冲击了我们通常的理性概念，这是需要认真研究的。不过，我们在这里要强调的是，这个预设在互惠性的研究中显示出方法论优势。我们知道，关于有机体合作的问题，早就有人注意到。无政府主义者克鲁泡特金曾经提出过互助论，主张生物进化的动力是合作。但是，除了对于合作作用的过分强调之外，他关于合作本身的描述和解释也很模糊。借助于博弈论，互惠性的描述与解释变得精确起来。在博弈论模型中，只考虑行为不考虑动机，这就突出了其中的本质性问题，并且使之得到简化，为有效地利用演绎方法提供了可能性。而演绎出的蕴涵，避免了特设性假说，因此是完全具有可检验性的。这种模型与计算机手段结合起来，设计出不同的策略的竞争[9]以及对策略竞争的生态学模拟[22]，便是一种间接检验。而人们对多种动物合作和背叛行为的实验室观察和野外观察，则可以确证或否证相关模型。由于这种优势，互惠利他主义的博弈论建模工作才呈现出目前高手云集、成果迭出的局面。及时把握这个领域的进展，无疑会发掘出新的哲学问题，大大开阔我们的哲学视野，丰富哲学研究内容。

【参考文献】

[1]　达尔文著，周建人、叶笃庄、方宗熙译，叶笃庄修订，《物种起源》，北京：商务印书馆，1995年，第145页。

[2]　hamilton,w.h.,"the　genetical　evolution　of　socialbehaviour",journaloftheoreticalbiology,vol.7(1964),no.1,pp.1-52.

[3]

dawkins,richard,　the　selfish　gene,　2nd　ed,oxford/new/york:oxforduniversitypress,1989.

[4]　trivers,robert　l.,"the　evolution　of　reciprocalaltruism",thequarterlyreviewofbiology,vol.46(1971),no.1,pp.35-57.

[5]　poundstone,w.,theprisoner'sdilemma,　new　york:doubleday,1992.

[6]　smale,s.,"the　prisoner's　dilemma　and　dynamicalsystemsassociatedtononcooperativegames",econometrica,vol.48(1980),pp.1617－34.

[7]　trivers,robert,l.,"the　evolution　of　reciprocalaltruism",thequarterlyreviewofbiology,vol.46(1971),no.1,pp.53-57.

[8]　axelrod,robert,　and　hamilton,　william　d.,"theevolutionofcooperation",science,vol.211(1981),no.4489,pp.1390-96.

[9]　axelrod,robert,"effectivechoiceinthe　prisoner'sdilemma",journalofconflictresolution,vol.24(1980),pp.3-25;"moreeffectivechoiceintheprisoner's　dilemma",　journalofconflictresolution,vol.24(1980),pp.379-403.

[10]　axelrod,robert,theevolutionofcooperation,　newyork:basicbooks,inc.,1984,pp.55-70.

[11]　fischer,erica.,"the　relationship　between　matingsystemandsimultaneoushermaphroditisminthecoralreelfish,hypoplectrumnigricans(serranidae)"animalbehavior,vol.28(1980),pp.620-33.

[12]　dugatkin,l.a.,"doguppiesplaytitfor　tat　duringpredator　inspection　visits?",

behavioral　ecology　andsociobiology,vol.23(1988),no.6,pp.395-99.

[13]　williams,g.c.,adaptation　and　natural　selection,princeton:princetonuniversitypress,1966.

[14]　packer,c.,"whateverhappedtoreciprocalaltruism?",trendsinecologyandevolution,vol.1(1986),pp.142-43.

[15]　boyd,robert,"istherepeated　prisoner's　dilemma　agoodmodelofreciprocalaltruism?",ethologyandsociobiology,vol.9(1988),no.2-4,pp.211-22.

[16]　nakamaru,m.,matsuda,　h.　and　iwasa,　y.,"theevolutionofcooperationinalattice-structuredpopulation",journaloftheoreticalbiology,vol.184(1997),no.1,pp.65-81.

[17]　leimar,olof,"repeated　games:a　state　approach",journaloftheoreticalbiology,vol.184(1997),no.4,pp.471-98.

[18]

stephens,　christopher,"modelling　reciprocalaltruism",britishjournalforthephilosophyofscience,　vol.47(1996),no.4,pp.533-51.

[19]　packer,c.,"reciprocalaltruisminpapio　anubis",nature,vol.265(1977),no.5593,pp.441-43.

[20]　wilkinson,geralds.,"reciprocal　food　sharing　inthevampirebat",nature,vol.308(1984),no.5955,pp.181-84.

博弈论定义篇5

论文关键词：合作博弈;重复博弈;中美纺织品贸易

一、中美纺织品贸易从非合作博弈转向合作博弈的理论层面分析中美纺织品贸易长期进行，随着利益分配的变化，矛盾与冲突也将增多，形成重复博弈。但是为了长期的甚至永久的利益，双方合作达成协议的可能性就越大，协议规定保护资源，违反协议将受到惩罚，从而保证了协议的执行，这就构成了经济社会长期合作的基础。

(一)打破无效率非合作博弈均衡在博弈理论中，一次性博弈虽然博弈双方都努力寻求个体最好的结果，运用各自的“占优策略”，但是这种非合作博弈导致进入“囚徒困境”的纳什均衡僵局，得到的却是较差的结果，这是从个体理性出发所导致的集体非理性无效率均衡。因此一次性静态博弈无法实现帕累托最优选择。当一次性博弈扩展到重复博弈时，在有限次重复博弈中，每个阶段博弈出现的都是一次性博弈的均衡结果。有限次的重复博弈无法抑制投机行为发生，并不能使博弈双方都选择合作的帕拉托最优策略组合，最终结果通常也是非合作均衡，不能改变囚徒困境的均衡结果，因而也不是有效率的。尽管有限次博弈也通常产生非合作均衡，但是囚徒困境可以在无限次重复博弈中得到纠正。长期性的中美纺织品贸易博弈是一个与无限次重复博弈相似的随机结束的重复博弈，这种情况下博弈方分析和决策的思路与无限次重复博弈一致。因此只有推动合作、抑制投机行为，才能最终实现有效率的合作均衡。

(二)验证合作对重复博弈的效用在国际贸易环境中，如果中美两国视互利互惠、求同存异共同发展为最高价值，通过合理合法的手段与程序，在不损害或尽量少损害博弈对手切实利益或获利潜能的情况下，就能谋求自身的最大利益与最大可能的发展空间。同时，合作形成的良性博弈规则，在一段时间内有利于决策主受体良性互动与利益均衡协调的发展，为再次博弈、修正决策和适时展开新决策提供现实契机和合作的氛围。这是一种可持续博弈、共享互惠、共存共荣的长远决策。

第一，重复博弈的得益综合各阶段。任何博弈弈方策略选择的依据都是得益的大小，这在重复博弈中仍然成立。但问题是重复博弈的得益与一次性博弈有所不同，因为它们的每个阶段本身就是一个博弈，各博弈方都有得益，而不是整个博弈结束后才有一个总的得益，因此博弈方是根据哪个得益选择，是根据当前阶段得益还是其他什么得益选择就成了问题。如果博弈方都是根据当前阶段得益选择，那么等于把重复博弈割裂成了一个基本博弈，重复博弈就失去了意义。因此重复博弈弈方的行为、策略选择不可能只考虑本阶段的得益，而必须兼顾其他阶段的得益，考虑整个重复博弈过程得益的总体情况。

第二，重复博弈得益驱使合作策略。2005年诺贝尔经济奖的奥曼和托马斯•谢林两位经济学家，通过重复博弈与聚焦效应等合作博弈论研究，指出冲突各方基于必须在未来与对手不断地打交道(重复博弈)，基于重复博弈过程得益的总体情况，认识到“合作是有利于自身的好策略”，从而增加了合作的机会：在冲突双方起争端时，“强硬”与“让步”是两种可能的选择，双方均取“强硬”，则可能发生“战争”，两败俱伤。如果势均力敌的两方都坚信自己的实力，用“持久战”的办法尽可能拖垮对方，那么这种想法的结局导致“和平”与“合作”。

因此，尽管存在冲突，长期共存是可能的，和谐社会的建立非但有其必要性，而且完全是现实的。合作博弈理论对解决经济冲突、建立长期合作有着极其重要的指导意义。对于中美纺织品贸易重复博弈来说，竞争冲突的各方完全应该也有可能达成协议长期合作，以求得长期的稳定的收益。

二、中美纺织品贸易从非合作博弈转向合作博弈的现实层面分析

(一)合作的可能：国际化分工使两国相互依赖商品和劳务市场是实现交换的最重要的平台，其发展程度决定了专业化分工程度。商品和劳务市场的特点就是多样化：多样化的品位，多样化的人类技能、知识，多样化的自然资源，为交换提供了前提。在商品和劳务市场中，生产者不断生产产品，而消费者不断从相应产品中获得价值。在国际市场中，贸易双方的商品和劳务、生产者、消费者通过市场都彼此依赖，存在着微妙的相互关系链，市场要求各方在共同意愿的基础上制定社会交往的规则。

20多年来中美两国越做越大的贸易额充分说明了中美贸易的互补性。美国企业将产品外包给成本比美国低的中国，从而节省的成本可以投资于新技术，创造新的工作机会，并在全球市场保持竞争力。国外输入的劳动密集型商品能够有力地促进国内该行业技术升级，在生产转移到劳动力低廉的中国的同时，美国可以有更多的时间和精力用于研发、制定标准以及优化产品结构。因此，国际化分工中的合作给中美双方都将带来更大的好处。中美经贸关系的快速发展促进了两国经济的持续增长，中美双方互为第二大和第三大贸易伙伴，互利双赢符合两国的共同利益。物美价廉的中国商品给美国消费者带来了大量实惠，同时，中国又是美国增长最快的出口市场，是美国企业海外利润的主要来源地之一。

维护稳定的中美经贸关系无论是对中国，还是对美国都具有重要意义，因此应该继续鼓励、促进两国之间的经贸合作与交流。中美经济的互补性和经贸合作的互利性是决定中美经贸关系持久发展的基础，两国在长期的贸易博弈中保持“合作”策略，双方加强互信与合作，有利于双方的博弈赢得、有利于稳定和促进中美经贸关系、有利于共同的经济发展。尽管在这个重复博弈中的某一个阶段博弈中，还是要重视非合作博弈中的策略分析和选择，但更重要的是要看到中美双方在贸易博弈中由非合作博弈向合作博弈的转化是有很大必要性的。

(二)合作的必然：合作博弈正和结果实现双赢本文从现实和理论上都证明:在中美纺织品贸易博弈中，两国的合作收益大于不合作收益，因此两国决策模型的理想选择应该是引致正和赢得的合作博弈。由于合作博弈有利于贸易双方实现双赢，这种双赢结果正是驱动双方进行合作的激励动力。在2005年11月8日中美就纺织品贸易签订的协议，一方面使得美国对其纺织品行业实施了一定程度的保护，使其实现向纺织品一体化的顺畅过渡，并且在博弈效果方面美国还获得了有关人民币汇率等其他问题方面的进展;另一方面中国在协议期三年内的出口增长量以及市场份额比2011年都有提高，且美方明确承诺对协议外产品克制使用242条款。

从协议内容看，中美都对此前各自坚持的立场进行了修正，双方各有让步，表明两国都对维护稳定的贸易环境的重要性给予了充分考虑，在较大程度上照顾了双方企业的利益，因而可以说是一个双赢的协议。事实证明，加强中美经贸合作符合两国和两国人民的根本利益，平等互利的经贸关系，对新世纪中美关系全面健康发展具有重要意义。中国是世界上最大的发展中国家，市场广阔，发展迅速，劳动力成本低，但资金短缺、科技相对落后，美国是世界上最大的发达国家，经济总量大，资本充足，科技发达，但劳动力成本高。

从经济全球化视角审视这种差异性和互补性，显而易见，中美两国的纺织品贸易博弈存在着合作的必然。三、永恒的贸易博弈尽管2005年11月中美达成三年期限的协议，但从wto规则来看，“多种纤维协定”取消以后，美国可以用来限制我国纺织品出口的法律依据不止一个，中国纺织品出口美国面临的不只是“242段条款”(有效期至2008年底)，还有“第16条”(有效期至2012年)、反倾销、反补贴、技术性贸易壁垒等等多种保护主义措施，另外，劳工权利、知识产权、反垄断法等问题也有可能在中美纺织品贸易中成为两国利益的冲突点。这些对于中美两国政府都是巨大挑战，因此，中美纺织品贸易的非合作博弈也可能随时发生，应对贸易壁垒，与形形色色的贸易保护主义斗争将是一项长期任务。

在这场长期与强势共存的国际环境和不公平的贸易规则下，与强势斡旋、争取本国公平贸易的利益，这是中美贸易之间一场永久的、不会有结束的博弈。中国需要认清自身在国际贸易博弈中的地位和形势，采取积极有效措施，提高中国纺织品及行业在国际中的竞争优势、增强中国纺织品在国际贸易中的博弈力量。从重复博弈理论和中美贸易高度互补的现实两个层面的分析，我们可以得出这样结论：尽管纺织品问题对中国与美国都很重要，但双方的纺织品贸易争端不应影响美国与中国长期的合作关系。

双方有必要为了建立可持续博弈、共享互惠、良好合作的氛围而打破非合作博弈的纳什均衡僵局，也只有实行合作、推动两国纺织品贸易从非合作博弈向合作博弈转化，才能实现有效率的合作均衡，实现纺织品贸易博弈的双赢，增进两国各自的社会福利。

[1]张维迎.博弈论与信息经济学[m].上海：上海人民出版社，2002.

博弈论定义篇6

［关键词］自愿性会计政策寻租理论博弈分析

一、寻租理论

寻租是由美国经济学教授克鲁格在1974年提出的，寻租理论应用的领域很广，将它运用在会计中则称之为会计寻租，而在我国用寻租理论来解释会计问题始于2000年。会计寻租的定义为：在社会总财富水平和企业真实业绩（即经济收益）并未改变的前提下，通过改变会计信息（即财务报告收益数字）或者影响行业规范来进行财富的非公平性转移和资源的不恰当配置，从而对其他社会主体利益造成损害的一种非生产性寻求利益的活动。

会计天然地具有经济后果，会计变更就天然地具有寻租功能。即在信息不对称的条件下，通过改变会计的确认和计量的方法，就可以改变会计信息，进而改变相关利益关系人的决策结果。企业寻租通常是在会计准则制定过程中以两种途径来实现：一是通过各种手段干预会计准则的制定过程，引导或促进会计准则朝着有利于该企业的方向发展，在默认会计准则制定机构的既有权力的前提下，寻租者可能寻求的则是准则具体事项中有利于自己的规定；二是企业管理当局以经济人的身份，通过具体的会计政策的选择最大限度地降低或减缓新准则所可能带来的负面影响。而后者即被可以看作是自愿性会计政策变更的寻租行为。

会计活动与相关环境有着密不可分的关系。那么，从理论上讲，企业就有适应环境变化而重新选择会计政策的必要性，这也就是自愿性会计政策变更的本质要求。然而，在现实生活中，企业可以选择通过这种自愿性会计政策的变更改变其真实收益以取得不应得的资源或财富。

在信息不对称的前提下，企业自愿性会计政策变更的真正动因是否如准则中规定的能够提供更可靠、更相关的会计信息不得而知，但鉴于自愿性会计政策变更所具有的寻租功能，自愿性会计政策变更应是极易发生盈余管理的领域，企业管理者会通过变更会计政策改变财务报告收益来达到其寻租的目的，实现财富的非生产性转移。

二、博弈分析

在经济学上博弈论是个非常重要的理论概念。与传统经济理论研究的不同点在于博弈论中，个人的效用函数除了依赖于自己的选择，还依赖于他人的选择；个人的最优选择是其他人选择的函数。

1.自愿性会计政策变更博弈的前提

在不完全竞争市场条件下，人们之间的行为是相互影响的，一个人在决策时必须考虑对方的几种可能性的反应，此时所做出的决策可能比单独思考自己的需求更具有价值。在信息不对称的条件下，市场中买卖双方各自拥有不同的信息，双方为了追求效用最大化，就会采取不同的手段来为自己谋利，由此便产生了一系列的博弈过程。

2.自愿性会计政策变更博弈的要素

（1）博弈双方——政府作为博弈甲方，上市公司经营者作为博弈乙方。

（2）博弈规则——会计规范体系。

（3）裁判——注册会计师。裁判是一个中立的角色，他通过接受委托服务于博弈的一方，公正的做出评判。

3.博弈过程分析

对于上市公司而言，在其公开信息时，就要了解政府在此信息公开后会做出的反应及对策。而政府在做出决策时，也需要考虑上市公司通过机会主义会计政策变更实现歪曲披露会计信息的可能性。下面我们可以从以下博弈分析中更加清楚地了解这一过程：如表1的博弈矩阵：

其中：e——上市公司不采取机会主义会计政策变更

o——上市公司采取机会主义会计政策变更

a——政府采纳上市公司披露的会计信息

u——政府不采纳上市公司披露的会计信息

表中各组数据代表政府及上市公司分别在不同情况下所得的好处。那么首先我们分析ae（9,6），看它是不是均衡点。如果政府选择采纳（a）的策略，则上市公司通过比较（e）与（o）的好处就会选择（o）点，去获得最大的利益8，也就是会采取机会主义的会计政策变更，所以ae（9,6）显然不是均衡点。同样，我们对ao（4,8）及ue（4,3）进行分析，可以发现它们都不是均衡点。而在uo（5,4）的情况下，政府采纳（u）的策略，上市公司通过比较（e）与（o）的好处就会选择（o）点，去获得最大的利益4，也就是会采取机会主义的会计政策变更，歪曲披露会计信息；另一方面，当上市公司采纳（o）的策略，政府通过比较（a）与（u）的好处就会选择（u）点，去获得最大的利益5，就是会做出不采纳的决策，从而该博弈的均衡点为uo（5,4）。

这种双方都采取消极方式对待问题的僵局的出现，显然对于经济发展是不利的。我们要制定出相关的规章制度，要求上市公司适度公开会计政策变更情况，既要保证会计信息的真实性、可靠性、相关性，又要以不泄露企业商业秘密等不可公开的信息为限，这便是博弈的一个新的“均衡点”。这样上述博弈均衡点持续发展下去的唯一结局就是最终会导致上市公司采取机会主义会计政策变更下所得好处减少为零，我们重新得到一个新的均衡点ae（9,6），即上市公司采取效率型的会计政策，真实公开财务信息，而政府据此做出采纳的决定。如表2所示：

以上我们简单的探讨了上市公司自愿性会计政策变更中存在的博弈现象。其实如果想真正地运用好博弈论，就不仅仅是接受这一均衡的结果，而是通过了解这一均衡的形成过程来创造条件达到这一均衡。同时我们也要认识到这一理想的均衡状态不是一朝一夕就能实现的，是必须经过“多次博弈”才能达到的。就好比会计中各种准则、制度、契约就是在不同的博弈各方多次博弈之后逐步形成的。其具体表现为：政府颁布的会计准则若有了破绽和漏洞，市场主体就会利用机会谋取利益，政府一旦发现后便会完善旧准则或制定新准则加以堵截和防范，政府和市场主体随即便展开新一轮的社会博弈。一轮博弈结束后，会计准则便达到了一时的均衡状态，但随着社会整体经济环境的发展和变化，旧的准则规范又不能涵盖新的会计业务，就会再次引发政府和市场主体之间的博弈，其结果就是达到新的均衡。博弈次数越多，程度越完善，博弈各方之间的关系便越接近“纳什均衡状态”。在纳什均衡状态下，各种会计准则、制度、契约就会成为整个社会普遍接纳的“市场规则”，任何市场主体若为了暂时的收益而违反规则，必然会在其他方面付出更大的代价。

由于目前我国对于上市公司会计政策变更情况的公开还没有达到既能披露更多真实、可靠、相关的会计信息，同时又不泄露企业商业秘密等不可公开的信息的双重要求，说明我国的各种会计准则、制度、契约仍处于博弈的初级阶段，要想达到“纳什均衡”还需经过一段漫长的时间。在这长时间的博弈过程中我们要正视自愿性会计政策变更的机会主义问题，积极地创造条件使得政府、投资者与上市公司多次博弈的结果能够兼顾各方的利益，达到双赢的局面。也只有这样，我们才会最终达到一个理想的“纳什均衡”状态。

参考文献：

博弈论定义篇7

关键词博弈论体育领域应用

一、博弈论概述

（一）博弈论的发展

博弈思想源远流长，虽然起始人们没有博弈的相关知识，但是博弈意识时刻伴随着人们的生活，因为根据现在博弈理论，我们就可以知道只要有选择，只要有竞争，就有博弈的存在。就有关文献记载的最早博弈思想的规范理论，可追溯2000多年前我国古代的“齐威王田忌赛马”等。

博弈理论的形成不是一蹴而就的，他有自己的发展历程，就目前而至已经自成体系，博弈论的理论体系大体上可以分为自然发展、专门研究、运用、高潮4个阶段，其特征、代表作和人物见表1。

表1博弈理论历程

阶段时间特征代表人物

自然发展二十世纪20-40年代数学家―最佳策略―具体决策问题―研究方法用于军事领域1944年诺依曼《博弈论与经济行为》

专门研究二十世纪中期经典理论被验证：囚徒困境和纳什均衡等纳什均衡、塔克囚徒困境

运用二十世纪80年代引起了经济学结的革命威尔逊等

高潮二十世纪90年代在经济、政治、军事、外交、公共选择、犯罪学等领域应用广泛1994年nash、Selten、Harsanyi

（二）博弈论要素

要想构成一个博弈，一般情况下需要存在五个要素，并且其中前三个是必须具备的：博弈主体（又称博弈方，指博弈中的决策者）、博弈策略集合、博弈者的收益（博弈的结果，这是博弈的焦点，一切就围绕着这个努力）、博弈的过程（也就是博弈方选择的时间先后，同时进行抉择，或者抉择有先后或者重复等）、博弈的信息（对自己和对方的处境、条件的掌握情况），其中前三个是基本要素。

（三）博弈论分类

由于博弈分类的要依据不同，可以有多种分类方法，本文主要从以下三个角度进行博弈的分类。

1．按照参与人行动的先后顺序

当这个作为依据时，博弈有静态博弈、动态博弈之分。静态的博弈是指博弈参与者在同一个时间做出策略选择，不能知道对方的选择结果，或者即便时间不是同时但不知道对方的选择是什么，对自己的没有参考，也叫做静态博弈；动态博弈指参与人不是在同时做出选择，后者能知道前者的选择信息，并对自己的选择有很关键的影响，这样对自己有参考价值。

2．依据博弈主体之间掌握的对方的相关信息如何

此时的博弈种类就存在有完全信息博弈、不完全信息博弈两种情况。完全信息指的是对对方的和博弈相关的信息有了完全掌握，同时呢，对方对自己的信息也是了如指掌，否则，就是不完全信息。

3．按照根据博弈结果的支付水平以此为切入点的话，博弈的种类就存在三种：零和博弈、常和博弈、变和博弈。零和博弈也就是两方的得益之和为零，一方赢的等于一方输的值，两者所得的和总为零；常和博弈指博弈方共分一块蛋糕，你多我就少，你少我就多，总和是一定的；变和博弈则是除上述外的所有博弈。

二、博弈论理论贡献与现实意义

博弈论理论从形成至今，已经获得了很多领域的成功，但最主要的成果集中于经济学领域，至2005年诺贝尔经济学奖已经5次授予博弈论领域的经济学家，特别是在全球经济快速发展的进30年来共4次授予博弈论领域的经济学家。诺贝尔经济学奖在这么短的时间内多次频繁光顾博弈论领域,彰显博弈论在经济学中的重要地位。同时也说明博弈论具有一定的实用价值。

（一）国外博弈论在体育领域中的应用

通过文献资料的调查与整理分析发现，国外已经有博弈论在竞技体育领域中应用的具体实例，在网球领域有人对1983年美国网球公开赛中克丽丝•艾弗特和马丁娜•纳芙拉蒂洛娃的比赛进行了博弈分析研究，用两位选手的底线击球线路和防守策略构建了博弈矩阵，演示了“零和博弈”中的纳什均衡的求解方法，提出了“混合出招”的概念。并进一步构建了网球博弈的序贯行动模型，分析了“后动优势”的形成过程。

在博弈类型分类演示中，阿维纳什•迪克西特与苏珊•斯克丝用（美式）橄榄球总的单次对局构建了进攻与防守的博弈模型，系统的描述了离散型策略同时行动博弈的“博弈矩阵表（gametable）”、“支付表(payofftable)”及“策略式(strategicform)”的相关概念。

但是博弈理论在国外运用最成功的体育项目是在足球的点球射门的博弈中，构建了射手与守门员的博弈模型和网球发球与接发球的博弈模型，并在此基础上进行了多次的博弈行为实验，实验的结果表明足球点球博弈模型与具体实践较为一致。

（二）国内博弈论在体育领域中的应用

以博弈论为检索关键词进行检索，得出仅人民大学图书馆共有博弈论著作354条记录，其中有关体育领域的著作一部，名为《体育博弈论》作者是李益群和谢亚龙二人，奠定了博弈论在体育科学领域研究的基石。系统的阐述了一般博弈论和体育博弈论现象的情况，提出了竞技体育博弈论是研究现代竞技体育竞争中如何去战胜对手、提高胜算、获取优胜的科学理论，并对体育博弈论的产生背景和科学基础进行了论证。提出体育博弈论现象、博弈系统、博弈制胜规律、博弈决策、博弈战略、博弈策略、博弈创新、博弈方法、博弈实践、博弈实战等等构成基本概念体系。并且进一步分析了竞技体育博弈系统的构成、特点和层次，规划了竞技体育博弈论研究的具体内容，为展开这项理论在体育领域的进一步研究奠定了必要的理论基础。

体育领域的题名为博弈研究文献总数为213篇，集中在宏观领域内的研究有李益群与谢亚龙的《竞技体育博弈论初探》是博弈论在体育领域的应用开始的标志，其后的王成夫的《试论体育博弈论的理论基础》与罗智波等人的《论博弈论在体育比赛中的运用》两篇，前者主要从体育博弈论的基础入手,分别就博弈论,体育博弈研究主体、对象与内容及竞争的特征等方面进行了阐述和研究,文章的主要意图还是试图逐步构架和完善体育博弈理论体系。后者主要阐述博弈论在体育比赛中的重要意义以及博弈论对体育研究的作用。文章指出：体育博弈,是人类最具理想意义的竞争,是在一定规则的限定下进行的,它贯穿于体育运动的始终。体育发展与进步的历史进程,与社会、政治、经济文化更紧密的结合,促进了体育理论的产生与发展。根据现代体育的发展,体育博弈论的发展历程从时间和特征上进行了划分，大致经历了5个发展阶段。就为微观领域的体育博弈研究有：棋类博弈研究、竞赛表演、竞技体育人才培养、兴奋剂监管、大型体育活动内部知识共享行为、篮球运动、象棋竞技与改革、高校运动队训练与管理、体育教学、足球运动、网球运动等领域。

三、结论

总结研究得出，通过把博弈论与体育博弈论的哲学思维模式应用在现代体育运动运动中，借助于体育运动运动实践中的真实、具体的博弈现象进行博弈分析，能够找出博弈的关键因素，根据现实需要制定相应的措施，以期达到用博弈的理论和方法指导现代体育运动向着良性方向的发展。博弈论虽然可以作为体育运动的有力补充，也有相应成果，但还需要进一步深化，以期待理论与实践的高度结合。

注释：

李益群,谢亚龙.体育博弈论[m].北京:北京体育大学出版社.2002.60.

参考文献：

[1]姚国庆.博弈论[m].天津:南开大学出版社.2003:5-7.

[2]李益群,谢亚龙.体育博弈论[m].北京:北京体育大学出版社.2002.51.

[3]李益群,谢亚龙.竞技体育博弈论初探[J].体育科学.1999.19(5):9-13.

博弈论定义篇8

博弈理论实质是将供求理论借鉴运用的物理力学均衡理论及概念再移植到竞争理论的研究中，研究的是决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。博弈论研究当某一主体的决策既受到别的主体的决策影响，而且该主体的相应决策又反过来影响到别的主体时的决策问题。博弈中作为一个整体各个主体的选择相互影响，对单个消费者或企业来说决策时不仅依赖于自己的选择，并且依赖于具体某个或某些主体的选择，最优选择是某些主体选择的函数。

博弈论的基本概念包括：参与人、行为、信息、战略、支付函数、结果、均衡。参与人是指博弈中选择行动利益最大化的决策主体家庭、企业或国家；

行动是指参与人的决策变量；

战略是指参与人选择行动的规则，告诉参与人在什么时候选择什么行动；

信息是指参与人在博弈中的知识特别是有关对手的特征和行动的知识；

支付函数是参与人从博弈中获得的效用水平，是所有参与人战略或行动的函数，是每个参与人真正关心的东西；

结果是指博弈者感兴趣的要素的集合；

均衡是所有参与人的最优战略或行动的组合结果。

而上述概念中参与人、行动、结果统称为博弈规则，博弈分析的目的就是使用博弈规则决定均衡。可见博弈理论并没有跳出竞争的范畴。

弈论理论上博弈论分为合作博弈和非合作博弈，区分是博弈者之间是否能采取合作策略。合作博弈是博弈者能够通过谈判达成有约束性的契约或默契以协调行为相互采取一种合作策略，无法通过谈判达成契约或默契为非合作博弈；

还可以根据持续的时间和重复的次数分为静态博弈与动态博弈；

而根据博弈弈者所掌握的信息的程度，还可将博弈分为完全信息博弈与不完全信息博弈，以及完备信息博弈与不完备信息博弈，确定博弈与不确定博弈等。

非完全竞争中的均衡性即合作博弈论（奥曼博弈）、完全竞争中的均衡性即非合作博弈论（纳什博弈）。合作博弈中奥曼提出了策略型与广义型（扩展型）等基本的博弈模型、解的概念和分析方法，建立“交互的决策论”为“最优理性决策”服务，即研究决策者的决策行为、作用条件及决策的均衡问题。

二、奥曼合作博弈论创立及一般理论

数学家约翰·冯·诺伊曼和经济学家奥斯卡·摩根斯坦合作出版的《博弈论与经济行为》一般被认为是博弈论产生的标志，概括了行为主体的典型行为特征，提出博弈模型、解的概念和分析方法。奥曼认为博弈是“交互的决策论”，即研究决策者的决策行为、作用条件及决策均衡问题，即决策者间决策行为形成的互为影响关系。因此决策主体必须考虑对方的反应，所以用“交互的决策”来描述博弈论。如果仅有一个决策者就产生最优化问题，而在多个参与者的博弈中，决策者的决策结果取决于众多决策者的交互决策作用。

奥曼认为就社会科学的理性方面而言博弈论是概括或“统一场论”，不是利用个别、特定结构讨论具体问题，而是应用于所有交互情形的一套方法，并进而探讨在每一具体应用中所导致的结果。

奥曼将“连续统”观点引入完全竞争行为及经济模型，使完全竞争的个量不影响总量的情况限制在仅存在有限多的参与者，因此个别参与者对经济的影响也就不能被忽视。连续统可看作接近于存在许多但是数量有限的粒子状况。奥曼指出竞争分配的核心和模式与企业连续统的市场相一致，并通过精确表达完全竞争观点的连续统模型，使模型改进为经济理论的基本准则。

奥曼看来博弈论和经济理论中最显著而独有的现象是竞争的价格均衡与对应的博弈的解概念间的关系，直观上看等价性原理是说市场价格的建立是从在完全竞争市场上运转的基本力量自然产生。

奥曼还利用参与者的连续统建立的垄断和寡头垄断竞争模型，以及公共经济学基于经济活动和政治过程相互交织的税收模型，如表决、固定价格模型等。

重复博弈即同样结构的博弈重复，每次博弈称为阶段博弈，是动态博弈的重要内容。奥曼认为完全信息的重复博弈论与人之间相互作用的基本形式的演化相关，目的是解释诸如合作、报复、威胁等现象。博弈论和新古典经济学模式的现象，可能一开始看起来非理性。奥曼定义“强均衡”概念，即没有任何参与者可以单方面改变决策来获益的情形，指出重复博弈的强均衡与一次性博弈的核心相一致。

合作博弈发展的鼎盛期也是非合作博弈的开创期。合作博弈理论直接讨论合作的结果与利益的分配，隐含的假设是存在一个在参与者间可以自由转移的交换媒介，每个参与者的效用可转移。奥曼把“可转移效用”理论扩展到一般的非转移效用理论，发展并加强了可转移效用和非转移效用的合作博弈论。

非合作博弈论的重点是对个体的战略选择，即每个参与者如何博弈，或者说选择什么策略达到目标。

三、纳什非合作博弈论的无意义性

不知是否是基于本文同样的认识或观点，纳什均衡既遭到冯·诺依曼的断然否定，还受到爱因斯坦的冷遇都不是没有道理的。纳什于1950和51年发表两篇关于非合作博弈论的论文，证明非合作博弈及其均衡解的存在，即所谓纳什均衡。然而，无论纳什的囚犯两难处境也好，还是价格战博弈也罢，其分析的非合作博弈均衡状态无论方法对错其实质是完全竞争均衡状态的分析，不过是竞争与非合作博弈的名称转换而已。

纳什的纳什均衡或非合作博弈论实际是完全竞争的均衡，证明的非合作博弈均衡解的存在，不过就是完全竞争的均衡解。奥曼将博弈概念从竞争概念中相对独立出来，而纳什又转了回去，难怪遭到冯·诺依曼的断然否定。

事实上，合作博弈本来仅就是竞争的一种形式即竞争对手的相互妥协、协调、默契；而非合作博弈的实质就是竞争，与其说存在非合作博弈不如直接说完全竞争。合作博弈实际是非完全性市场竞争，是竞争的一个特殊部分；而非合作博弈就是完全性市场竞争，因此也就根本没有存在于博弈理论中的价值。

目前经济学界谈到博弈论的非合作博弈，也就是各方在给定的约束条件下如何追求各自利益最大化，最后达到力量均衡，这实际是人与人之间利益竞争力的均衡。

四、博弈论也并不等同于对策论

博弈论是一种在合作中的竞争、竞争中的合作的交互决策方法，但不能把博弈论简单的归结或称为对策论。博弈是一种对策“场”，而对策是博弈中不同的作用点。

五、博弈理论的扬弃性研究与修正适用

现实中被博弈论的大量数学模型唬着的人不计其数，实际上博弈论不过就是一种分析方法而已，是可以帮助人了解策略性互动中的内在逻辑及构成，并提供一些有用的解决问题的方法，甚至可以说博弈论方法是对哲学思维方法的深化。目前博弈论作为分析和解决冲突与合作的方法和工具，在社会学、政治学、经济学等领域得到广泛应用。实际中如何理解博弈论、如何运用博弈论原理指导经济实践是个值得思考的问题。

价格与产量决策、经济合作和经贸谈判、引进与开发新技术或新产品等，博弈论都是有效的决策工具，至少是一种决策的思路。

国际贸易中的双方如果采取对抗性竞争策略，就会使双方因贸易战受到损害。彼此限制对抗国的产品进口，具体策略是提高关税，限制与对抗反击的结果是谁也没有捞到好处。反之，如果展开合作中的竞争、竞争中的合作，达到博弈均衡，即从互惠互利的原则出发达成减少关税，促进贸易的结果，彼此就都可以从贸易中获益。

博弈论定义篇9

科学发展观的正理是精神与物质之间的博弈

人们对于情感只能粗略地分成两块：一块是精神，一块是感情。目前，人们还没有能力直接创建这种情感，只有根据以人为本，让精神利用人体携带的信息与外界沟通。科学发展观提倡建设精神文明和物质文明，正是在一个大国崛起之时，对文化进行更精准透彻的思考。如果放弃精神，社会就会变得贫乏。人们只要满足基本生存条件之后，就会将精神扩充到物质上来。

精神文明和物质文明像一根琴弦，琴弦上不同节段有不同的空间节律。主题瘾魂——人的精神——情感文化——物质文明，这是一个社会文化三节律。精神文明的力量是来自主体瘾魂的动量，主体的欲望感觉到的文明，都是琴弦三节律性的文明。《博弈圣经》上说：“感情是依赖，是瘾魂驱动欲望过程中的殷勤创作。”感情与精神是瘾魂的动态信息，能动的智慧功能是构成整体科学文化的开端，也是人与自然的能动功能，它会创造物质文明。物质是局部的科学基础，也是构成科技商品反应出价值的优势效应。所以，几百年来它构成了西方经济体系的基础，并且组成了西方的政治、经济、军事、文化、历史、国家等等。以上这些一旦形成一个博弈实体，任何人都会很自然地从周边向外扩张。人与物在场景中的三元实体结构（即精神与物质和第三空间的三元结构），是一种创新结构或二特性平行法则。以人为本对应的唯物主义是物的概念，也是实体的概念，这种人与物相比较的状态，是相信自我的主要原因。如果在这里追加无数的自我反映，有时觉得伟大，有时觉得渺小，这种复杂的情感和智力的文化在混沌的背景中，由于生物亲序的本性，会产生文明。《博弈圣经》对文明的解释：“文化进程里恩怨游戏的终结就是文明。”精神与物质之间用情感和利益创造了局部文明，人们把局部的文明奉为科学，把局部的利益奉为真理。

政治一旦形成了一个完整的博弈实体，就能够对人的精神和物质观念造成影响，其自身延续和社会持续发展会特别地稳定。人民安居乐业，大地物产丰美。一个和谐社会的依据就是稳定的博弈实体背景，它里面的各种关系合情合理地围绕着科学发展观的政治主题，所表现出来的真、善、美和高尚感，会促进和谐社会的发展。科学发展观主题的瘾魂对全民产生的精神影响一旦得到了传承，人人会得到博弈文明的教育，也会提升博弈文明的层级。确切地说，我们会把博弈的文明成果归为精神。自古以来，人的文明起源于神的教育，起源于的教育，起源于时代主题的教育。今日，我们接受的是科学发展观的教育，也是接受精神文明和物质文明弈正理的教育。在接受教育的过程中，不要用简单的矛盾论谈论精神文明和物质文明。人们不知道什么是博弈实体的结构，所以会错误地把博弈实体中的众多性质挑出来两个，让它们相互对立，就相当于错误地把资本主义和社会主义对立，再用粗略的矛盾论解释它，这样就会出现任何人都谈不清的悖论。

由于政治主题、精神和物质是三元实体结构，人们最终会引进国正论的哲学认识这个博弈实体，把它分为一大块一小块，这会引出许许多多博弈正理的概念。在科学发展观介绍中有一句话“第一，以人为本是历史唯物主义的一项基本原则。”应该改为“第一，以人为本对应的唯物主义才是一项博弈的基本原则。”科学发展观讲的以人为本对应的唯物主义才是一个完整的博弈结构。那么，这个结构的标准是什么呢？怎样确定里面的正理呢？其实，这里的标准就是博弈实体知识论，它可以用国正论区分出实体与性质。科学发展观的经济学本质，就是要给人的行为定性，区分出输赢与均衡，找到博弈正理。

（正理：在博弈中的终极真相是无法从生物特性得到的，留出了唯一的出路就是引进一种方法，并用一种策略行为与初择样本的直觉进行对抗，用定性分解找出它的最小单元，看清粒子行为的内部结构，建立决策粒子二特性对局，这是唯一成功通向破解奥秘的理论。）

其实，寻找博弈正理的方法早已存在于人类的各种文明之中，人们没有意识到它在文化进程中一直悄悄地进行着，我们今天突然明白它，也许就像认识古代神秘的文明一样，非常神奇。

假如你想预见这个时代对我们自己的影响，应该从学习实践科学发展观这个伟大的命题开始。

——摘自人民网《科学发展观在博弈世界中运动》

博弈论定义篇10

关键词：房屋拆迁；演化博弈论；拆迁补偿

中图分类号：F746文献标识码：a

abstract:intheresearchofhousingdemolition,wecanseethatacertainrelationshipbetweenthedemolishedandthedemolisherhasbeenformedlikethesituationamongtherolesofthegametheory.sothispaperisgoingtointroduceaevolutiongametheorywhichsetupabinaryasymmetricalmodelreflectinginhawkanddoveevolutionarygame.throughtheanasysisofitsexistenceandhowitevolutes,weusedynamicequationstodosomequantitativesanalysis.andthenanewmethodofhousingdemolitioncompensationprocesscanbefullycopiedtoreflectedtherealbenefitofbothpartiesandtheoverallsituation.

Keywords：thehousingremoval；evolutiongamemodel；removalcompensation

1研究背景

1.1房屋拆迁的背景

城市房屋拆迁是随着城市的建设和发展而出现的，在本质上是对私有权利的一种消灭方式，前提条件是拆迁人对私有权利人应当给予相应补偿。在我国的国情中，现在拆迁问题越来越突出，拆迁带来的对房地产价格的影响，对被拆迁居民的补偿问题，是研究拆迁问题的研究人员关注的问题。

在补偿问题中，如果被拆迁的居民得不到合理的补偿，会将拆迁补偿的问题放大化，导致拆迁工作无法正常的运行，国家如果不对现有的补偿方式研究和改进，那么拆迁补偿会越来越棘手，所以研究拆迁补偿的新模式是非常有必要的。

1.2演化博弈论的研究背景

目前引入我国的研究方法很多，像博弈论、神经网络这样的利用生物进化学和神经学的研究方法，是较为突出的两种方法，本文利用博弈轮中的演化博弈的分支来进行科学研究。

在生物进化研究中，演化博弈论是最早提出来的，1973年生物学家梅纳德・史密斯运用数学知识，严格刻画了演化稳定策略（evolutionarilyStablestrategy，eSS）这一基础性的概念。1982年梅纳德・史密斯出版的《演化与博弈论》中，首次将生物进化论和博弈论综合的形成一种系统的分析过程的一门新学科。使得博弈论更加的具有实际的理论研究基础，不再停留在完全理想的情况下作分析，从而会加入不同角度的研究。

自20世纪90年代以来，博弈论研究的重点已转向了以有限理性为基础的演化博弈论。演化稳定策略把均衡看作是调整过程的产物而不是某种突然出现的结果，所以，它在一定程度上能使博弈过程动态化，但关注的焦点仍是均衡选择。

直到21世纪，我国才慢慢引进了演化博弈论的研究，针对于各个领域的范围，得到了广泛的应用。

2房屋拆迁的理论基础

2.1房屋拆迁

2.1.1房屋拆迁的概念、特点

城市房屋拆迁是指因国家建设、城市改造、整顿市容和环境保护等需要，经政府有关主管部门批准，由建设单位或个人，对现有建设用地上的房屋及其附着物进行拆迁，对房屋的所有人和承租人进行动迁、补偿等系列活动的总称。其特点如下：

（1）城市房屋拆迁应当依法拆除。其表明，整个的房屋拆迁活动都应该具有一定的法律依据，应当符合《城市拆迁管理条例》中的要求。

（2）城市房屋拆迁的立足点在于对房屋的权利人需要给予补偿，不得损害房屋权利人的合法权益。

2.1.2房屋拆迁补偿的概念、特点

（1）拆迁补偿的概念

按照《城市房屋拆迁管理条例》的规定，城市房屋拆迁是指导拆迁人依照有关法律和政策的规定，对城市规划区内的国有土地上的房屋进行拆迁，并对被拆迁人进行补偿、安置的活动。

（2）拆迁补偿的特点

1）拆迁补偿是一种民事法律关系。

2）拆迁补偿产生的原因是合法行为给他人财产造成损害。

3）拆迁补偿的对象只能是被拆迁房屋及其附属物的所有权人，补偿是对受到损失的当事人给予的财产抵偿，因此只有受到损失的当事人才能得到补偿。

2.2房屋拆迁补偿的对象和方法

2.2.1房屋拆迁补偿的对象

拆迁补偿的对象针对的是人和物两种理解，在人的基础上，拆迁补偿的对象，应该是拆迁房屋的使用权人。从物的角度上讲，拆迁补偿的对象应该是合法的，具有法律认证的房屋，其他的非法建筑物，拆迁时不予补偿。

2.2.2房屋拆迁补偿的方法

建立完整的拆迁补偿制度是我国的针对拆迁问题中的首要任务，怎么才能更好地体现出房屋在我国的使用权的价值，是我们研究拆迁补偿制度的核心。当前政府采取的是以货币化补贴和房屋使用权的交换补偿为主，再加入其他补偿方式的主要办法。

所谓“货币补偿"，是指被拆迁人根据房地产评估确定的房屋拆迁补偿价格，要求拆迁人支付货币，自行到房地产市场购买居住房屋。这就是建立了拆迁人与被拆迁人的一种货币化关系。另一种补偿的方法则是“房屋产权调换”，就是，由拆迁入向被拆迁人提供住房，被拆迁人根据自己的实际需要和现住房情况进行选择，最后结算新旧房屋的差价。

3拆迁补偿演化博弈模型

3.1引入演化博弈论的理论

3.3.1基本概念

演化博弈论具有博弈论的三要素，即博弈方、策略和得益。

（1）博弈方（players）：在博弈运算当中，独立思考，独立承担结果的个人或组织。一般用表示博弈方的集合。

（2）策略（Strategies）：供博弈方在进行博弈运算或者决策时，选择的方法。一般用有限纯策略集合。

（3）得益（payoffs）：在博弈方选择的方案当中，都会得到相对应的结果，其结果表示一个方案的得失。一般博弈方的得益用表示，各博弈方策略的多元函数。

3.3.2演化稳定策略下的复制动态方程

假设博弈方总体中的所有个体的原有策略为，变异者采用的变异策略为，将选择策略的个体占总体比例表示为，变异者占总体的比例表示为，其中。当选择策略时，会得出：

（3-1）

则策略是方案的演化策略。如果不是最优策略，那么会有一个策略能够得到更高的收益，根据的连续性可得到：

（3-2）

根据式3-2的连续性可知，当决策者开始博弈时并没有选择方案，而是随着时间的推移，转而去选择另一种策略类型博弈方，最终达到了最后的收益，此时可以看出，这两种决策的类型可以写成含有时间参数的函数式，即、。

博弈方策略类型比例动态变化是有限理性博弈分析的核心，其关键是动态变化的速度，方向可由速度的正负号反映。博弈方的学习模仿速度，关键在于模仿对象的数量大小和模仿对象的成功程度。

才用以决策类型为的博弈方为例，可以用动态微分方程表示其变化速度，则动态方程如下：

（3-2）

―才用策略的博弈方占总体的比例；―才用策略的期望得益；―平均得益；

―选择策略的博弈方占总体比例随时间的变化率。

令，根据微分方程的“稳定性定理”求解博弈进化稳定策略。

本文以拆迁人和被拆迁人互相的经济关系的变化，通过博弈演化的方式，对变化的趋势进行初步预测。

3.2拆迁补偿演化博弈模型

3.2.1非对称二元鹰鸽演化博弈模型建立

针对某市房屋拆迁补偿做以下定义，以方便建模时使用。定义：J―被拆迁房屋市场价格；F―搬迁奖励费；H―被拆迁人得到的补偿金额；Z―拆迁人获得的土地市场价值；K1、K2―被拆迁人所花费的斗争成本（K1＞K2）；C1、C2―拆迁人所花费的斗争成本（C1＞C2）。本模型的基本要素如下：

（1）博弈方：拆迁过程中的对象，即：博弈方1为被拆迁人，博弈方2为拆迁人。

（2）策略集合：博弈两方的策略集合为。

（3）得意情况：根据被拆迁人和拆迁人的策略集合的4种结果，推导出来的各种博弈方的得益情况，见表3.1。

表3.1被拆迁人与拆迁人二元鹰鸽博弈收益矩阵

根据此矩阵的结果，可以列出博弈方的不等式如下：

u1（斗争，妥协）u1（妥协，妥协）u1（妥协，斗争）u1（斗争，斗争）（3-3）

u2（妥协，斗争）u2（妥协，妥协）u2（斗争，妥协）u2（斗争，斗争）（3-4）

代入定义推倒得到：

H-G2F0-K1（3-5）

0FH+C2C1（3-6）

如果被拆迁人采取斗争策略的概率为p1，采取妥协策略的概率为（1-p1）；拆迁人采取斗争的概率p2，采取妥协策略的概率为（1-p2）。得益较差的一方会随着时间的推移，发现改变现在的博弈策略是对自己有利的，所以上述概率函数会随时间的变化发生变化，所以可以引入时间参数t，上述概率可以写为和，下面为了方便论述，仍写成p和1-p。

根据概率中的推导出被拆迁人采取的纯斗争策略的平均收益U1e，被拆迁人采取纯妥协策略平均收益U1d，拆迁人采取的纯斗争策略的平均收益U2e，拆迁人采取纯妥协策略平均收益U2d。下面列出博弈双方的总平均收入公式：

（3-3）

（3-4）

―被拆迁人总平均收益；―拆迁人总平均收益；

两个博弈方的动态变化速度可以用下列动态微分方程表示：

3-5式所示被拆迁人采取“斗争”策略类型；3-6所示拆迁人采取“斗争”策略类型。

（3-5）

（3-6）

式3-5、3-6表示为系统称为被拆迁人和拆迁人的动态复制系统。在此系统中，讨论博弈演化策略时，令、，解出本系统五个平衡点，分别为。

3.2.1演化稳定策略分析

（1）建立雅可比矩阵

动态复制系统的平衡点对应的策略组合为演化博弈的一个均衡，及演化均衡。根据微分方程稳定定理，我们可建立雅可比矩阵，进行局部稳定分析得出结果。

令矩阵J为动态复制系统的雅可比矩阵，那么如下所示：

解得：

矩阵J的行列式为：

（3-7）

矩阵J的迹为：

（3-8）

（2）局部稳定结果分析

经过计算矩阵J得出结果，如表3.2所示：

表3.2局部稳定分析结果

由表3.2可知，当矩阵的行列式符号为正，迹为负时，即存在两个稳定平衡点e2（1,0）、e3（0,1）两个，其分别对应的是{斗争、妥协}、{妥协、斗争}。另外，e1、e4为不稳定的平衡点，e5为鞍点。

3.2.2分析结果

如图3.1所示，点e1、e4和e5连成的折线为收敛于两种状态的临界线，分别收敛于两点e2、e3。其收敛于e2稳定平衡点的现实意义为：被拆迁人采取斗争的策略，迫使拆迁人采取妥协的策略，表明拆迁人为了加快资金周转，尽快投入建设在谈判中做出让步；其收敛于e3稳定平衡点的现实意义为：由于现阶段拆迁人和被拆迁人的地位不平等，当拆迁人采取斗争策略的时候，被拆迁人随着时间的变化，意识到选择斗争的策略的收益小于选择妥协的策略，便选择妥协策略，获得更多的收益，趋于平衡。在现实的生活中，这种方法被更多的被拆迁人所采用，即在整个演化博弈中，等更多的趋向于e3点，选择斗争的策略的被拆迁人随着时间的变化，选取的策略会被淘汰。

图3.1博弈方的动态变化过程

4案例分析

4.1背景资料

某市某拆迁户45平方米的住宅房屋为例，住宅坐落于二类土地上，区位基准价格1400元/平方米，综合环境修正系数为13.80%，房屋为砖混二级丙等，其重置价格为300元/平方米，根据标准计算:

房屋区位价格=1400×（l+13.80%）=1593.2元/平方米

房屋评估价格=1593.2×45+300×0.85×45=8.32万元

在el（0,0）情况下，拆迁人采取“妥协”策略，在房屋评估价格基础上，给被拆迁人多支付0.5万元的搬迁奖励费，得益为Z-8.82万元;被拆迁人亦采取“妥协”策略，接受补偿金额早日搬迁，同时获得收益为8.82万元。双方博弈结果为（8.82，Z-8.82）。

在e2（1,0）情况下，被拆迁人认为补偿太低，采取“斗争”策略，迫使拆迁人提高补偿标准，最终与拆迁人达成协议每平方米增加800元；

最终获得的补偿金额=（1593.2+800+300×0.85）×45=11.92万元，斗争成本为补偿金额的3%，即0.36万元；拆迁人付出补偿价格的同时还付出了应付被拆迁人“斗争”的行政成本，占补偿金额的2%，则拆迁人得到的收益为Z-（1+2%）×11.92=Z-12.16万元。双方博弈结果为（11.56，Z-12.16）。

在e3（0,l）情况下，被拆迁人采取“妥协”策略，仅获得拆迁房屋的评估价格8.32万元；拆迁人采取“斗争”策略，仅对被拆迁房屋补偿，不提供搬迁奖励费，拆迁人得益为Z-8.32万元。双方博弈结果为(8.32，Z-8.32)。

在e4（1,1）情况下，博弈双方采取{斗争，斗争}策略，博弈结果是被拆迁人获得拆迁房屋的评估价格8.32万元，所花费的斗争成本为获得补偿金额的6%，即0.49万元;拆迁人付出的斗争成本和信誉损失占补偿金额的50%，则获得的收益为Z-12.48万元。双方最终得益为（7.82，Z-12.48）。

表4.1得益矩阵表

J=8.32，K1=0.49，K2=0.36，C1=4.16，C2=0.96，H=2.88，F=0.5

将以上数据代入方程4.14、4.15计算：

e1（0,0）

J的行列式：（H-K2-F）F=（2.88-0.36-0.5）×0.5=1.01（+）

J的迹:H-K2=2.88-0.36=2.52（+）

经计算，雅可比矩阵行列式和迹的符号同为正，故点el（0,0）为不稳定均衡点。

②e2（l,0）

J的行列式：

（-H+K2+F）（-C1+H+C2）=（-2.88+0.36+0.5）（-4.16+2.88+0.96）=0.65（+）

J的迹：K2+F-C1+C2=0.36+0.5-4.16+0.96=-2.34（-）

经计算，雅可比矩阵行列式和迹的符号相反，故点e2（1,0）为演化均衡策略。

③e3（0,l）

J的行列式：K1F=0.49×0.5=0.25（+）

J的迹：-Kl-F=-0.49-0.5=-0.99（-）

经计算，雅可比矩阵行列式和迹的符号相反，故点e3(0，l)为演化均衡策略。

④e4（l,l）

J的行列式：Kl（Cl-H-C2）=0.49×（4.16-2.88-0.96）=0.16（+）

J的迹：Kl+C1-H-C2=0.49+4.16-2.88-0.96=0.81（+）

经计算，雅可比矩阵行列式和迹的符号同为正，故点e4（1,l）为不稳定均衡点。

⑤e5（0.85,0.84）

J的行列式：=0.08（+）

J的迹：0

经计算，雅可比矩阵行列式符号为正和迹的符号为0，点eSS（0.85，0.84）为鞍点。

表4.2稳定平衡分析

4.2演化博弈论的动态变化分析

由表4.2可以看出，本案例的动态变化结果表明，其收敛于e2、e3稳定平衡点，即：采取拆迁人斗争策略，被拆迁人采取妥协策略；或者采取拆迁人妥协策略，被拆迁人采取斗争策略。由表4.1可以看出，开始被拆迁人采取妥协后，得到了8.32万元的补偿金额，即e3点。随着时间的推移，个别的被拆迁人采取斗争策略后，迫使拆迁人妥协，最后得到了12.16万元的补偿金额，即e2点。

最终演化博收敛于e2平衡点，被拆迁人得到了更高的收益。

5小结

本文基于演化博弈论的理论方法，研究了在我国的拆迁背景下，被拆迁人与拆迁人之间的博弈关系。通过对房屋拆迁概念性研究，并建立了房屋拆迁的演化博弈模型，并通过实例分析很好的表明了其中的两种角色之间的最终博弈结果，符合实际情况。

参考文献：

[1]谢识予.经济博弈论[m].上海市：复旦大学出版社,2002.

[2]王文宾.演化博弈论研究的现状与展望[J].统计与决策,2009,(3):159.

[3]刘怡.基于演化博弈论的西安市房屋拆迁补偿研究[D].西安:西安建筑科技大学,2010.

[4]周洪军.探讨城市房屋拆迁补偿政策[J].中华民居,2011,(1):10.

博弈论定义十篇

博弈论定义篇1

博弈论定义篇2

博弈论定义篇3

博弈论定义篇4

博弈论定义篇5

博弈论定义篇6

博弈论定义篇7

博弈论定义篇8

博弈论定义篇9

博弈论定义篇10

相关作文

小学作文

初中作文

高中作文

作文体裁