请问什么是纳什均衡?

2024-05-06 02:11

1. 请问什么是纳什均衡?

又称为非合作博弈均衡
来源
  约翰·纳什1948年作为年轻数学博士生进入普林斯顿大学。其研究成果见于题为《非合作博弈》(1950)的博士论文。该博士论文导致了《n人博弈中的均衡点》(1950)和题为《非合作博弈》(1951)两篇论文的发表。纳什在上述论文中,介绍了合作博弈与非合作博弈的区别。他对非合作博弈的最重要贡献是阐明了包含任意人数局中人和任意偏好的一种通用解概念,也就是不限于两人零和博弈。该解概念后来被称为纳什均衡。
编辑本段定义
  假设有n个局中人参与博弈,给定其他人策略的条件下,每个局中人选择自己的  纳什均衡
最优策略(个人最优策略可能依赖于也可能不依赖于他人的战略),从而使自己利益最大化。所有局中人策略构成一个策略组合(Strategy Profile)。纳什均衡指的是这样一种战略组合,这种策略组合由所有参与人最优策略组成。即在给定别人策略的情况下,没有人有足够理由打破这种均衡。纳什均衡,从实质上说,是一种非合作博弈状态。   纳什均衡达成时,并不意味着博弈双方都处于不动的状态,在顺序博弈中这个均衡是在博弈者连续的动作与反应中达成的。纳什均衡也不意味着博弈双方达到了一个整体的最优状态,以下的囚徒困境就是一个例子。
编辑本段标准定义
  纳什均衡的定义:在博弈G=﹛S1,…,Sn:u1,…,un﹜中,如果由各个博弈方的各一个策略组成的某个策论组合(s1*,…,sn*)中,任一博弈方i的策论si*,都是对其余博弈方策略的组合(s1*,…s*i-1,s*i+1,…,sn*)的最佳对策,也即ui(s1*,…s*i-1,si*,s*i+1,…,sn*)≥ui(s1*,…s*i-1,sij*,s*i+1,…,sn*)对任意sij∈Si都成立,则称(s1*,…,sn*)为G的一个纳什均衡。
编辑本段纳什均衡经典案例:囚徒困境
  (1950年,数学家塔克任斯坦福大学客座教授,在给一些心理学家作讲演时,讲到两个囚犯的故事。)   假设有两个小偷A和B联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果一个犯罪嫌疑人坦白了罪行,交出了赃物,于是证  纳什均衡
据确凿,两人都被判有罪。如果另一个犯罪嫌疑人也作了坦白,则两人各被判刑8年;如果另一个犯罪嫌人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑2年,而坦白者有功被减刑8年,立即释放。如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。表2.2给出了这个博弈的支付矩阵。   表2.2 囚徒困境博弈   A╲B 坦白 抵赖 
坦白 -8,-8 0,-10 
抵赖 -10,0 -1,-1 
  关于案例,显然最好的策略是双方都抵赖,结果是大家都只被判1年。但是由于两人处于隔离的情况,首先应该是从心理学的角度来看,当事双方都会怀疑对方会出卖自己以求自保、其次才是亚当·斯密的理论,假设每个人都是“理性的经济人”,都会从利己的目的出发进行选择。这两个人都会有这样一个盘算过程:假如他坦白,我抵赖,得坐10年监狱,坦白最多才8年;他要是抵赖,我就可以被释放,而他会坐10年牢。综合以上几种情况考虑,不管他坦白与否,对我而言都是坦白了划算。两个人都会动这样的脑筋,最终,两个人都选择了坦白,结果都被判8年刑期。   基于经济学中Rational agent的前提假设,两个囚犯符合自己利益的选择是坦白招供,原  纳什均衡
本对双方都有利的策略不招供从而均被释放就不会出现。这样两人都选择坦白的策略以及因此被判8年的结局,纳什均衡”首先对亚当·斯密的“看不见的手”的原理提出挑战:按照斯密的理论,在市场经济中,每一个人都从利己的目的出发,而最终全社会达到利他的效果。但是我们可以从“纳什均衡”中引出“看不见的手”原理的一个悖论:从利己目的出发,结果损人不利己,既不利己也不利他。
编辑本段另一个简单的例子
  你正在图书馆枯坐,一位陌生美女主动过来和你搭讪,并要求和你一起玩个数学游戏。美女提议:“让我们各自亮出硬币的一面,或正或反。如果我们都是正面,那么我给你3元,如果我们都是反面,我给你1元,剩下的情况你给我2元就可以了。”那么该不该和这位姑娘玩这个游戏呢?这基本是废话,当然该。问题是,这个游戏公平吗?   每一种游戏依具其规则的不同会存在两种纳什均衡,一种是纯策略纳什均衡,也就是说玩家都能够采取固定的策略(比如一直出正面或者一直出反面),使得每人都赚得最多或亏得最少;或者是混合策略纳什均衡,而在这个游戏中,便应该采用混合策略纳什均衡。   n\m 美女出正面 美女出反面 
你出正面 +3,-3 -2,+2 
你出反面 -2,+2 +1,-1 
  假设我们出正面的概率是x,反面的概率是1-x。为了使利益最大化,应该在对手出正面或反面的时候我们的收益都相等,不然对手总是可以改变正反面出现的概率让我们的总收入减少,由此列出方程就是   3x + (-2)*(1-x)=(-2) * x + 1*( 1-x )   解方程得x=3/8,也就是说平均每八次出示3次正面,5次反面是我们的最优策略。而将x= 3/8代入到收益表达式 3*x + (-2)*(1-x) 中就可得到每次的期望收入,计算结果是 -1/8元。   同样,设美女出正面的概率是y,反面的概率是1-y,列方程   -3y + 2( 1-y )= 2y + (-1) * ( 1-y )   解得y也等于3/8,而美女每次的期望收益则是 2(1-y)- 3y = 1/8元。这告诉我们,在双方都采取最优策略的情况下,平均每次美女赢1/8元。   其实只要美女采取了(3/8,5/8)这个方案,不论你再采用什么方案,都是不能改变局面的。如果全部出正面,每次的期望收益是 (3+3+3-2-2-2-2-2)/8=-1/8元;如果全部出反面,每次的期望收益也是(-2-2-2+1+1+1+1+1)/8=-1/8元。而任 何策略无非只是上面两种策略的线性组合,所以期望还是-1/8元。但是当你也采用最佳策略时,至少可以保证自己输得最少。否则,你肯定就会被美女采用的策略针对,从而赔掉更多。
编辑本段重要影响
  纳什均衡理论奠定了现代主流博弈理论和经济理论的根本基础,正如克瑞普斯(Kreps,1990)在《博弈论和经济建模》一书的引言中所说,“在过去的一二十年内,经济学在方法论以及语言、概念等方面,经历了一场温和的革命,非合作博弈理论已经成为范式的中心……在经济学或者与经济学原理相关的金融、会计、营销和政治科学等学科中,现在人们已经很难找到不懂纳什均衡能够‘消费’近期文献的领域。”纳什均衡的重要影响可以概括为以下六个方面   1.改变了经济学的体系和结构。非合作博弈论的概念、内容、模型和分析工具等,均已渗透到微观经济学、宏观经济学、劳动经济学、国际经济学、环境经济学等经济学科的绝大部分学科领域,改变了这些学科领域的内容和结构,成为这些学科领域的基本研究范式和理论分析工具,从而改变了原有经济学理论体系中各分支学科的内涵。   2.扩展了经济学研究经济问题的范围。原有经济学缺乏将不确定性因素、变动环境因素以及经济个体之间的交互作用模式化的有效办法,因而不能进行微观层次经济问题的解剖分析。纳什均衡及相关模型分析方法,包括扩展型博弈法、逆推归纳法、子博弈完美纳什均衡等概念方法,为经济学家们提供了深入的分析工具。   3.加强了经济学研究的深度。纳什均衡理论不回避经济个体之间直接的交互作用,不满足于对经济个体之间复杂经济关系的简单化处理,分析问题时不只停留在宏观层面上而是深入分析表象背后深层次的原因和规律,强调从微观个体行为规律的角度发现问题的根源,因而可以更深刻准确地理解和解释经济问题。   4.形成了基于经典博弈的研究范式体系。即可以将各种问题或经济关系,按照经典博弈的类型或特征进行分类,并根据相应的经典博弈的分析方法和模型进行研究,将一个领域所取得的经验方便地移植到另一个领域。   5.扩大和加强了经济学与其他社会科学、自然科学的联系。纳什均衡之所以伟大,就因为它普通,而且普通到几乎无处不在。纳什均衡理论既适用于人类的行为规律,也适合于人类以外的其他生物的生存、运动和发展的规律。纳什均衡和博弈论的桥梁作用,使经济学与其他社会科学、自然科学的联系更加紧密,形成了经济学与其他学科相互促进的良性循环。   6.改变了经济学的语言和表达方法。在进化博弈论方面相当有造诣的坎多利(Kandori,1997)对保罗·萨缪尔森(Paul Samuelson)的名言“你甚至可以使一只鹦鹉变成一个训练有素的经济学家,因为它必须学习的只有两个词,那就是‘供给’和‘需求’”,曾做过一个幽默的引申,他说,“现在这只鹦鹉需要再学两个词,那就是‘纳什均衡’”。

请问什么是纳什均衡?

2. 如何来解释纳什均衡?

假定在某一对策中,如果每一局中人都熟知他的对手们所选择的策略,局中人关于对策可能达成一致;但如果局中人倾向于选择一种不一致的策略,则就不会有人考虑这种一致而自我强迫服从这种策略。因此,从这个意义上来讲,自我强迫协议是组成一个纳什均衡的必要条件。但是,并不是每一个纳什均衡都是一个自我强迫协议。

3. 请问什么是纳什均衡?

纳什均衡是指这样一种均衡:在这一均衡中,每个博弈参与人都确信,在给定其他参与人战略决定的情况下,他选择了最优战略以回应对手的战略。”也就是说,所有人的战略都是最优的。而讲解“纳什均衡”的最著名的案例就是“囚徒的困境”。  a,b两个囚徒,a坦白b抵赖,b判10年,a判1年.若两人均坦白则各判5年,若两人均抵赖则都判2年。a,b面临抉择。  显然最好的策略是双方都抵赖,结果是大家都只被判2年。但是由于两人处于隔离的情况下无法串供,按照亚当·斯密的理论,每一个人都是一个“理性的经济人”,都会从利己的目的出发进行选择。这两个人都会有这样一个盘算过程:假如他招了,我不招,得坐10年监狱,招了才5年,所以招了划算;假如我招了,他也招,得坐5年,他要是不招,我就只坐1年,而他会坐10年牢,也是招了划算。综合以上几种情况考虑,不管他招不招,对我而言都是招了划算。两个人都会动这样的脑筋,最终,两个人都选择了招,结果都被判5年刑期。  原本对双方都有利的策略(抵赖)和结局 (被判1年刑)就不会出现。这就是著名的“囚徒困境”。它实际上反映了一个很深刻的问题,这就是个人理性与集体理性的矛盾。

请问什么是纳什均衡?

4. 什么是纳什均衡理论?

纳什均衡又称非合作博弈均衡,是博弈论中的一个重要术语,以约翰·纳什的名字命名。在博弈过程中,无论对方的战略选择是什么,一方都会选择一定的战略,这就叫主导战略。如果两个博弈者的战略组合构成各自的主导战略,则该组合被定义为纳什均衡。
当每个球员的平衡策略是达到其预期收益的最大值时,一个策略组合被称为纳什均衡,同时,所有其他球员遵循这一策略。

扩展资料;
纳什均衡可分为两类:纯战略纳什均衡和混合战略纳什均衡。
要解释纯策略纳什均衡和混合策略纳什均衡,首先要解释纯策略和混合策略。
所谓纯策略,就是为玩家提供一个完整的游戏定义。特别是,纯粹的策略决定了在任何情况下都要进行的运动,策略集合是玩家可以执行的纯策略集合。
混合策略是通过给每一个纯策略分配一个概率而形成的策略,混合策略允许玩家随机选择纯策略,在混合策略博弈的均衡中,由于每个策略都是随机的,当达到一定的概率时,就可以得到最优支付。由于概率是连续的,即使策略集是有限的,也会有无限的混合策略。
当然,严格地说,每个纯策略都是一个“退化”混合策略,一个特定纯策略的概率为1,另一个为0。
因此,“纯战略纳什均衡”是指所有参与者都玩纯战略,而相应的“混合战略纳什均衡”则是指至少有一个参与者玩混合战略。并不是每一个博弈都会有纯战略纳什均衡,比如“硬币问题”只有混合战略纳什均衡,而不是纯战略纳什均衡。
然而,仍有许多博弈具有纯战略纳什均衡(如协调博弈、囚徒困境博弈和鹿博弈)。甚至,有些游戏可以同时拥有纯策略和混合策略平衡。
参考资料来源;百度百科——纳什平衡

5. 什么是纳什均衡

纳什均衡的思想是,当参与者选定的策略组成纳什均衡后,就会形成一个平衡的局面。
在这个平衡的局面中,任何一个剧中人单方面地改变自己的策略,只能是自己的收益下降(或不变),绝不可能使自己的收益增加。这样,在纳什均衡下构成的这种局势让每个参与人都不敢轻举妄动,因而形成了这个平衡。

纳什均衡并不是为了集体的利益最大化,而是为了个人的利益最大化。所以在为了个人利益最大化的同时,一定会损耗集体的利益。因此纳什均衡点不一定(大多情况下都不是)是集体利益最大化点。


举个经典的例子:囚徒困境,两个囚犯抓起来之后,分别单独审问,如果都承认罪行就都判刑7年,都不承认就判刑2年,如果一个承认一个不承认,不承认的判刑10年,承认的由于表现良好所以直接宽大释放。

这个例子中很明显,如果大家都不承认是最好的结果(可以算是整体利益最大的结果),都承认是最坏的结果,但是这个最坏的结果却是纳什均衡的结果。为什么呢?

是因为在纳什均衡下,他们都承认都获刑7年,但是如果有一方选择不承认,他就有获刑10年的可能性,所以他们都不愿意冒这个风险,宁愿获刑7年,最终形成了这个纳什均衡。

我只是浅显的说了一下纳什均衡的道理,如果想了解的更深刻,比如纳什均衡点的分类、公式什么的最好还是系统的学习一下《博弈论》这门学科比较好。

什么是纳什均衡

6. 什么是纳什均衡

纳什均衡,Nash equilibrium ,又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。

约翰·纳什1948年作为年轻数学博士生进入普林斯顿大学。其研究成果见于题为《非合作博弈》(1950)的博士论文。该博士论文导致了《n人博弈中的均衡点》(1950)和题为《非合作博弈》(1951)两篇论文的发表。纳什在上述论文中,介绍了合作博弈与非合作博弈的区别。他对非合作博弈的最重要贡献是阐明了包含任意人数局中人和任意偏好的一种通用解概念,也就是不限于两人零和博弈。该解概念后来被称为纳什均衡。   
纳什的主要学术贡献体现在1950年和1951年的两篇论文,1950年他才把自己的研究成果写成题为“非合作博弈”的文章刊登在美国全国科学院每月公报上,立即引起轰动。说起来这全靠师兄戴维·盖尔之功,就在遭到冯·诺依曼贬低,嘲笑几天之后,他遇到盖尔,像说梦话似的告诉他自己已经将冯·诺依曼的“最小最大原理找到了普遍化的方法和均衡点。纳什这个初出茅庐的小子,根本不知道竞争的险恶,从没想到学术欺骗的后果。结果还是戴维·盖尔充当了他的“经纪人”,起草致科学院的短信,系主任列夫谢茨则利用方便的人脉关系亲自将文稿递交给科学院。纳什写的文章不多,他辩解说:少了才是精品。中国国内提一个教授,要求在“核心的刊物”上发表多少篇文章。按照这个标准可能纳什还不一定够资格。 
1996年诺贝尔经济学奖得主莫尔里斯当牛津大学艾奇沃思经济学讲座教授时也没有发表过什么文章,特殊的人才,必须有特殊的选拔办法。   
Nash平衡是指博弈中这样的局面,对于每个参与者来说,只要其他人不改变策略,他就无法改善自己的状况。Nash在证明了在每个参与者都只有有限种策略选择、并允许混合策略的前提下,Nash平衡一定存在。以两家公司的价格大战为例,Nash平衡意味着两败俱伤的可能:在对方不改变价格的条件下,既不能提价,否则会进一步丧失市场;也不能降价,因为会出现赔本甩卖。于是两家公司可以改变原先的利益格局,通过谈判寻求新的利益评估分摊方案,也就是Nash平衡。类似的推理当然也可以用到选举,群体之间的利益冲突,潜在战争爆发前的僵局,议会中的法案争执等。
假设有n个局中人参与博弈,给定其他人策略的条件下,每个局中人选择自己的  纳什均衡
最优策略(个人最优策略可能依赖于也可能不依赖于他人的战略),从而使自己利益最大化。所有局中人策略构成一个策略组合(Strategy Profile)。纳什均衡指的是这样一种战略组合,这种策略组合由所有参与人最优策略组成。即在给定别人策略的情况下,没有人有足够理由打破这种均衡。纳什均衡,从实质上说,是一种非合作博弈状态。   
纳什均衡达成时,并不意味着博弈双方都处于不动的状态,在顺序博弈中这个均衡是在博弈者连续的动作与反应中达成的。纳什均衡也不意味着博弈双方达到了一个整体的最优状态,以下的囚徒困境就是一个例子。

7. 什么是纳什均衡,怎样达到纳什均衡?


什么是纳什均衡,怎样达到纳什均衡?

8. 请用纳什均衡解释

纳什均衡是指这样一种均衡:在这一均衡中,每个博弈参与人都确信,在给定其他参与人战略决定的情况下,他选择了最优战略以回应对手的战略。”也就是说,所有人的战略都是最优的。而讲解“纳什均衡”的最著名的案例就是“囚徒的困境”。 

a,b两个囚徒,a坦白b抵赖,b判10年,a判1年.若两人均坦白则各判5年,若两人均抵赖则都判2年。a,b面临抉择。 

显然最好的策略是双方都抵赖,结果是大家都只被判2年。但是由于两人处于隔离的情况下无法串供,按照亚当·斯密的理论,每一个人都是一个“理性的经济人”,都会从利己的目的出发进行选择。这两个人都会有这样一个盘算过程:假如他招了,我不招,得坐10年监狱,招了才5年,所以招了划算;假如我招了,他也招,得坐5年,他要是不招,我就只坐1年,而他会坐10年牢,也是招了划算。综合以上几种情况考虑,不管他招不招,对我而言都是招了划算。两个人都会动这样的脑筋,最终,两个人都选择了招,结果都被判5年刑期。 

原本对双方都有利的策略(抵赖)和结局 (被判1年刑)就不会出现。这就是著名的“囚徒困境”。它实际上反映了一个很深刻的问题,这就是个人理性与集体理性的矛盾。



对於多人参与、非零和的博弈问题,在纳什之前,无人知道如何求解,或者说怎样找到类似于最小最大解那样的“平衡” 。而找不到解,下面的研究当然无法进行,更谈不上指导实践了。纳什对博弈论的巨大贡献,正在於他天才性地提出了“纳什均衡” 的基本概念,为更加普遍广泛的博弈问题找到了解。

纳什均衡的基本思想是,在这个解集中所有参与者的策略都是对其他参与者所用策略的最佳对策,没有人能够通过单单改变自己的策略提高收益。