什么是纳什均衡理论?

2024-05-17 07:00

1. 什么是纳什均衡理论?

纳什均衡又称非合作博弈均衡,是博弈论中的一个重要术语,以约翰·纳什的名字命名。在博弈过程中,无论对方的战略选择是什么,一方都会选择一定的战略,这就叫主导战略。如果两个博弈者的战略组合构成各自的主导战略,则该组合被定义为纳什均衡。
当每个球员的平衡策略是达到其预期收益的最大值时,一个策略组合被称为纳什均衡,同时,所有其他球员遵循这一策略。

扩展资料;
纳什均衡可分为两类:纯战略纳什均衡和混合战略纳什均衡。
要解释纯策略纳什均衡和混合策略纳什均衡,首先要解释纯策略和混合策略。
所谓纯策略,就是为玩家提供一个完整的游戏定义。特别是,纯粹的策略决定了在任何情况下都要进行的运动,策略集合是玩家可以执行的纯策略集合。
混合策略是通过给每一个纯策略分配一个概率而形成的策略,混合策略允许玩家随机选择纯策略,在混合策略博弈的均衡中,由于每个策略都是随机的,当达到一定的概率时,就可以得到最优支付。由于概率是连续的,即使策略集是有限的,也会有无限的混合策略。
当然,严格地说,每个纯策略都是一个“退化”混合策略,一个特定纯策略的概率为1,另一个为0。
因此,“纯战略纳什均衡”是指所有参与者都玩纯战略,而相应的“混合战略纳什均衡”则是指至少有一个参与者玩混合战略。并不是每一个博弈都会有纯战略纳什均衡,比如“硬币问题”只有混合战略纳什均衡,而不是纯战略纳什均衡。
然而,仍有许多博弈具有纯战略纳什均衡(如协调博弈、囚徒困境博弈和鹿博弈)。甚至,有些游戏可以同时拥有纯策略和混合策略平衡。
参考资料来源;百度百科——纳什平衡

什么是纳什均衡理论?

2. 纳什均衡理论具体讲些什么?


3. 什么是纳什平衡?

纳什平衡,又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。在一个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略,则该策略被称作支配性策略。
如果两个博弈的当事人的策略组合分别构成各自的支配性策略,那么这个组合就被定义为纳什平衡。
一个策略组合被称为纳什平衡,当每个博弈者的平衡策略都是为了达到自己期望收益的最大值,与此同时,其他所有博弈者也遵循这样的策略。

扩展资料
经典案例:囚徒困境
假设有两个小偷A和B联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌 疑人,警方给出的政策是:
如果一个犯罪嫌疑人坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪。如果另一个犯罪嫌疑人也作了坦白,则两人各被判刑8年。
如果另一个犯罪嫌人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑2年,而坦白者有功被减刑8年,立即释放。
如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。
参考资料来源:百度百科-纳什均衡

什么是纳什平衡?

4. 纳什均衡理论

博弈论
  
  
 博弈论是数学的一个分支,也是经济学的分析工具之一。它的基本假定是:人是理性的(或者说自私的),他在具体策略选择时的目的是使自己的利益最大化,博弈论研究的是理性的人之间如何进行策略选择的。在这里我主要讲经济学家纳什的博弈论观点,
  
 我主要讲两个板块,第一个板块介绍下诺贝尔经济学奖获得者纳什,著名的经济学家,纳什均衡的提出者。1928年出生,儿时的纳什是一个性格孤僻,成天着迷于做各种实验的孩子。上大学期间,经常旷课,充满与众不同的自信与自负。1948年凭着推荐信中一句“这个学生是个天才”,纳什来到了普林斯顿大学。当时人们对纳什的评价是:“天空都不足以容纳他的独立性”。那一年他还不到20岁。"纳什均衡”是他22岁博士毕业的论文,也奠定了数十年后他获得诺贝尔经济学奖的基础。不过到1958年,30岁的他疯了,患上严重的精神分裂症。我在想名人是不是都这样?直到上世纪80年代末才康复。于1994年获得了早就应该属于他的诺贝尔经济学奖。2015年,纳什和他的妻子因车祸去世。值得大家关注的是,在纳什疯了的期间,普林斯顿大学容纳了他,并没有把他赶出校园。我想他要是在中国的话,早就被送到精神病医院里去了。顺便说下,稷山县的精神病医院在晋东南地区知名度还是挺高的,如果去稷山走高速,下高速的出口处,立着一块大大的牌子,上面写着:稷山精神病医院欢迎您!这是稷山县的标志之一!
  
 以纳什为题材的电影《美丽心灵》,2001年上映,拍的非常好,完美的展现了纳什的生活历程。还有一部名字类似风格内容迥异的影片《美丽人生》,描写在德国纳粹统治期间,一位犹太父亲是如何想法设法保护孩子的!也值得大家一看!
  
 第二个板块我主要讲纳什均衡的两个案例:囚徒困境和智猪博弈。
  
 囚徒困境:假设有两个小偷A和B联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果两个犯罪嫌疑人都坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪,各被判刑8年;如果只有一个犯罪嫌疑人坦白,另一个人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑2年,而坦白者有功被减刑8年,立即释放。如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。
  
 对于两人而言最佳的选择应该是两人都抵赖,这样各判一年。所以监狱或者审讯室里的标语:坦白从宽,抗拒从严是错误的。实际上是:坦白从严,抗拒从宽。这是个帕累托最优的问题。但是这里有个问题,就是人性是最经不起考验的,分开审讯的目的就在这。所以两个人都抵赖在日常生活中基本是不可能的。所以对于A而言,不管B做出什么样的选择,坦白是他最好的结果。这就是一个博弈的过程。
  
 纳什的理论”对亚当·斯密的“看不见的手”的原理提出挑战:按照斯密的理论,在市场经济中,每一个人都从利己的目的出发,一定会导致集体利益的最大化。但是我们可以从纳什的理论中引出“看不见的手”原理的一个悖论:从利己目的出发,结果损人不利己,既不利己也不利他。 
  
 第二个案例是智猪博弈。在一个猪圈里,有一大一小两头猪,猪圈里一边是猪食槽,上边有一个漏食的口。另一边是开关,只有按动开关,漏食口打开,掉下一些食物。时间一久两头猪就会发现,每次小猪按动开关的时候,等它气喘吁吁的跑到另一边的时候,大猪已经把食物吃完了。每次大猪去按动开关的时候,等大猪跑到另一边的时候,小猪还没有把食物吃完,大猪还能吃上一点。而且只有隔一段时间按动开关才有食物。经过这样一段时间的反复博弈后,小猪就会放弃去主动按开关,因为每次按开关都吃不上食物。最后只有大猪去按开关,大猪按开关,两只猪都能吃上一部分,维持生存,否则两只猪都要饿死!这就是典型的搭便车现象。
  
 等待产业市场中出现具有赢利能力新产品、继而大举仿制牟取暴利的游资;公司里不创造效益但分享成果的人。 还有在教室里我们把学生分成小组,打扫卫生为例,总有个别学生不参与打扫,其它学生把活干了!
  
 如何解决这些问题?智猪博弈中的解决办法是减量加移位方案。投食仅原来的一半分量,但同时将投食口移到踏板附近。结果呢,小猪和大猪都在拼命地抢着踩踏板。等待者不得食,而多劳者多得。每次的收获刚好消费完。 成本不高,但收获最大。教室里面很多老师的做法,班级事务具体化到每一位学生身上,然后加以监督,这样就能很好的解决这问题!

5. 什么是纳什平衡

应该是博弈论中的“纳什均衡”,指的是在当前不合作的状态下(最差状态),做出的可以获得最好的收益的平衡点。
纳什均衡是一种策略组合,使得每个参与人的策略是对其他参与人策略的最优反应。
假设有n个局中人参与博弈,如果某情况下无一参与者可以独自行动而增加收益(即为了自身利益的最大化,没有任何单独的一方愿意改变其策略的[1]),则此策略组合被称为纳什均衡

  纳什均衡
。所有局中人策略构成一个策略组合(Strategy Profile)。纳什均衡,从实质上说,是一种非合作博弈状态。
纳什均衡达成时,并不意味着博弈双方都处于不动的状态,在顺序博弈中这个均衡是在博弈者连续的动作与反应中达成的。纳什均衡也不意味着博弈双方达到了一个整体的最优状态。

什么是纳什平衡

6. 纳什均衡怎么理解


7. “纳什均衡理论”怎么理解?


“纳什均衡理论”怎么理解?

8. 纳什均衡的定义是什么?

纳什平衡,又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。在一个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略,则该策略被称作支配性策略。
如果两个博弈的当事人的策略组合分别构成各自的支配性策略,那么这个组合就被定义为纳什平衡。
一个策略组合被称为纳什平衡,当每个博弈者的平衡策略都是为了达到自己期望收益的最大值,与此同时,其他所有博弈者也遵循这样的策略。

扩展资料
经典案例:囚徒困境
假设有两个小偷A和B联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌 疑人,警方给出的政策是:
如果一个犯罪嫌疑人坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪。如果另一个犯罪嫌疑人也作了坦白,则两人各被判刑8年。
如果另一个犯罪嫌人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑2年,而坦白者有功被减刑8年,立即释放。
如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。
参考资料来源:百度百科-纳什均衡
最新文章
热门文章
推荐阅读