策梅洛定理:游戏开始时,结局就定了!博弈论与纳什均衡(一)-环球聚看点

2022-11-22 19:08:51 来源: 李永乐老师

各位同学们大家好!我是李永乐老师。

之前我做了两个系列节目:《漫谈相对论》和《从亚里士多德到牛顿的宇宙》,我想,第三个系列节目就换换口味,讲讲数学的一个小分支,在经济学上又很有用的学问——博弈论吧。

我在北大读书时,学过一点经济学,但是没有系统学习过博弈论这门课。今天所讲的都是我个人对博弈论的理解,如果有不准确的地方,欢迎大家批评指正。在这个系列中,我把之前零零散散讲过的博弈论内容进行了总结,希望大家喜欢我的讲述。


(资料图片仅供参考)

“弈”这个字,原本意思是下棋。请问各位同学,你会下棋吗?你下棋输过吗?如果我说,围棋也好,象棋也好,其实都是有必胜法的,你们相信吗?

我们假设有一个非常简单的游戏,先手A和后手B各做一次决策(选择上路或者下路),根据二人决策的结果,游戏的胜负如下。通过这个表格,你能知道游戏的结果是谁获胜吗?

也许有同学认为:A的赢面大一些,因为A有2种可能会赢,而B只有一种可能会赢。事实并非如此。这盘棋的结果一定是和棋(除非有一方实在脑子不太好用,才会输掉)。

我们可以画一个游戏树来解释:

我们看:如果先手A选择上方,游戏进入到一个由进行B进行决策的分支,这叫做一个子游戏。在这个子游戏中,B选上方就A获胜,B选下方就B获胜,B要选择对自己有利的,所以他一定选择下方。这个子游戏的结局是固定的,就是B获胜。

如果先手A选择下方,游戏进入到另一个由B做决策的子游戏中,这时B选上方就A获胜,B选下方就和棋,B要选择对自己有利的,所以这个子游戏的结局一定是和棋。

我们再来考虑A:若A走上方,进入子游戏1,一定B获胜;A走下方,进入子游戏2,一定和棋。A也要选择对自己有利的,所以A选择下方。最终的游戏就是和棋。

如果游戏复杂一些,也不过是分支变多,长度变长,但是只要我们从最后端的子游戏开始,一层层倒推,就一定能推算出在最优策略下,游戏到底是先手胜,还是后手胜,还是和棋,这种胜负是不可避免的。

其实,象棋也好,围棋也好,它们与我刚才举的例子没有本质不同,只是复杂度高得多。而且,由于制定了一些胜负以及和棋规则,下棋的步骤也是有限的。

理论上讲,我们是可以画出围棋的游戏树的,如果我们遍历了所有情况,就能知道围棋结局到底是先手必胜,还是后手必胜,或者一定是和棋了。只是,这个过程过于复杂。

以围棋为例。围棋在19x19=361个格子上轮流放棋子,所以每个格子有黑白空三种可能,整个围棋棋盘上的状态数上限是3361=1.7×10172,去掉一些重复和对称,围棋的状态复杂度大约是10172量级。

要知道:宇宙中的原子个数只有大约1072个,就算用宇宙中的一个原子代表一个围棋局面,穷尽宇宙中所有的原子,也不能表示出围棋所有的棋局局面。

围棋的游戏树就更难画了。因为围棋可以提子,有了空白的地方可以继续下,所以并不一定是填满了棋盘就结束。不过,我们可以估计游戏树的总层数和每一层的平均分支。根据统计和计算:一盘围棋的平均手数是150手,每一手的平均分支数是250种,所以整个围棋的游戏树复杂度大约是250150≈10360。

理论上讲,如果我们遍历了所有10360种情况,就能知道围棋结局到底是先手必胜,还是后手必胜,或者一定是和棋了。但是,这个计算量实在太大了。之前世界上最快的计算机富岳每秒最高可以计算100亿亿次浮点运算,假如1次浮点运算就能算出一条路径,那么算完所有围棋游戏的可能情况,需要10342秒,而宇宙的年龄只有138亿年,大约只等于1017秒。

虽然我们无法计算出这个最优策略,但是显然,这个最优策略一定是存在的。

不仅仅是围棋,所有的明棋都是这样,只不过复杂度不同而已。

1913年,数学家策梅洛证明:对于一个两人的完全信息游戏,一定存在一个策略,要么先手一定获胜,要么后手一定获胜,要么双方一定平局,这就是泽梅洛定理。

策梅洛

策梅洛定理告诉我们:假设双方都是棋类大师,对游戏树了如指掌,这时候他们一定会采用统一的策略,让游戏向固定的方向发展,最终的结局也是固定的。

因为,任何一个人单方面的改变决策,都会对自己不利。正如我们刚才举例的那个小游戏,如果A改变决策,将会让B获胜;如果B改变决策,将会让A获胜,双方都为了自己的利益考虑,一定会出现A选择下路,B也选择下路的情况,最后游戏就一定是和棋。

实际上,在许多的博弈过程,都和下棋很像,参与博弈的几方能采取的策略都是有限的。在1950年,著名的数学家约翰纳什证明了一个更加普遍的结论:

只要参与博弈的几方策略都是有限的,那么就一定存在一种平衡状态,大家都会采用这种平衡策略,而没有单方面改变策略的动力。这种平衡状态就叫做纳什均衡。这个规律就叫做纳什定理。

刚才举的下棋的例子,最优策略就是纳什均衡,策梅洛定理其实是纳什定理的一个例子。在我们所处的世界中,无论是政治还是经济,都充满了博弈论和纳什均衡的例子。你想了解更多吗?关注我,下一回继续带大家漫谈博弈论。

编辑:Edt_58

最近更新

新疆2022年一级造价工程师(补考)合格人员名单公示(共709人)
呼和浩特2022年初中级经济师资格证书发放通知
每日视点!重庆2022年一级造价工程师(补考)资格复核通知
兴安盟2022年初中级经济师考试合格人员证书领取通知
福建2022年一级造价工程师(补考)考后资格核查通知 热文
2023山西省运城河津市教育人才引进公告-信息
2023上海信息技术学校拟聘人员公示
2023湖北服装表演高考分数线(含2021-2022历年)
即时:2023山东编导本科分数线多少分(含2021-2022历年)
2023赣南医学院招生计划-各专业招生人数是多少-天天观察
2023湖北美术生本科分数线多少分(含2021-2022年)
2023湖北艺术生本科分数线多少分(含2021-2022年)
世界观察:印度尼西亚很快要禁止这一金属原料的出口
9.21正式发售:《收获日3》开发者日志曝光 共通社群建立-看热讯
【天天时快讯】2023年5月国内VA、VE出口量环比增长,VC出口量同比环比下降
快手官方不给热度怎么办?如何增加快手流量? 全球新动态
安徽太湖:“典”亮美好生活 营造浓厚学法氛围_播资讯
【世界时快讯】浙江水利水电学院举行辅导员素质能力大赛专题培训
今日观点!精准发力,靶向引才——四川农业大学大力加强辅导员及教辅队伍建设
视讯!云南民族大学舞龙队在云南省第二届龙狮争霸赛上喜获佳绩
今头条!云南民族大学首届学生思想政治教育工作研讨会召开
环球短讯!喜报!浙江水利水电学院学子在第五届全国大学生桥梁设计大赛中斩获佳绩
知名歌手演唱会观众齐喊“开空调”!负责人道歉|环球热资讯
口腔医院借丁真照片宣传正畸被罚-世界播报
环球热头条丨江西高考状元出炉,高考726分语文答题卡曝光,看后令人拍手叫绝
广东省正式放榜!多少分能上广工商?
济南大学国际本科——一站式服务,解决您的所有后顾之忧! 世界观天下
江西高考状元出炉,超高分数破纪录,家庭背景曝光还真不是普通人 世界头条
天天最新:高考低分不要复读,不要读专科,济南一本大学国际本科招生!
招商银行人工客服电话_平安银行电话客服人工