1. 一个深刻的问题
博弈论被广泛用于模拟生物和社会系统的相互作用,它是一种描述决策者之间的战略互动的数学模型。它有着非常广泛的应用,可被用于各种各样的问题,合作的产生、语言的形成、道路的拥堵都与它息息相关。在经济学、生态学和种群生物学中,我们都能看到它的身影。
在博弈论中有一个长期存在的问题,那就是当决策者通过反复博弈时,是否会在这个学习过程中收敛到一个所谓的“均衡”状态。在经济学中,均衡是最核心的概念之一。它是许多经济学模型的核心假设,这包括制定货币政策、气候变化、贸易政策和最低工资等问题时所使用的模型。但这是一个好的假设吗?对于这个问题我们知之甚少,因为答案取决于游戏的属性与学习的算法。
最近,来自牛津大学的Marco Pangallo、Torsten Heinrich和Doyne Farmer在《科学进展》期刊上发表了一篇论文,他们在简单的博弈框架下对这个问题进行了研究,并证明当博弈变得复杂时,这个假设就会存在问题。如果将这些结果从博弈延续到经济学,那么就会引发一个深刻的问题,即在什么时候经济学模型对于理解现实世界是有用的?
2. 简单游戏 vs 复杂游戏
孩子们经常玩的井字棋(圈叉游戏)是一个简单基础的策略游戏,在游戏过程中,二人需要轮流在一个3×3的格子中画“O”或“X”,首先将三个“O”或“X”连成一条线的人赢得游戏。但可能等孩子们长到差不多8岁时就会知道,后手玩家可以通过采取一种策略,使得游戏总以平局告终。在经济学中,这样的策略就是均衡。
如果博弈中的所有决策者都是理性的,他们就会采取一种均衡策略。在经济学中,“理性”意味着决策者能对每一步可能的动作都进行评估,并探索它对最终结果的影响,然后选择最好的举措。
一旦孩子们大到足以发现井字棋中的均衡,他们就不会再想玩这个游戏了,因为游戏的结果将总是一样,游戏也就失去了输赢的乐趣而变得无聊。不过我们可以从这样一个角度来看待这件事情:当我们想要理解孩子是如何玩圈叉游戏时,“理性”是一个适用于8岁左右孩子的行为模型,但不适用于6岁的孩子行为模型。
在像国际象棋这样更复杂的游戏中,理性从来都不是一个好的行为模型。这里的问题在于,国际象棋是一种难度很大的游戏,难到没有人能够分析出所有的可能性,因此均衡这一概念的可行性也就随之瓦解。在国际象棋中,没有人聪明到能够发现其中的均衡,所以游戏永远不会一成不变。
这就说明,理性是否是现实生活中人们行为的合理模型,取决于需要解决的问题的难易程度。如果问题很简单,那么它就是一个好的行为模型;但如果问题很难,这个模型可能会失效。
牛津大学数学教授Doyne Farmer说:“在经济活动中遇到的许多问题都太复杂了,很难用正则形式的博弈来建模。尽管如此,这项研究表明了一个潜在的严重问题。经济学中的许多情况都是复杂且具有竞争性的。我们的研究提出了一种可能性,那就是经济学中的许多重要理论可能是错误的。如果均衡这一关键的行为假设是错误的,那么模型的预测就也可能是错误的。在这种情况下,我们需要新的方法来明确地模拟决策者的行为,并考虑到在真实生活中人们并不擅长解决复杂的问题这一因素。”
3. 均衡总是存在吗?
经济学理论几乎从一开始就普遍假定均衡的存在。但这样做总是合理的吗?为了深入理解这个问题,研究人员研究了在博弈中,均衡在哪些情况下会是一个好的假设。他们不是仅仅研究了井字棋和国际象棋这样的游戏,还研究了所有可能的正则形式的博弈。
他们随机编排了一些游戏,让两个模拟的玩家来参与,然后观察会发生什么。模拟玩家所使用的策略能很好地描述真实生活中的人们在心理学实验中的行为。这些策略都是简单的经验法则,比如采取那些在过去曾行之有效的策略,或者选择最有可能击败对手的上一步举动的策略。
研究人员发现,当博弈足够简单时,理性是一个很好的行为模型,玩家能很容易地找到均衡策略并达到均衡。而当博弈变得复杂时,策略是否会收敛到均衡取决于博弈是否具有竞争性。
如果玩家的动机一致,那么即使博弈很复杂,那么他们也有可能找到均衡策略。但如果动机不一致,那么当博弈变得复杂时,他们就不太可能找到均衡策略了。当这种情况发生时,他们会不断地变换策略,而且通常是混乱地变化,从来不会稳定到均衡状态。在这种情况下,均衡就不是一个合理的行为模型。
从这项研究中得到的一个关键洞察是,博弈逻辑结构中的循环会对能否收敛到均衡产生影响。研究人员分析了当两名决策者都“目光短浅”、只会根据对手的最后一招做出最优反应时会发生的情况:在一些情况下,这能导致收敛到均衡,也就是两名决策者都稳定地使用他们的最优策略,然后一遍又一遍地永远地玩下去。然而,在还有一些情况下,策略的顺序从来没有稳定下来,而是遵循一种最优反应周期,也就是说决策者的策略会不断变化,但是会呈某种周期性的重复。当博弈具有最优反应循环时,收敛到均衡的可能性就会降低。
利用这一结果,论文的作者们可以推导出定量的公式来描述参与到博弈中的决策者何时会收敛到均衡,何时不会。而且他们明确地表明了在复杂且具有竞争性的博弈中,循环普遍存在,收敛到均衡不太可能实现。
编译:津昭
参考来源: