纳什均衡和智猪博弈

读书是很有意思的一件事情,不仅仅是收获知识,其中的趣味也相当美妙。

纳什均衡,又称为非合作博弈均衡,是博弈论的一个重要术语,以美国数学家博弈大师约翰·纳什命名。

在一个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略,该策略被称作支配性策略。当每个博弈者的均衡策略都是为了达到自己期望收益的最大值,每个博弈者的策略组合分别构成各自的支配性策略,那么这个组合就被定义为纳什均衡。

纳什均衡一个著名的例子就是囚徒困境,囚徒困境是一个非零和博弈。 大意是:一个案子的两个嫌疑犯被分开审讯,警官分别告诉两个囚犯,如果你招供,而对方不招供,则你将被判刑一年,而对方将被判刑十年;如果两人均招供,将均被判刑五年。 于是,两人同时陷入招供还是不招供的两难处境。其实如果两人均不招供,将最有利,只被判刑三个月。

博弈矩阵
囚犯甲
招供
不招供
囚犯乙
招供
判刑五年
甲判刑十年;乙判刑一年
不招供
甲判刑一年;乙判刑十年
判刑三个月

基于经济学中Rational agent的前提假设,两个囚犯符合自己利益的选择是坦白招供,原本对双方都有利的策略不招供从而均被判刑三个月就不会出现。这样两人都选择坦白的策略以及因此被判5年的结局被称为“纳什均衡”,也叫非合作均衡。

在博弈论(Game Theory)经济学中,“智猪博弈”是一个著名的纳什均衡的例子。 继续阅读“纳什均衡和智猪博弈”