零和博弈中范式概率的计算
1. 问题
数学家约翰·冯·诺伊曼认为概率可以解决这一困境。这两名玩家应对其可选的行动计算其胜出概率,然后根据这些概率,使用一个随机逻辑元件,选择他们的行动。每个玩家计算概率。这极小化极大算法可以计算所有二人零和游戏的最佳战略。
对应上面的例子,红方选择动作1的概率为4/7和行动2的概率为3/7,而蓝方选择动作的概率为0、4/7和3/7,对应A、B和C三个行动。及后红方平均每场比赛将会赢得20/7分。
维基百科中文零和博弈—解决方案—范例
英文维基百科也有该例子—soulution—example
红方选择动作1的概率为4/7和行动2的概率为3/7,这两个概率是怎么算的?
2. 计算方法
计算方法主要参考链接
三十分钟理解博弈论—纳什均衡案例—硬币正反
- 首先,不存在蓝方A选择的可能,因为A选择,无论红方如何选择都会使蓝方收益减少。去除掉A选择,蓝方只有两种选择。这就和上面两个链接中的题目相同了。混合策略引入了概率。
- 参考链接1的解题方法
红选1的概率计算
蓝选B的概率计算
红平均每场的收益
这样计算似乎没用到minimax,本来是来了解minimax的