一周读懂博弈论:从理性决策到信息博弈_Day3 静态博弈与纳什均衡:大家同时决策怎么办?
各位小伙伴们,大家好,今天接着学习博弈论
一、为什么需要静态博弈?
先看一个例子:
假设街上有两家奶茶店。
- A奶茶店
- B奶茶店
明天同时决定价格。双方都不知道对方会怎么定价。
此时:
A在思考:
如果B降价怎么办?
B也在思考:
如果A降价怎么办?
这就是典型的:
静态博弈(Static Game)
特点:
所有人同时行动。
注意:
这里的“同时”不一定真的是同一秒。
而是:
做决策时不知道对方的选择。
例如:
- 企业报价
- 招投标
- 考试选择题
都属于静态博弈。
二、优势策略(Dominant Strategy)
先看一个简单矩阵。
| 左 | 右 | |
|---|---|---|
| 上 | 10 | 8 |
| 下 | 5 | 3 |
如果面临是“左”的矩阵:
如果B选左(假设是5):
A选上更好(10)。
10 > 5
如果面临是“右”的矩阵:
如果B选右(假设是3):
A还是选上更好(8)。
8 > 3
结论:无论B怎么选。A都应该选上(就是值更高的)。
这时候:
上策略称为:
优势策略
定义:
无论别人做什么,它都更好。
现实例子:
考试不会的题。
四个选项里:
三个明显错误。
删除错误选项。
这就是优势策略思维。
三、理性化思维
现实中往往不存在优势策略。
怎么办?
博弈论提出:
理性化(Rationalizability)
核心思想:
理性人不会选择明显愚蠢的策略。
于是:不断删除不合理策略。
然后:再删除由此产生的不合理策略。
这个过程叫:
迭代删除
本质上:就是层层推理。
例如:
国际象棋高手。
不会考虑明显送皇后的走法。
因为对手也不会犯这种错误。
四、最佳回应(Best Response)
这是纳什均衡之前最重要的概念。
问题:如果知道别人怎么选。我该怎么选?
例如:如果B选左。A最好选上。
如果B选右。A还是选上。
这就是:
最佳回应
定义:
针对对方策略最有利的应对方式。
纳什均衡其实就是:最佳回应的交点
五、纳什均衡
现代博弈论最重要的概念
定义:
当别人不改变策略时,我也不愿意改变。
看经典案例
囚徒困境)
假设:有两个商家。商品的正常价格:10元。双方利润:100万。(同等商品数量的售卖完成的前提条件下)
情景1:为了获得更多的市场份额,如果自己(一方)降价:
自己利润:150万。
对方利润:20万。
情景2:如果双方都降价:大家利润:50万。
整理成表:
A\B 降价 不降价 降价 50,50 150,20 不降价 20,150 100,100 站在A角度:如果B不降价:我降价更赚钱。
150 > 100
如果B降价:我也应该降价
50 > 20
所以:A会降价。
B同理。
最终:双方都降价。
利润:50万,50万。形成纳什均衡
但实际上:双方都不降价。
利润:100万,100万。更好。
这就是现实中的:
价格战
这揭示:个体理性 ≠ 集体理性
六、静态博弈最重要的结论
静态博弈解决的问题:
当所有人同时行动时,最终会稳定在哪?
答案:纳什均衡
因此:Day3的核心一句话:
纳什均衡就是所有参与者最佳回应相互匹配时形成的稳定状态。
七、知识总结
今天的分享,到此结束啦~
注释:上述思路梳理主要参考 MIT 课程“博弈论的经济应用”相关内容,并借助 AI 工具进行资料搜集与辅助整理,后由作者进一步归纳整合。本文仅作为个人学习记录使用,不当之处,欢迎大家批评指正。
