首发于:2025-12-27
博弈论概述
什么是博弈论
所谓博弈,就是个体之间存在利益冲突情况下的决策问题。比如:
- 中美之间的博弈
- “上有政策,下有对策”
- 企业之间的博弈
- 企业与消费者之间的博弈
- 教师与学生之间的博弈
- 家长与孩子之间的博弈
- (理性的)自己与(懒散的)自己之间的博弈
博弈论发展重要历史节点
| 时间 | 关键人物 | 理论贡献 |
|---|---|---|
| 1883年 | 古诺 | 双寡头产量竞争模型 |
| 1883年 | 伯特兰德 | 双寡头价格竞争模型 |
| 1913年 | 恩斯特·策梅洛 | 关于国际象棋存在确定性结果的定理 |
| 1928年 | 冯·诺依曼 | 双人零和博弈的最小最大定理 |
| 1944年 | 冯·诺依曼和摩根斯坦 | 《博弈论和经济行为》出版 |
| 1950年 | 约翰·纳什 | 纳什均衡(NE),非合作博弈论核心 |
| 1953年 | 约翰·纳什 | 双人谈判理论 |
| 1965年 | 泽尔腾 | 子博弈完美均衡(SPE) |
| 1967年、1968年 | 海萨尼 | 贝叶斯均衡(BE) |
| 1982年 | 戴維·M·克雷普斯 & 罗伯特·B·威尔逊 | 序贯均衡(SE) |
| 1991年 | 弗登博格 & 让·梯若尔 | 完美贝叶斯均衡(PBE) |
古典时期的“田忌赛马”等故事,只能算智谋故事,非现代意义上的博弈论,因为其不涉及求均衡。
博弈论的思维方式
博弈论研究人在博弈中的理性行为选择。更具体地讲,博弈论研究的是人与人之间利益相互制约情况下的策略选择、理性行为及相应结局。
博弈论的思维方式要求参与者(A)的行动选择以其对于对手(B)行动的预期(信念)为基础,而对手(B)的行动选择当然也要以B对于A行动的预期(信念)为基础......这是一种逻辑严密、层层嵌套的换位思考方式,显然是一种不同于传统单向思维的高级思维方式。
什么是理性
博弈论中的理性要求每个参与者追求效用最大化,不用通过你自己的视角去推测对方的目标是否理性,比如,不要用你的视角去衡量恐怖分子自杀式袭击是否理性,要从他的角度去看,可能这是对他来说是效用最大化的。
如何界定是否理性
认知理性:一个参与者能够从他掌握的信息出发,生成对于博弈局势的合理的判断,并能够按照贝叶斯法则来修正自己的信念,那么这个参与者具有认知理想。
工具理性:我已经生成了一个信念之后,我所选择的行为,是最有利于我的目标的,那么参与者具备了工具理性。
认知理性与工具理性合在一起才叫理性。
什么是均衡
在博弈论中,从所有参与者具有理性共识这一假定出发,寻找参与者的信念与策略互相支持、不同参与者的策略互为最优反应的策略组合和相应的信念组合,即博弈问题的均衡状态。
纳什均衡是一种最简单的均衡概念。
博弈论的高阶思维方式的具体运用就体现在求解均衡的过程之中。
博弈论为什么重要
当然,现实中的人几乎不可能是完全理性的。这是否意味着博弈论就不是一种研究社会问题的恰当方法呢?
当然,关于所有个体都是完全理性合智能的假设,在现实生活中是不存在的。
但另一方面,我们也要对于这个假设不相一致的理论和预测表示怀疑。
如果一个理论预测,某些人将经常地被愚弄或做出代价极高的错误行为,那么在这些人对此情形有更好理解(从个人经验或对这个理论本身的学习)之后,这个理论将逐渐失去其有效性。博弈论在社会科学中的重要性在很大程度上来源于这一事实。
博弈论的分类
非合作博弈论
参与者无法达成有约束力的协议,即使有协议也是君子协议,强调个体理想与自利行为。如:囚徒困境、古诺模型都是非合作博弈论的经典模型。
非合作博弈从时间维度划分为:
- 静态博弈:所有参与者的策略都是确定的,博弈结束后,所有参与者的策略都不会改变。
- 动态博弈:参与者的策略是在博弈过程中不断变化的,博弈结束后,所有参与者的策略都可能会改变。离散时间和连续时间动态博弈是两种不同的博弈论模型。
从信息维度划分,非合作博弈又分为:
- 完全信息博弈:所有参与者都知道所有其他参与者的策略。
- 不完全信息博弈:某些参与者只知道其他参与者的部分信息,或者只知道自己的信息。
非合作博弈非常普遍:
- 法律缺失(无法可依)
- 协议违法
- 执法不严
- 不可验证性
合作博弈论
参与者可以达成有约束力的协议,违背协议代价非常大,通过联盟实现集体利益最大化。
合作博弈论与非合作博弈论合起来就是经典博弈论。
演化博弈论
放弃了参与者是理性的这个假定,引入有限理性与动态演化机制,研究策略在群体中的适应性传播。
行为博弈论
结合心理学实验,修正传统“完全理性人”假设,纳入公平、互惠等社会偏好。行为经济学的一个分支。
博弈论在多学科中的应用
经济学
- 谈判理论
- 拍卖理论
- 机制设计
- 企业竞争
- 贸易协定
- 委托代理问题,逆向选择与道德风险
- 劳动力市场,信号发送与信息甄别
政治学
- 选举
- 策略性投票与议程操纵
- 联盟
社会学
- 习俗与社会规范
- 基因——文化共同演化
- 相关均衡
法学
- 合约理论
哲学
- 道德与社会正义
- 零概率事件与不可能事件,逻辑
心理学
- 理性与有限理性
- 期望效用
- 认知,学习
军事
- 威慑策略
- 消耗战
- 军备竞赛
- 导弹与反导系统
游戏与体育
- 简单摊牌博弈
- 国际象棋
- 阿克塞尔罗德竞赛,合作的生发
计算机科学
- 人工智能
- 算法博弈论
- 路由与带宽分配
- 病毒,黑客
自动控制
- 微分博弈与最优控制
博弈论的基本假定
- 参与者都是理性的。
- 博弈的结构是所有参与者的共同知识(每个人都知道,每个人都知道自己知道,且每个人都知道每个人都知道)。即每个参与者都可以看到博弈树。
- 所有参与者都具有“完美回忆”,即都有足够好的记忆力,不会忘记自己以前的行动和自己以前知道的事情。