耶鲁大学公开课博弈论游戏
文章首发于2020年2月15日微博:东尼老西走万里路有关作者:香港土生土长90后,毕业自浸会大学人文及创作学系,现于内地工作生活
【耶鲁大学公开课《博弈论》】
博弈论(Game Theory),是经济学的一个分支,通过研究以优化博弈的策略。
这门课的教授Ben Polak强调博弈论有以下几个重点:
1. 找出优势策略;2. 理性选择(功利计算,甚少或完全不考虑不可量化的条件)3. 有具体目的4. 要换位思考5. 善用backward induction (结合(3)和(4),以结果倒推产出的逆向思维)
【囚徒困境(Prisoner's dilemma)】
这是博弈论入门的经典案例。
不知道的话,可以百度搜索是怎么回事。
结论是:
两个人在单局博弈的时候,因为不论对方选择合作还是背叛,我选择背叛的收益期望收益较高,且担心对方会抱同样想法而选择背叛,因此自己更要选择背叛。结果两人往往都会选择背叛,无法得出双方合作的最优解。
要逃脱这个困局,可以从以下规则的变化再思考:
沟通,建立信任。但对于完全理性的人,这是无效的,因为他们知道承诺并不能改变收益本身,所以承诺是可以违背的。更改收益。例如通过恐吓、利诱等方法,改变选择的收益,从而改变决定有限重复博弈。更改博弈性质,因为要考虑对方会报复,所以双方有可能会倾向合作,以换取下一回合的合作。但跟(1)类似,如果是完全理性的玩家,便会以backward induction推导出:最后一回合对方会背叛自己,所以自己要先一回合背叛对方,而对方也会想到自己先一回合背叛对方,于是更早一回合背叛自己……反复推论直到第一回合,结果双方还是会在第一回合背叛对方无限重复博弈。不一定是真的无限,也可以是未知何时结束的博弈。因为不知道何时结束,所以在(3)「最后一局」而建立的背叛前提就不存在,因此双方会倾向合作。
【性别战(battle of the sexes)】
这种博弈建立在矩阵有多个均衡点,导致双方找到最优解成为了概率性事件。并且即便达到均衡点,也会对其中一方不公平。
这时候就可以考虑「随机策略」,让选择按收益权重重新分配,便可以得出公平的结果。
同样的策略有许多应用场景:
例如在网球比赛上,为了不暴露自己的球技弱点、让对手找到最优解,便可以运用「随机策略」重新分配收益。
【拍卖赛局】
一场充分的拍卖博弈,没有便宜可占。
以最常见价高者得的规则为例,竞投者要对一件物件估价,继而竞投,因此「收益=真实价值-出价」。
而这收益,只有当成功拍下拍卖品,才能获得,否则收益为0。
结论:
第一,竞投者估价偏高。为了成功竞投,取得收益,竞投者估价不会低,甚至会高估拍卖品的价值,导致竞投者收益为负。
第二,尽管大家都能准确估价,大家会为了投得拍卖品取得收益,因此会压缩收益(更高价格),最终导致没有收益(如果条件允许,会无限接近真实价值)
【对博弈论的个人思考】
博弈论难以应用。世界上许多成本与收益都无法量化,因此许多人懂了理论,还是难以正确做出最优选择对手不一定是理性的。在这情况下,博弈模型会更复杂,并非一般人可以处理对于(1),个人认为,大数据技术有机会可以攻克量化的难题,而人工智能可能可以为我们做出最优选择续(3),然而若世界都是已解游戏,再没有意外,在没有惊喜,活在这样的世界上,还有乐趣可言吗?
本文由美行思远留学整理发布,如若转载,请注明出处:https://www.mxsyedu.com/69677.html