title: 博弈论 斯坦福game theory stanford week 4-1
tags: note
notebook: 6- 英文课程-15-game theory
---
博弈论 斯坦福game theory stanford week 4-1
最后通牒式议价
他的形式是这样的,一个博弈者向另外一个博弈者提供一个价格,另一个决策者选择是否接受,如果不接受那么两个人将会什么都得不到。
如果接受,那么1得到10-x,2得到x
在上述条件下,我们可以推论玩家2可能会接受所有的可能的x,如果玩家1让x=0,他都有可能会接受。在这样的条件下,玩家1会不会接受0主要取决于玩家2会不会接受0.
但是在实际的博弈中并非是这样的,更多的人愿意选择和接受5
子游戏的完美性也许有时候并不适应整个的现实,但是他会帮助我们深入的理解博弈的本质。
有些的情况是十分难以解决的:比如下棋。并且我们很难相信人类是完全通过逻辑来解决下期问题的。这需要经验和灵感。
不完全信息博弈
我们考虑扑克游戏,在玩扑克游戏的时候,人们相互之间进行博弈,但是他们每个人都不能掌握完整的信息。
在扑克中:
我们有很多不同的手牌
有很多不同的策略
并且我们很难通过画出树状图的形式来描述这个游戏,我们对于这种游戏可以学习很多。
不完整信息形式--定义和策略
我们之前分析的情况是每个人都知道其他人的选择,我们使用树形结构来对这些情况进行描写。但是在我们之前讨论的棋牌游戏中,我们无法知道别人可以进行的选择。所以我们定义不完整信息博弈的情况如下。
可以看到,定义和之前的很像。
我们举个例子:
在这样的博弈中,我们看到博弈者1有两个选择节点。由于他的信息并不能提前得到,因此他在第二次选择的时候只能选择一种情况。l 和 r。
因此博弈者一只有四种选择的可能分别是:
Ll,Lr,Rl,Rr
同样的我们可以用这种形式描述任何的一般形式的博弈。
比如我们之前用过的TCP问题。
不完整信息问题的纯策略
和之前的方法相同,我们可以为所有的博弈找到他们的纯策略。
混合策略和纯策略都可以用原来的定义进行描述,
在这样的情况下,我们可以定义将一个深度很高的树,转化为一个很宽的树,同样的我们可以将一个很宽的树转化成一个深度很高的树。
混合的和行为性的策略
我们在解决不完整信息博弈问题中有两种主要的策略,一种是混合策略,一种是行为策略。
混合策略是随机使用所有的纯策略
行为策略,还是用这个博弈作为例子,我们来看下行为策略是什么样的。
行为策略这样描述,选择A的概率是0.5,选择G的概率是0.3。
混合策略是这样的:0.6选择(AG),0.4选择GH。
看起来这两种策略的形式十分的相似,可以进行相互的转化,
回顾
在这样的一个博弈中,我们有以下几点可以得到:
- 博弈者2的D是一个占优策略
- LR这个博弈是一个十分的有优势的博弈,但是在混合策略中不能得到。
那么在行为策略中的均衡在哪里呢?
同样的,我们可以知道,D是占优的。如果我们使用行为策略,我们可以使用列方程的形式进行衡量。
可以接触
非完整信息博弈的解决
在不完整信息博弈中可能没有合适的子问题,不过我们可以进行推理。
在这样的问题中,我们带入如下的情景:
- 有一家公司想要进入某一领域和另外一家公司竞争。
- 第一个N节点代表他是否强于另外一家公司。
- 第一家公司会选择是否进入这个领域,接下来原来这个领域的公司会选择是否会与之竞争。
我们分析,无论公司是强是弱,他选择进入领域,如果他的对手与之争斗他都会遭到损失,在这样的情况下,他不会选择进入这个领域,所以在这个情景内。公司不会进入这个领域。
因此均衡出现在:
这个条件下。
但是如果我们这样考虑,考虑公司2的选择,他选择与之竞争一定会造成损失。那么他如果选择接受呢?
如果新的公司是强大的,那么他会选择进入,因为这有更大的收益,如果不强大,那么他会选择不进入。
这是另外一个纳什均衡。
序列均衡和完美贝叶斯均衡
人们在很多情况是根据他们的估计和信念进行选择的。就像前面的博弈,有两个纳什均衡,但是具体会走向那个纳什均衡,要看他么之间的估计和信念。