博弈论 斯坦福game theory stanford week 4.1_


title: 博弈论 斯坦福game theory stanford week 4-1
tags: note
notebook: 6- 英文课程-15-game theory
---

博弈论 斯坦福game theory stanford week 4-1

最后通牒式议价

他的形式是这样的,一个博弈者向另外一个博弈者提供一个价格,另一个决策者选择是否接受,如果不接受那么两个人将会什么都得不到。

如果接受,那么1得到10-x,2得到x

博弈论 斯坦福game theory stanford week 4.1_

在上述条件下,我们可以推论玩家2可能会接受所有的可能的x,如果玩家1让x=0,他都有可能会接受。在这样的条件下,玩家1会不会接受0主要取决于玩家2会不会接受0.

但是在实际的博弈中并非是这样的,更多的人愿意选择和接受5

子游戏的完美性也许有时候并不适应整个的现实,但是他会帮助我们深入的理解博弈的本质。

有些的情况是十分难以解决的:比如下棋。并且我们很难相信人类是完全通过逻辑来解决下期问题的。这需要经验和灵感。

不完全信息博弈

我们考虑扑克游戏,在玩扑克游戏的时候,人们相互之间进行博弈,但是他们每个人都不能掌握完整的信息。

在扑克中:

我们有很多不同的手牌

有很多不同的策略

并且我们很难通过画出树状图的形式来描述这个游戏,我们对于这种游戏可以学习很多。

不完整信息形式--定义和策略

我们之前分析的情况是每个人都知道其他人的选择,我们使用树形结构来对这些情况进行描写。但是在我们之前讨论的棋牌游戏中,我们无法知道别人可以进行的选择。所以我们定义不完整信息博弈的情况如下。

博弈论 斯坦福game theory stanford week 4.1_

可以看到,定义和之前的很像。

我们举个例子:

博弈论 斯坦福game theory stanford week 4.1_

在这样的博弈中,我们看到博弈者1有两个选择节点。由于他的信息并不能提前得到,因此他在第二次选择的时候只能选择一种情况。l 和 r。

因此博弈者一只有四种选择的可能分别是:

Ll,Lr,Rl,Rr

同样的我们可以用这种形式描述任何的一般形式的博弈。

比如我们之前用过的TCP问题。

不完整信息问题的纯策略

和之前的方法相同,我们可以为所有的博弈找到他们的纯策略。

混合策略和纯策略都可以用原来的定义进行描述,

在这样的情况下,我们可以定义将一个深度很高的树,转化为一个很宽的树,同样的我们可以将一个很宽的树转化成一个深度很高的树。

混合的和行为性的策略

我们在解决不完整信息博弈问题中有两种主要的策略,一种是混合策略,一种是行为策略。

混合策略是随机使用所有的纯策略

行为策略,还是用这个博弈作为例子,我们来看下行为策略是什么样的。

行为策略这样描述,选择A的概率是0.5,选择G的概率是0.3。

混合策略是这样的:0.6选择(AG),0.4选择GH。

看起来这两种策略的形式十分的相似,可以进行相互的转化,

回顾

博弈论 斯坦福game theory stanford week 4.1_

在这样的一个博弈中,我们有以下几点可以得到:

  1. 博弈者2的D是一个占优策略
  2. LR这个博弈是一个十分的有优势的博弈,但是在混合策略中不能得到。

那么在行为策略中的均衡在哪里呢?

同样的,我们可以知道,D是占优的。如果我们使用行为策略,我们可以使用列方程的形式进行衡量。

博弈论 斯坦福game theory stanford week 4.1_

可以接触

非完整信息博弈的解决

在不完整信息博弈中可能没有合适的子问题,不过我们可以进行推理。

博弈论 斯坦福game theory stanford week 4.1_

在这样的问题中,我们带入如下的情景:

  • 有一家公司想要进入某一领域和另外一家公司竞争。
  • 第一个N节点代表他是否强于另外一家公司。
  • 第一家公司会选择是否进入这个领域,接下来原来这个领域的公司会选择是否会与之竞争。

我们分析,无论公司是强是弱,他选择进入领域,如果他的对手与之争斗他都会遭到损失,在这样的情况下,他不会选择进入这个领域,所以在这个情景内。公司不会进入这个领域。

因此均衡出现在:

博弈论 斯坦福game theory stanford week 4.1_

这个条件下。

但是如果我们这样考虑,考虑公司2的选择,他选择与之竞争一定会造成损失。那么他如果选择接受呢?

如果新的公司是强大的,那么他会选择进入,因为这有更大的收益,如果不强大,那么他会选择不进入。

这是另外一个纳什均衡。

序列均衡和完美贝叶斯均衡

人们在很多情况是根据他们的估计和信念进行选择的。就像前面的博弈,有两个纳什均衡,但是具体会走向那个纳什均衡,要看他么之间的估计和信念。

上一篇:一种简单的色彩平衡算法的OPENCV实现


下一篇:salt-ssh使用说明