第四章 决策中的收益、损失与效用
例4.1.4
取
θ
\theta
θ用来表示市场需求量,这是具有随机性的变量。用a来表示购买量,这是人可以确定的行动,此时便有收益函数
Q
(
θ
,
a
)
=
{
1.1
∗
0.9
∗
a
−
0.65
∗
a
0.9
∗
a
≤
θ
1.1
∗
θ
−
0.65
∗
a
+
(
0.9
∗
a
−
θ
)
∗
0.3
0.9
∗
a
>
θ
Q(\theta,a)=\begin{cases}1.1*0.9*a-0.65*a&0.9*a\le\theta\\1.1*\theta-0.65*a+(0.9*a-\theta)*0.3&0.9*a>\theta\end{cases}
Q(θ,a)={1.1∗0.9∗a−0.65∗a1.1∗θ−0.65∗a+(0.9∗a−θ)∗0.30.9∗a≤θ0.9∗a>θ
可以化简为
Q
(
θ
,
a
)
=
{
0.34
a
0.9
a
≤
θ
0.8
θ
−
0.38
a
θ
<
0.9
a
Q(\theta,a)=\begin{cases}0.34a&0.9a\le\theta\\0.8\theta-0.38a&\theta<0.9a\end{cases}
Q(θ,a)={0.34a0.8θ−0.38a0.9a≤θθ<0.9a
例4.3.2
在例4.1.4的基础上,采用
[
500
,
2000
]
[500,2000]
[500,2000]上的均匀分布作为先验分布,求先验期望收益
解:
有先验期望为
π
(
θ
)
=
1
1500
,
500
≤
θ
≤
2000
\pi(\theta)=\frac{1}{1500},500\le\theta\le2000
π(θ)=15001,500≤θ≤2000
对收益函数求期望,可有
E
(
Q
(
θ
,
a
)
∣
θ
)
=
∫
500
0.9
a
0.8
θ
−
0.38
a
1
1500
d
θ
+
∫
0.9
a
2000
0.34
a
1
1500
d
θ
=
1
1500
[
−
0.324
a
2
+
870
a
−
10000
]
E(Q(\theta,a)|\theta)=\int_{500}^{0.9a}0.8\theta-0.38a\frac{1}{1500}d\theta+\int_{0.9a}^{2000}0.34a\frac{1}{1500}d\theta\\=\frac{1}{1500}[-0.324a^2+870a-10000]
E(Q(θ,a)∣θ)=∫5000.9a0.8θ−0.38a15001dθ+∫0.9a20000.34a15001dθ=15001[−0.324a2+870a−10000]
这是一个只与行动有关的式子,因为状态被求期望时积分掉了
可有最优行动是在收益取最大值的时候,即
a
=
−
870
2
∗
−
0.324
=
1343
a=\frac{-870}{2*-0.324}=1343
a=2∗−0.324−870=1343
例4.4.1
有收益矩阵
Q
=
(
a
1
a
2
a
3
10
6
2
θ
1
3
4
2
θ
2
−
2.7
−
0.8
1
θ
3
)
Q=\left(\begin{array}{cc} a_1&a_2&a_3\\ 10&6&2&\theta_1\\ 3&4&2&\theta_2\\ -2.7&-0.8&1&\theta_3\\ \end{array}\right)
Q=⎝⎜⎜⎛a1103−2.7a264−0.8a3221θ1θ2θ3⎠⎟⎟⎞
求损失矩阵
解:
现改写为损失矩阵,对每一行求最大值,可有
Q
(
θ
=
θ
1
,
max
a
)
=
10
Q
(
θ
=
θ
2
,
max
a
)
=
4
Q
(
θ
=
θ
3
,
max
a
)
=
1
Q(\theta=\theta_1,\max_a)=10\\ Q(\theta=\theta_2,\max_a)=4\\ Q(\theta=\theta_3,\max_a)=1
Q(θ=θ1,maxa)=10Q(θ=θ2,maxa)=4Q(θ=θ3,maxa)=1
可有损失矩阵
L
(
θ
,
a
)
=
(
a
1
a
2
a
3
0
4
8
θ
1
1
0
2
θ
2
3.7
1.8
0
θ
3
)
L(\theta,a)=\left(\begin{array}{cc} a_1&a_2&a_3\\ 0&4&8&\theta_1\\ 1&0&2&\theta_2\\ 3.7&1.8&0&\theta_3\\ \end{array}\right)
L(θ,a)=⎝⎜⎜⎛a1013.7a2401.8a3820θ1θ2θ3⎠⎟⎟⎞
例4.4.4
在例4.4.1的基础上,求悲观准则下根据收益矩阵和损失矩阵的行动
解:
首先对收益矩阵求解
先求出不同行动的最小收益
Q
(
min
θ
,
a
1
)
=
−
2.7
Q
(
min
θ
,
a
2
)
=
−
0.8
Q
(
min
θ
,
a
3
)
=
1
Q(\min_{\theta},a_1)=-2.7\\ Q(\min_{\theta},a_2)=-0.8\\ Q(\min_{\theta},a_3)=1
Q(minθ,a1)=−2.7Q(minθ,a2)=−0.8Q(minθ,a3)=1
在其中选最大者,可有
Q
(
min
θ
,
max
a
)
=
1
Q(\min_{\theta},\max_{a})=1
Q(minθ,maxa)=1
故选取
a
3
a_3
a3
同理,针对损失矩阵
先求出不同行动的最大损失
L
(
max
θ
,
a
1
)
=
3.7
L
(
max
θ
,
a
2
)
=
4
L
(
max
θ
,
a
3
)
=
8
L(\max_{\theta},a_1)=3.7\\ L(\max_{\theta},a_2)=4\\ L(\max_{\theta},a_3)=8
L(maxθ,a1)=3.7L(maxθ,a2)=4L(maxθ,a3)=8
在其中选最小者,可有
L
(
max
θ
,
min
a
)
=
3.7
L(\max_{\theta},\min_{a})=3.7
L(maxθ,mina)=3.7
故选取
a
1
a_1
a1
例4.4.6
在例4.4.1的基础上,有先验概率,求先验期望损失准则下的最优行动
解
已知先验分布
π
(
θ
)
=
{
θ
1
0.2
θ
2
0.7
θ
3
0.1
\pi(\theta)=\begin{cases} \theta_1&0.2\\\theta_2&0.7\\\theta_3&0.1 \end{cases}
π(θ)=⎩⎪⎨⎪⎧θ1θ2θ30.20.70.1
可有损失
L
(
θ
π
(
θ
)
,
a
1
)
=
0
∗
0.2
+
1
∗
0.7
+
3.7
∗
0.1
=
1.07
L
(
θ
π
(
θ
)
,
a
2
)
=
4
∗
0.2
+
0
∗
0.7
+
1.8
∗
0.1
=
0.98
L
(
θ
π
(
θ
)
,
a
3
)
=
8
∗
0.2
+
2
∗
0.7
+
0
∗
0.1
=
3
L(\theta\pi(\theta),a_1)=0*0.2+1*0.7+3.7*0.1=1.07\\ L(\theta\pi(\theta),a_2)=4*0.2+0*0.7+1.8*0.1=0.98\\ L(\theta\pi(\theta),a_3)=8*0.2+2*0.7+0*0.1=3
L(θπ(θ),a1)=0∗0.2+1∗0.7+3.7∗0.1=1.07L(θπ(θ),a2)=4∗0.2+0∗0.7+1.8∗0.1=0.98L(θπ(θ),a3)=8∗0.2+2∗0.7+0∗0.1=3
选其中最小者,可有
L
(
θ
π
(
θ
)
,
min
a
)
=
0.98
L(\theta\pi(\theta),\min_{a})=0.98
L(θπ(θ),mina)=0.98
故选择行动
a
2
a_2
a2
由于行动
a
1
,
a
2
a_1,a_2
a1,a2的差距不大,小于0.1,故考虑风险,可有
$
V(\theta\pi(\theta),a_1)=0.2*(1.07-0)2+0.7*(1.07-1)2+0.1*(1.07-3.7)^2=0.9241\
V(\theta\pi(\theta),a_2)=0.2*(0.98-0)2+0.7*(0.98-1)2+0.1*(0.98-3.7)^2=2.5636\
V(\theta\pi(\theta),a_3)=0.2*(3-0)2+0.7*(3-1)2+0.1*(3-3.7)^2=6.6
$
可以看到,行动
a
1
a_1
a1的方差更小,更稳定,风险更低,所以也可以选择
例4.5.1
已有收益函数
Q
(
θ
,
a
)
=
{
3.5
θ
a
1
10
+
3
θ
a
2
Q(\theta,a)=\begin{cases} 3.5\theta&a_1\\10+3\theta&a_2 \end{cases}
Q(θ,a)={3.5θ10+3θa1a2
求损失函数
解:
首先判定大小,令
3.5
θ
=
10
+
3
θ
3.5\theta=10+3\theta
3.5θ=10+3θ可有
θ
=
20
\theta=20
θ=20
也就是当
θ
<
20
\theta<20
θ<20时,
a
2
>
a
1
a_2>a_1
a2>a1,否则,
a
1
>
a
2
a_1>a_2
a1>a2
可有损失函数
L
(
θ
,
a
1
)
=
{
10
−
0.5
θ
θ
≤
20
0
θ
>
20
L(\theta,a_1)=\begin{cases} 10-0.5\theta&\theta\le20\\ 0&\theta>20 \end{cases}
L(θ,a1)={10−0.5θ0θ≤20θ>20
L
(
θ
,
a
2
)
=
{
0
θ
≤
20
0.5
θ
−
10
θ
>
20
L(\theta,a_2)=\begin{cases} 0&\theta\le20\\ 0.5\theta-10&\theta>20 \end{cases}
L(θ,a2)={00.5θ−10θ≤20θ>20