贝叶斯例题（四）决策中的收益、损失与效用

2023-12-10 19:03:50

第四章决策中的收益、损失与效用

例4.1.4

取 θ \theta θ用来表示市场需求量，这是具有随机性的变量。用a来表示购买量，这是人可以确定的行动，此时便有收益函数
Q ( θ , a ) = { 1.1 ∗ 0.9 ∗ a − 0.65 ∗ a 0.9 ∗ a ≤ θ 1.1 ∗ θ − 0.65 ∗ a + ( 0.9 ∗ a − θ ) ∗ 0.3 0.9 ∗ a > θ Q(\theta,a)=\begin{cases}1.1*0.9*a-0.65*a&0.9*a\le\theta\\1.1*\theta-0.65*a+(0.9*a-\theta)*0.3&0.9*a>\theta\end{cases} Q(θ,a)={1.1∗0.9∗a−0.65∗a1.1∗θ−0.65∗a+(0.9∗a−θ)∗0.30.9∗a≤θ0.9∗a>θ
可以化简为
Q ( θ , a ) = { 0.34 a 0.9 a ≤ θ 0.8 θ − 0.38 a θ < 0.9 a Q(\theta,a)=\begin{cases}0.34a&0.9a\le\theta\\0.8\theta-0.38a&\theta<0.9a\end{cases} Q(θ,a)={0.34a0.8θ−0.38a0.9a≤θθ<0.9a

例4.3.2

在例4.1.4的基础上，采用 [ 500 , 2000 ] [500,2000] [500,2000]上的均匀分布作为先验分布，求先验期望收益
解：
有先验期望为 π ( θ ) = 1 1500 , 500 ≤ θ ≤ 2000 \pi(\theta)=\frac{1}{1500},500\le\theta\le2000 π(θ)=15001,500≤θ≤2000
对收益函数求期望，可有
E ( Q ( θ , a ) ∣ θ ) = ∫ 500 0.9 a 0.8 θ − 0.38 a 1 1500 d θ + ∫ 0.9 a 2000 0.34 a 1 1500 d θ = 1 1500 [ − 0.324 a 2 + 870 a − 10000 ] E(Q(\theta,a)|\theta)=\int_{500}^{0.9a}0.8\theta-0.38a\frac{1}{1500}d\theta+\int_{0.9a}^{2000}0.34a\frac{1}{1500}d\theta\\=\frac{1}{1500}[-0.324a^2+870a-10000] E(Q(θ,a)∣θ)=∫5000.9a0.8θ−0.38a15001dθ+∫0.9a20000.34a15001dθ=15001[−0.324a2+870a−10000]
这是一个只与行动有关的式子，因为状态被求期望时积分掉了
可有最优行动是在收益取最大值的时候，即 a = − 870 2 ∗ − 0.324 = 1343 a=\frac{-870}{2*-0.324}=1343 a=2∗−0.324−870=1343

例4.4.1

有收益矩阵
Q = ( a 1 a 2 a 3 10 6 2 θ 1 3 4 2 θ 2 − 2.7 − 0.8 1 θ 3 ) Q=\left(\begin{array}{cc} a_1&a_2&a_3\\ 10&6&2&\theta_1\\ 3&4&2&\theta_2\\ -2.7&-0.8&1&\theta_3\\ \end{array}\right) Q=⎝⎜⎜⎛a1103−2.7a264−0.8a3221θ1θ2θ3⎠⎟⎟⎞
求损失矩阵
解：
现改写为损失矩阵，对每一行求最大值，可有
Q ( θ = θ 1 , max ⁡ a ) = 10 Q ( θ = θ 2 , max ⁡ a ) = 4 Q ( θ = θ 3 , max ⁡ a ) = 1 Q(\theta=\theta_1,\max_a)=10\\ Q(\theta=\theta_2,\max_a)=4\\ Q(\theta=\theta_3,\max_a)=1 Q(θ=θ1,maxa)=10Q(θ=θ2,maxa)=4Q(θ=θ3,maxa)=1
可有损失矩阵
L ( θ , a ) = ( a 1 a 2 a 3 0 4 8 θ 1 1 0 2 θ 2 3.7 1.8 0 θ 3 ) L(\theta,a)=\left(\begin{array}{cc} a_1&a_2&a_3\\ 0&4&8&\theta_1\\ 1&0&2&\theta_2\\ 3.7&1.8&0&\theta_3\\ \end{array}\right) L(θ,a)=⎝⎜⎜⎛a1013.7a2401.8a3820θ1θ2θ3⎠⎟⎟⎞

例4.4.4

在例4.4.1的基础上，求悲观准则下根据收益矩阵和损失矩阵的行动
解：
首先对收益矩阵求解
先求出不同行动的最小收益
Q ( min ⁡ θ , a 1 ) = − 2.7 Q ( min ⁡ θ , a 2 ) = − 0.8 Q ( min ⁡ θ , a 3 ) = 1 Q(\min_{\theta},a_1)=-2.7\\ Q(\min_{\theta},a_2)=-0.8\\ Q(\min_{\theta},a_3)=1 Q(minθ,a1)=−2.7Q(minθ,a2)=−0.8Q(minθ,a3)=1
在其中选最大者，可有 Q ( min ⁡ θ , max ⁡ a ) = 1 Q(\min_{\theta},\max_{a})=1 Q(minθ,maxa)=1
故选取 a 3 a_3 a3
同理，针对损失矩阵
先求出不同行动的最大损失
L ( max ⁡ θ , a 1 ) = 3.7 L ( max ⁡ θ , a 2 ) = 4 L ( max ⁡ θ , a 3 ) = 8 L(\max_{\theta},a_1)=3.7\\ L(\max_{\theta},a_2)=4\\ L(\max_{\theta},a_3)=8 L(maxθ,a1)=3.7L(maxθ,a2)=4L(maxθ,a3)=8
在其中选最小者，可有 L ( max ⁡ θ , min ⁡ a ) = 3.7 L(\max_{\theta},\min_{a})=3.7 L(maxθ,mina)=3.7
故选取 a 1 a_1 a1

例4.4.6

在例4.4.1的基础上，有先验概率，求先验期望损失准则下的最优行动
解
已知先验分布 π ( θ ) = { θ 1 0.2 θ 2 0.7 θ 3 0.1 \pi(\theta)=\begin{cases} \theta_1&0.2\\\theta_2&0.7\\\theta_3&0.1 \end{cases} π(θ)=⎩⎪⎨⎪⎧θ1θ2θ30.20.70.1
可有损失
L ( θ π ( θ ) , a 1 ) = 0 ∗ 0.2 + 1 ∗ 0.7 + 3.7 ∗ 0.1 = 1.07 L ( θ π ( θ ) , a 2 ) = 4 ∗ 0.2 + 0 ∗ 0.7 + 1.8 ∗ 0.1 = 0.98 L ( θ π ( θ ) , a 3 ) = 8 ∗ 0.2 + 2 ∗ 0.7 + 0 ∗ 0.1 = 3 L(\theta\pi(\theta),a_1)=0*0.2+1*0.7+3.7*0.1=1.07\\ L(\theta\pi(\theta),a_2)=4*0.2+0*0.7+1.8*0.1=0.98\\ L(\theta\pi(\theta),a_3)=8*0.2+2*0.7+0*0.1=3 L(θπ(θ),a1)=0∗0.2+1∗0.7+3.7∗0.1=1.07L(θπ(θ),a2)=4∗0.2+0∗0.7+1.8∗0.1=0.98L(θπ(θ),a3)=8∗0.2+2∗0.7+0∗0.1=3
选其中最小者，可有 L ( θ π ( θ ) , min ⁡ a ) = 0.98 L(\theta\pi(\theta),\min_{a})=0.98 L(θπ(θ),mina)=0.98
故选择行动 a 2 a_2 a2
由于行动 a 1 , a 2 a_1,a_2 a1,a2的差距不大，小于0.1，故考虑风险，可有
$
V(\theta\pi(\theta),a_1)=0.2*(1.07-0)^{2+0.7*(1.07-1)}2+0.1*(1.07-3.7)^2=0.9241\
V(\theta\pi(\theta),a_2)=0.2*(0.98-0)^{2+0.7*(0.98-1)}2+0.1*(0.98-3.7)^2=2.5636\
V(\theta\pi(\theta),a_3)=0.2*(3-0)^2+0.7*(3-1)2+0.1*(3-3.7)^2=6.6
$
可以看到，行动 a 1 a_1 a1的方差更小，更稳定，风险更低，所以也可以选择

例4.5.1

已有收益函数
Q ( θ , a ) = { 3.5 θ a 1 10 + 3 θ a 2 Q(\theta,a)=\begin{cases} 3.5\theta&a_1\\10+3\theta&a_2 \end{cases} Q(θ,a)={3.5θ10+3θa1a2
求损失函数
解：
首先判定大小，令 3.5 θ = 10 + 3 θ 3.5\theta=10+3\theta 3.5θ=10+3θ可有 θ = 20 \theta=20 θ=20
也就是当 θ < 20 \theta<20 θ<20时， a 2 > a 1 a_2>a_1 a2>a1，否则， a 1 > a 2 a_1>a_2 a1>a2
可有损失函数
L ( θ , a 1 ) = { 10 − 0.5 θ θ ≤ 20 0 θ > 20 L(\theta,a_1)=\begin{cases} 10-0.5\theta&\theta\le20\\ 0&\theta>20 \end{cases} L(θ,a1)={10−0.5θ0θ≤20θ>20
L ( θ , a 2 ) = { 0 θ ≤ 20 0.5 θ − 10 θ > 20 L(\theta,a_2)=\begin{cases} 0&\theta\le20\\ 0.5\theta-10&\theta>20 \end{cases} L(θ,a2)={00.5θ−10θ≤20θ>20

码农公寓

第四章 决策中的收益、损失与效用