第一章 损失分布
第一节 随机变量的数字特征
一、特征函数和矩母函数
特征函数和矩母函数是对分布函数的变换,常用于确定独立随机变量之和的分布。
特征函数:对于随机变量 \(X\) ,其分布函数为 \(F(x)\) ,其特征函数的定义为:
\[\phi_X(t)=\mathbb{E}\left[e^{\mathrm{i}tX}\right] . \]定理:分布函数序列 \(F_n(x)\) 收敛于分布函数 \(F(x)\) 的充分必要条件是 \(F_n(x)\) 的特征函数 \(\phi_n(t)\) 收敛于 \(F(x)\) 的特征函数 \(\phi(t)\) 。
矩母函数:对于随机变量 \(X\) ,其分布函数为 \(F(x)\) ,其矩母函数的定义为:
\[m_X(t)=\mathbb{E}\left[e^{tX}\right] . \]定理:随机变量 \(X\) 的 \(k\) 阶矩等于矩母函数的 \(k\) 阶导数在 \(t=0\) 处的取值,即
\[\mathbb{E}\left[X^k\right]=\frac{\mathrm{d}^k}{\mathrm{d}t^k}m_X(t)\bigg|_{t=0}. \]定理:如果随机变量 \(X\) 和 \(Y\) 相互独立,则有
\[\begin{aligned} &\phi_{X+Y}(t)=\mathbb{E}\left[e^{\mathrm{i}t(X+Y)}\right]=\mathbb{E}\left[e^{\mathrm{i}tX}\right]\mathbb{E}\left[e^{\mathrm{i}tY}\right]=\phi_X(t)\phi_Y(t). \\ \\ &m_{X+Y}(t)=\mathbb{E}\left[e^{t(X+Y)}\right]=\mathbb{E}\left[e^{tX}\right]\mathbb{E}\left[e^{tY}\right]=m_X(t)m_Y(t). \end{aligned} \]注意:随机变量的矩母函数可能存在,也可能不存在。如果随机变量的矩母函数不存在,则该随机变量的分布被称为重尾分布(这是重尾分布的一种定义)。
定理:假设随机变量 \(X_n\) 和 \(X\) 的矩母函数存在,则 \(X_n\) 的矩母函数 \(m_n(t)\) 收敛于 \(X\) 的矩母函数 \(m(t)\) 的充分必要条件是 \(X_n\) 的分布函数 \(F_n(x)\) 收敛于 \(X\) 的分布函数 \(F(x)\) 。
二、概率母函数和累积量母函数
概率母函数:对于随机变量 \(X\) ,其概率母函数的定义为:
\[g_X(t)=\mathbb{E}\left[t^X\right]=\sum_{t=0}^\infty t^k\mathrm{Pr}(X=k). \]从定义可以看出,概率母函数仅用于取值为自然数的随机变量。当 \(|t|\leq1\) 时,该级数是绝对收敛的。
累积量母函数:对于随机变量 \(X\) ,其分布函数为 \(F(x)\) ,其累积量母函数的定义为:
\[\kappa_X(t)=\log m_X(t)=\log\mathbb{E}\left[e^{tX}\right]. \]累积量母函数为计算随机变量的中心矩提供了很大方便。记 \(\mu_k=\mathbb{E}\left[X^k\right]\) ,并以 \(O(t^k)\) 表示 \(t\) 的 \(k\) 次幂或高于 \(k\) 次幂。首先对矩母函数 \(m_X(t)\) 在 \(t=0\) 处进行 Taylor 展开,
\[m_X(t)=\left[e^{tX}\right]=1+\mu_1t+\frac12\mu_2t^2+\frac16\mu_3t^3+O(t^4), \]再利用 \(\log(1+x)\) 的 Taylor 展开式可得
\[\begin{aligned} \log\mathbb{E}\left[e^{tX}\right]&=\log\left(1+\mu_1t+\frac12\mu_2t^2+\frac16\mu_3t^3+O(t^4)\right) \\ \\ &\begin{aligned} &=\mu_1t+\frac12\mu_2t^2+\frac16\mu_3t^3+O(t^4) \\ \\ &\quad\, -\frac12\left(\mu_1^2t^2+\mu_1\mu_2t^3+O(t^4)\right) \\ \\ &\quad\, +\frac13\left(\mu_1^3t^3+O(t^4)\right)+O(t^4) \end{aligned}\\ \\ &=\mu_1t+\frac12\left(\mu_2-\mu_1^2\right)t^2+\frac16\left(\mu_3-3\mu_1\mu_2+2\mu_1^3\right)t^3+O(t^4) \\ \\ &=\mathbb{E}[X]t+{\rm Var}(X)\frac12t^2+\mathbb{E}\left[(X-\mathbb{E}(X))\right]\frac16t^3+O(t^4). \end{aligned} \]定理:随机变量 \(X\) 的 \(k\) 阶中心矩等于累积量母函数的 \(k\) 阶导数在 \(t=0\) 处的取值,记为
\[\kappa_k\equiv\mathbb{E}\left[(X-\mathbb{E}(X))^k\right]=\frac{\mathrm{d}^k}{\mathrm{d}t^k}m_X(t)\bigg|_{t=0}. \]特别地,常用的中心矩如下:
\[\kappa_1=\mathbb{E}(X), \quad \kappa_2={\rm Var}(X),\quad \kappa_3=\mathbb{E}\left[(X-\mathbb{E}(X))^3\right]. \]偏度:对于随机变量 \(X\) ,其偏度的定义为
\[\gamma_X=\frac{\kappa_3}{\kappa_2^{3/2}}=\frac{\mathbb{E}\left[(X-\mathbb{E}(X))^3\right]}{(\sqrt{{\rm Var}(X)})^3}. \]偏度是描述随机变量分布非对称程度的数值特征,描述随机变量分布偏斜的方向和程度。
- 如果 \(\gamma_X>0\) ,则称随机变量的分布函数具有右偏态,或称右拖尾;
- 如果 \(\gamma_X<0\) ,则称随机变量的分布函数具有左偏态,或称左拖尾;
- 如果随机变量 \(X\) 的分布函数是对称的,则有 \(\gamma_X=0\) ,但反之并不成立,即如果 \(\gamma_X=0\) ,随机变量 \(X\) 的分布函数不一定是对称的。
性质:特征函数、累积量母函数和概率母函数都可以看成是矩母函数的函数,其关系如下:
- 特征函数:\(\phi_X(t)=m_X(\mathrm{i}t)\) ;
- 累积量母函数:\(\kappa_X(t)=\log(m_X(t))\) ;
- 概率母函数:\(g_X(t)=m_X(\log t)\) 。
第二节 索赔次数的损失分布
一、索赔次数的损失分布族
损失与赔付是两个不同但又密切相关的概念:
- 损失是指承保险标的可能发生的实际损失大小;
- 赔付是指保险人按承保合同规定的保险责任所支付的实际费用;
- 赔付是损失的函数,小于等于实际损失;
- 从数学的角度,损失和赔付均是随机的,可以看成是随机变量。
由于常见的索赔次数的损失分布均为取值为自然数的随机变量,因此可以采用概率母函数来描述这类随机变量的分布的特征。
常见的索赔次数的损失分布包括二项分布、几何分布、负二项分布和泊松分布等等,这里给出它们的概率分布列:
二项分布 \(B(n,\theta)\) :
\[f(x)={n\choose x}\theta^x(1-\theta)^{n-x},\quad x=0,1,\cdots,n. \]几何分布 \(G(\theta)\) :
\[f(x)=\theta(1-\theta)^x,\quad x=0,1,\cdots . \]负二项分布 \(NB(r,\theta)\) :
\[f(x)={x+r-1 \choose r-1}\theta^r(1-\theta)^x,\quad x=0,1,\cdots . \]泊松分布 \(P(\lambda)\) :
\[f(x)=e^{-\lambda}\frac{\lambda^x}{x!},\quad x=0,1,\cdots. \]
下面给出 \((a,b,0)\) 族和 \((a,b,1)\) 族的定义。
如果非负离散随机变量 \(X\) 的概率分布满足
\[f_X(x)=\left(a+\frac bx\right)f_X(x-1),\quad x=1,2,\cdots, \]则称随机变量 \(X\) 属于 \((a,b,0)\) 族,其中 \(a\) 和 \(b\) 为常数,\(f(0)\) 给定,简记为 \(X\in(a,b,0)\) 。
如果非负离散随机变量 \(X\) 的概率分布满足
\[f_X(x)=\left(a+\frac bx\right)f_X(x-1),\quad x=2,3\cdots, \]则称随机变量 \(X\) 属于 \((a,b,1)\) 族,其中 \(a\) 和 \(b\) 为常数,\(f(1)\) 给定,简记为 \(X\in(a,b,1)\) 。
从定义可以看出,\((a,b,0)\) 族与 \((a,b,1)\) 族具有相同的迭代公式,所不同的只是起始点的不同。类似地也可以继续定义 \((a,b,2)\) 族等等。
常见的索赔次数的损失分布均属于 \((a,b,0)\) 族,这里给出它们的 \(a,b\) 和 \(f(0)\) 的取值:
二项分布:
\[a=-\dfrac{\theta}{1-\theta},\quad b=\dfrac{\theta(n+1)}{1-\theta},\quad f(0)=(1-\theta)^n. \]几何分布:
\[a=1-\theta,\quad b=0,\quad f(0)=\theta. \]负二项分布:
\[a=1-\theta,\quad b=(r-1)(1-\theta),\quad f(0)=\theta^r. \]泊松分布:
\[a=0,\quad b=\lambda,\quad f(0)=e^{-\lambda}. \]
二、零调整分布和零截断分布
一般情形下,若损失 \(X\in(a,b,1)\) ,则 \(f(0)\neq0\) ,保险索赔分布往往具有这种性质。
因为一般情形下,保险索赔次数发生 \(0\) 次的概率很高,因此 \((a,b,1)\) 族分布更符合保险中的损失分布的意义,而 \((a,b,0)\) 族分布不能很好地刻画索赔次数。
因此需要修改保险索赔次数发生 \(0\) 次的概率,即修改 \((a,b,0)\) 族分布在 \(0\) 点的概率来得到 \((a,b,1)\) 族分布,这就是零调整分布。
零调整分布:记损失 \(X\in(a,b,0)\) ,修正后的分布 \(Y\in(a,b,1)\) ,并且
\[f_Y(i)=c f_X(i),\quad i=1,2,\cdots, \]则有如下关系
\[1=f_Y(0)+\sum_{i=1}^\infty f_Y(i)=f_Y(0)+c\sum_{i=1}^\infty f_Y(i)=f_Y(0)+c\left[1-f_X(0)\right]. \]所以可以推出
\[c=\frac{1-f_Y(0)}{1-f_X(0)} , \quad c<1. \]随机变量 \(Y\) 称为基于随机变量 \(X\) 的零调整分布。
注意:构造零调整分布的目的是将一个 \((a,b,0)\) 族分布的 \(f(0)\) 调整为一个较大的概率。还有一种与之相对的分布称为零截断分布,其目的是将 \((a,b,0)\) 族分布的 \(f(0)\) 调整为 \(0\) 。
零截断分布:记损失 \(X\in(a,b,0)\) ,修正后的分布为 \(Z\) ,满足 \(f_Z(0)=0\) ,并且
\[f_Z(i)=c f_X(i),\quad i=1,2,\cdots, \]则有如下关系
\[1=\sum_{i=1}^\infty f_Z(i)=c\sum_{i=1}^\infty f_X(i)=c\left[1-f_X(0)\right]. \]所以可以推出
\[c=\frac{1}{1-f_X(0)} , \quad c>1. \]随机变量 \(Z\) 称为基于随机变量 \(X\) 的零截断分布。
例如:写出 \(X\sim B(4,0.3)\) 的零调整分布 \(Y\) 和零截断分布 \(Z\) 的概率分布列,其中 \(f_Y(0)=0.4\) 。
零调整分布:
\[c=\frac{1-f_Y(0)}{1-f_X(0)}=\frac{1-0.4000}{1-0.2401}=0.7896. \]零截断分布:
\[c=\frac{1}{1-f_X(0)}=\frac{1}{1-0.2401}=1.3160. \]修改后的结果如下表所示
\[\begin{array}{c|c|c|c} \hline i & X & Y & Z \\ \hline 0 & 0.2401 & 0.4000 & 0 \\ 1 & 0.4116 & 0.3250 & 0.5416 \\ 2 & 0.2646 & 0.2089 & 0.3842 \\ 3 & 0.0756 & 0.0597 & 0.0995 \\ 4 & 0.0081 & 0.0064 & 0.0107 \\ \hline \end{array} \]
三、复合分布
假设 \(\{X_i,i=1,2,\cdots\}\) 是取值为正整数的随机变量,且均与 \(X\) 同分布,假设 \(N\) 也是取值为正整数的随机变量,且与 \(\{X_i,i=1,2,\cdots\}\) 独立,定义
\[S_N=X_1+X_2+\cdots+X_N, \]称随机变量 \(S_N\) 的分布为复合分布。
例如:假设 \(X_1\) 和 \(X_2\) 独立同分布,且服从二项分布 \(B(2,0.1)\) ,假设 \(N\) 服从两点分布
\[f_N(1)=f_N(2)=\frac12, \]计算 \(S_N\) 的分布。
解:注意到 \(S_N\) 是一个离散型随机变量,可能的取值为 \(0,1,2,3,4\) 。计算 \(S_N\) 的概率分布律为
\[\begin{array}{c|ccccc} S_N & 0 & 1 & 2 & 3 & 4\\ \hline \mathrm{Pr} & 0.73305 & 0.23580 & 0.02930 & 0.00180 & 0.00005 \end{array} \]
第三节 索赔额的损失分布
一、常用的索赔额分布
(1) 指数分布 \({\rm Exp}(\lambda)\) ,指数分布是一种尾比较轻的分布。
(2) 伽马分布 \(\Gamma(\alpha,\beta)\) ,适用于理赔分布不是太重的情形,例如在机动车险中自己车辆损伤保险。
(3) 对数正态分布 \(LN(\mu,\sigma^2)\) ,适用于理赔分布略重一些的情形,例如火灾险中的理赔额。
(4) Pareto 分布 \(P(\alpha,\gamma)\) ,其概率密度函数为
\[f(x)=\frac{\alpha\gamma^\alpha}{(x+\gamma)^{\alpha+1}} ,\quad x>0. \]适用于发生大理赔的可能性很大的情形,特别是在第三者责任险中。
(5) 逆高斯分布 \(IG(\alpha,\beta)\) ,其分布函数为
\[F(x;\alpha,\beta)=\Phi\left(\frac{-\alpha}{\sqrt{\beta x}}+\sqrt{\beta x}\right)+e^{2\alpha}\Phi\left(\frac{-\alpha}{\sqrt{\beta x}}-\sqrt{\beta x}\right). \]注意:当 \(x\to 0^+\) 时,该分布函数的极限为 \(0\) ;当 \(x\to\infty\) 时,该分布函数的极限为 \(1\) 。
其概率密度函数为分布函数的导数,在 \((0,\infty)\) 上取正值,具有如下形式:
\[f(x;\alpha,\beta)=\frac{\alpha}{\sqrt{2\pi\beta}}x^{-3/2}\exp\left\{{-\frac{(\alpha-\beta x)^2}{2\beta x}}\right\} ,\quad x>0. \]其矩母函数为
\[m(t;\alpha,\beta)=\exp\left\{\alpha\left[1-\sqrt{1-\frac{2t}{\beta}}\right]\right\},\quad t\leq \frac\beta2. \]注意:当 \(t\leq\dfrac\beta2\) 时,矩母函数存在;当 \(t>\dfrac\beta2\) 时,矩母函数不存在。
逆高斯分布来源于其累积量母函数是正态分布累积量母函数的反函数,逆高斯分布在寿命试验、卫生科学、精算学、生态学、昆虫学等众多领域得到了极为广泛的应用。
二、混合分布
指数混合分布:如果一个指数分布的参数是随机的,分别以概率 \(q\) 和 \(1-q\) 取值于 \(\alpha\) 和 \(\beta\) ,则指数混合分布的密度函数为
\[p(x)=q\alpha e^{-\alpha x}+(1-q)\beta e^{-\beta x},\quad x>0. \]对每个给定的 \(q\in[0,1]\) ,函数 \(p(\cdot)\) 是一个概率密度函数。
注意:指数分布和指数混合分布等在精算中主要是其理论上的意义,假设损失分布为指数分布,会产生很多良好的精算理论结果。
指数分布的组合:当 \(q<0\) 或 \(q>1\) 时,
\[p(x)=q\alpha e^{-\alpha x}+(1-q)\beta e^{-\beta x},\quad x>0, \]函数 \(p(\cdot)\) 有时仍然是一个概率密度函数,此时称其为指数分布的组合。
例如:指数分布的组合,概率密度函数为
\[p(x)=2\left(e^{-x}-e^{-2x}\right)=2\times e^{-x}-1\times 2e^{-2x},\quad x>0 \]即为 \(q=2\) 且参数 \(\alpha=1,\beta=2\) 的情况,容易验证
\[\int_0^\infty p(x)\mathrm{d}x=2\int_0^\infty e^{-x}\mathrm{d}x-2\int_0^\infty e^{-2x}\mathrm{d}x=1. \]
混合分布的离散形式:设随机变量 \(X_1,X_2,\cdots,X_n\) 相应的密度函数为 \(f_1(x),f_2(x),\cdots,f_n(x)\) 且定义在同一个概率空间。记随机变量 \(Y\) 的密度函数为
\[f_Y(x)=p_1f_1(x)+p_2f_2(x)+\cdots+p_nf_n(x), \]其中 \(p_i,i=1,2,\cdots,n\) 满足
\[p_i\geq0,\quad i=1,2,\cdots,n,\quad \sum_{i=1}^np_i=1, \]则称随机变量 \(Y\) 具有混合分布。
例如:设随机变量 \(N\) 的概率分布律为 \(f_N(i)=p_i,i=1,2,\cdots,n\) ,随机变量 \(X_1,X_2,\cdots,X_n\) 相应的密度函数为 \(f_1(x),f_2(x),\cdots,f_n(x)\) 且定义在同一个概率空间,记随机变量 \(Y=X_N\) ,根据全概率公式有
\[f_Y(x)=p_1f_1(x)+p_2f_2(x)+\cdots+p_nf_n(x). \]即此时的随机变量 \(Y\) 具有混合分布。
一般混合分布形式:假设 \(\Lambda\) 是随机变量,其支撑为 \(\Omega_\Lambda\) ,并且服从由参数 \(\theta\) 决定的密度函数 \(f_\Lambda(\lambda|\theta)\) 的分布。假设随机变量 \(X\) 在给定 \(\Lambda=\lambda\) 的条件下,条件密度函数为 \(f_{X|\Lambda}(x|\lambda)\) 。记 \(Y\equiv X(\Lambda)|\theta\) 服从密度函数 \(f_Y(y|\theta)\) ,则有
\[\begin{aligned} f_Y(y|\theta)&=\frac{\mathrm{d}}{\mathrm{d}y}\mathrm{Pr}(X(\Lambda)\leq y|\theta) \\ \\ &=\int_{\Omega_\Lambda}\frac{\mathrm{d}}{\mathrm{d}y}\mathrm{Pr}(X(\Lambda)\leq y|\Lambda=\lambda) f_\Lambda(\lambda|\theta)\mathrm{d}\lambda \\ \\ &=\int_{\Omega_\Lambda}f_{X|\Lambda}(y|\lambda)f_\Lambda(\lambda|\theta)\mathrm{d}\lambda . \end{aligned} \]引理:连续型随机变量的全概率公式
设随机变量 \((X,Y)\) 是二元随机向量,随机变量 \(Y\) 的分布函数为 \(F_Y(y)\) ,则
\[\mathrm{Pr}(X\leq x)=\int_{-\infty}^\infty\mathrm{Pr}(X\leq x|Y=y)\mathrm{d}F_Y(y). \]设 \(f(x,y)\) 是二元可测函数,则
\[\mathrm{Pr}(f(X,Y)\leq z)=\int_{-\infty}^\infty\mathrm{Pr}(f(X,y)\leq z|Y=y)\mathrm{d}F_Y(y). \]
注意:这里密度函数 \(f_\Lambda(\lambda|\theta)\) 的写法类似于贝叶斯统计中的写法,在实际操作中 \(f_\Lambda(\lambda|\theta)\) 就是以 \(\theta\) 为参数的概率密度函数 \(f_\Lambda(\lambda;\theta)\) 。
例如:假设 \(X|\Lambda\sim \mathrm{Exp}(\Lambda)\) ,其中随机参数 \(\Lambda\sim\Gamma(\alpha,\beta)\) ,试求 \(X\) 的分布。
解:首先写出 \(\Lambda\) 的密度函数
\[f_\Lambda(\lambda|\alpha,\beta)=\frac{1}{\Gamma(\alpha)\beta^\alpha}\lambda^{\alpha-1}e^{-\lambda/\beta},\quad \lambda>0. \]由连续型随机变量的全概率公式可得
\[\begin{aligned} \mathrm{Pr}(X\leq x)&=\int_0^\infty f_{X|\Lambda}(x|\lambda)f_{\Lambda}(\lambda|\alpha,\beta)\mathrm{d}\lambda \\ \\ &=\int_0^\infty \lambda e^{-\lambda x}\left[\frac{1}{\Gamma(\alpha)\beta^\alpha}\lambda^{\alpha-1}e^{-\lambda/\beta}\right]\mathrm{d}\lambda \\ \\ &=\frac{\alpha}{\beta^\alpha}\left[\frac{\beta}{\beta x+1}\right]^{\alpha+1} \\ \\ &\equiv\frac{\alpha\gamma^\alpha}{(x+\gamma)^{\alpha+1}} \quad (\gamma=1/\beta). \end{aligned} \]即 \(X\) 服从 Pareto 分布,\(X\sim P(\alpha,\gamma)\) 。
三、保险领域中的混合分布
保险领域中的风险往往不是纯连续或离散的随机变量。许多被用来模拟保险理赔支付的随机变量有连续增长的部分,也有离散的跳跃部分。这种分布的形式可以采用几个常见分布的混合来构造。
假设 \(Z\) 是某个保单的理赔支付,\(X\) 是保单损失,两者之间一般有如下三种情况:
- 保单损失 \(X\leq d\) ,则保单无理赔,因此 \(Z=0\) ,将 \(d\) 称为免赔额;
- 保单损失 \(X>M+d\) ,按保单合同规定,支付最大的保险金额 \(M\) ,因此 \(Z=M\) ;
- 保单损失 \(d<X<M+d\) ,保单合同赔付在 \([0,M]\) 之间,因此 \(0<Z<M\) 。
注意:\(Z\) 的分布函数在 \(d\) 和 \(M+d\) 处各有一个跳跃,中间部分常用一个连续分布函数表示理赔支付。
最常见的保险理赔分布为如下的形式:
\[Z=IX+(1-I)Y, \]其中 \(I,X,Y\) 均为随机变量:
-
\(Y\) 为连续型随机变量,\(X\) 为离散型随机变量;
-
\(I\) 为示性随机变量,取值为 \(0\) 和 \(1\) ,设事件发生的概率为 \(q=\mathrm{Pr}(I=1),0\leq q\leq1\) ;
-
\(I\) 与 \(X,Y\) 相互独立。
随机变量 \(Z\) 的分布函数:由分布函数的定义计算得
\[\begin{aligned} F(z)&=\mathrm{Pr}(Z\leq z) \\ \\ &=\mathrm{Pr}(X\leq z,I=1)+\mathrm{Pr}(Y\leq z,I=0) \\ \\ &=q\mathrm{Pr}(X\leq z)+(1-q)\mathrm{Pr}(Y\leq z). \end{aligned} \]\(X\) 为离散型随机变量:
\[F(z)-F(z-0)=q\mathrm{Pr}(X=z), \]其中 \(z\) 是随机变量 \(X\) 的取值点,即 \(\mathrm{Pr}(X=z)>0\) 。
\(Y\) 为连续型随机变量:
\[F'(z)=(1-q)\frac{\mathrm{d}}{\mathrm{d}z}\mathrm{Pr}(Y\leq z), \]其中 \(z\) 不是随机变量 \(X\) 的取值点,即 \(\mathrm{Pr}(X=z)=0\) 。
这种构造法产生的随机变量 \(Z\) 的分布函数 \(F(z)\) 在 \(z\) 处有跳跃,但 \(F(z)\) 不是一个阶梯函数,在 \(Y\) 的值域上 \(F'(z)>0\) 。
随机变量 \(Z\) 的矩:假设 \(g(x)\) 是一个实值函数,记 \(g(Z)=g(IX+(1-I)Y)\) ,则有
\[\begin{aligned} \mathbb{E}\left[g(Z)\right]&=\mathrm{Pr}(I=1)\mathbb{E}\left[g(X)\right]+\mathrm{Pr}(I=0)\mathbb{E}\left[g(Y)\right] \\ \\ &=q\sum_{z}g(z)\mathrm{Pr}(X=z)+(1-q)\int_{-\infty}^\infty g(z)\left[\frac{\mathrm{d}}{\mathrm{d}z}\mathrm{Pr}(Y\leq z)\right]\mathrm{d}z \\ \\ &=\sum_{z}g(z)\left[F(z)-F(z-0)\right]+\int_{-\infty}^\infty g(z)F'(z)\mathrm{d}z \\ \\ &\equiv\int_{-\infty}^\infty g(z)\mathrm{d}F(z). \end{aligned} \]这是一个黎曼-斯蒂尔切斯积分,其中 \(\mathrm{d} F(z)=F(z)-F(z-\mathrm{d}z)\) 表示 \(z\) 点的概率,即
- 若有概率存在,则该微分 \(\mathrm{d} F(z)\) 表示分布函数在 \(z\) 点的跳跃高度;
- 若在 \(z\) 处分布函数连续,则该微分 \(\mathrm{d} F(z)=F'(z)\mathrm{d}z\) 。
例如:假设风险 \(Z\) 有如下分布:
\[\begin{aligned} &\mathrm{Pr}(Z=0)=\frac12; \\ \\ &\mathrm{Pr}(Z\in[z,z+\mathrm{d}z))=\frac12\beta e^{-\beta z}\mathrm{d}z , \quad \beta=0.1, \quad z>0. \end{aligned} \]计算随机变量 \(Z\) 的分布函数和数学期望。
解:索赔风险可以表示为 \(Z=IX+(1-I)Y\) ,其中:
- \(X\) 为退化分布,\(X=0\) ;
- \(Y\sim\mathrm{Exp}(0.1)\) ;
- \(I\sim B(1,0.5)\) ,且与 \((X,Y)\) 独立。
随机变量 \(Z\) 的分布函数:对 \(\forall z>0\) ,
\[\begin{aligned} F_Z(z)&=\mathrm{Pr}(Z\leq z) \\ \\ &=\mathrm{Pr}(X\leq z,I=1)+\mathrm{Pr}(Y\leq z,I=0) \\ \\ &=\frac12\left[\mathrm{Pr}(X\leq z)+\mathrm{Pr}(Y\leq z)\right] \\ \\ &=\frac12\left(1+(1-e^{-\beta z})\right) \\ \\ &=1-\frac12 e^{-\beta z}. \end{aligned} \]随机变量 \(Z\) 的数学期望:
\[\begin{aligned} \mathbb{E}(Z)&=\mathbb{E}\left[IX+(1-I)Y\right] \\ \\ &=\mathbb{E}(X)\mathbb{E}(I)+\mathbb{E}(Y)\mathbb{E}(1-I) \\ \\ &=0\times0.5+\frac1\beta\times0.5 \\ \\ &=5. \end{aligned} \]
例如:考虑承包责任损失为 \(S\) 的保单,计算理赔支付 \(X\) 的分布,其中 \(X\) 的给付规则为
\[X=\left\{\begin{array}{ll} 0 , & S\leq 100, \\ S-100 , & 100<S\leq 1100, \\ 1000, &S\geq1100. \end{array}\right. \]随机变量 \(S\) 的分布为
\[\begin{aligned} &\mathrm{Pr}(S\leq 100)=0.9 , \quad \mathrm{Pr}(S>100)=0.1; \\ \\ &\mathrm{Pr}(S\leq 100)=0.02. \end{aligned} \]在 \((100,1100)\) 上,\(S\) 服从均匀分布。
解:考虑 \(X=IB\) ,其中 \(I\) 为示性变量,满足
\[\mathrm{Pr}(I=0)=0.9 , \quad \mathrm{Pr}(I=1)=0.1 . \]在有索赔发生时,赔付额的分布为
\[\begin{aligned} &\mathrm{Pr}(B=1000|I=1)=0.2 , \\ \\ &\mathrm{Pr}(B<x|I=1)=0.8\times\frac{1}{1000}x , \quad 0<x<1000. \end{aligned} \]所以 \(X\) 的分布函数为
\[\begin{aligned} F_X(x)&=\mathrm{Pr}(X\leq x)=\mathrm{Pr}(IB\leq x) \\ \\ &=\mathrm{Pr}(IB\leq x|I=0)\mathrm{Pr}(I=0)+\mathrm{Pr}(IB\leq x|I=1)\mathrm{Pr}(I=1) \\ \\ &=0.9\times\mathrm{Pr}(0\leq x)+0.1\times\mathrm{Pr}(B\leq x) \\ \\ &=\left\{\begin{array}{ll} 0.9\times 0+0.1\times0 , &x<0 , \\ 0.9\times 1+0.1\times8x\times10^{-4} , & 0\leq x<1000, \\ 0.9\times 1+0.1\times1 , & x\geq1000. \end{array}\right. \\ \\ &=\left\{\begin{array}{ll} 0 , &x<0 , \\ 0.9+8x\times10^{-5} , & 0\leq x<1000, \\ 1 , & x\geq1000. \end{array}\right. \end{aligned} \]这里我们对 \(X\) 的分布的实际意义加以说明:
- 没有索赔的概率为 \(90\%\) ;
- 索赔额为 \(1000\) 的概率为 \(2\%\) ;
- 索赔额在 \([0,1000]\) 之间的概率为 \(8\%\) 。
四、产生新分布的一些方法
(1) 随机变量的变换
以对数正态分布为例。假设 \(X\sim N(\mu,\sigma^2)\) ,作指数变换 \(Y=e^X\) ,即 \(X=\log(Y)\) ,得到 \(Y\) 的概率密度函数为
\[f_Y(y)=\frac{1}{\sqrt{2\pi}\sigma}\exp\left\{-\frac{(\log(y)-\mu)^2}{2\sigma^2}\right\}\frac1y, \quad y>0. \]随机变量 \(Y\) 的分布称为对数正态分布,记为 \(Y\sim LN(\mu,\sigma^2)\) 。
(2) 拼接
假设 \(f_1(x),f_2(x),\cdots,f_k(x)\) 为 \(k\) 个密度函数,定义一个新的密度函数
\[f_X(x)=\left\{\begin{array}{ll} p_1f_1^*(x), & x\in[0,c_1), \\ p_2f_2^*(x), & x\in[c_1,c_2), \\ \quad \vdots & \quad \vdots \\ p_kf_k^*(x), & x\in[c_{k-1},\infty), \end{array}\right. \]其中
\[\begin{aligned} &p_i\geq0,\quad i=1,2,\cdots,k,\quad \sum_{i=1}^kp_i=1, \\ \\ &0=c_0<c_1<c_2<\cdots<c_{k-1}<c_k=\infty, \end{aligned} \]并且 \(f_i^*(x)\) 是密度函数 \(f_i(x)\) 在区间 \([c_{i-1},c_i),i=1,2,\cdots,k\) 之间按如下公式调整之后的部分:
\[f_i^*(x)=\frac{f_i(x)}{\int_{c_{i-1}}^{c_i}f_i(x)\mathrm{d}x} , \quad x\in [c_{i-1},c_i). \]例如:假设 \(X_1\sim\mathrm{Exp}(0.5),\ X_2\sim\mathrm{Exp}(2),\ X_3\sim P(2,3)\) ,相应的密度函数分别记为 \(f_i(x),i=1,2,3\) 。按如下方式进行拼接:
\[p_1=p_2=p_3=\frac13 , \\ \\ f_X(x)=\left\{\begin{array}{ll} \dfrac13f_1^*(x) , &x\in[0,1) , \\ \dfrac13f_2^*(x) , &x\in[1,3) , \\ \dfrac13f_3^*(x) , &x\in[3,\infty) . \end{array}\right. \]经计算得
\[\begin{aligned} &\int_0^1f_1(x)\mathrm{d}x=\int_0^10.5e^{-0.5x}\mathrm{d}x=0.3935, \\ \\ &\int_1^3f_2(x)\mathrm{d}x=\int_1^32e^{-2x}\mathrm{d}x=0.2699, \\ \\ &\int_3^\infty f_3(x)\mathrm{d}x=\left(\frac{3}{3+3}\right)^2=0.25. \end{aligned} \]由拼接得到的密度函数为
\[f_X(x)=\left\{\begin{array}{ll} 0.4235\times e^{-0.5x} , &x\in[0,1) , \\ \\ 2.4701\times e^{-2x} , &x\in[1,3) , \\ \\ \dfrac{24}{(x+3)^3} , &x\in[3,\infty) . \end{array}\right. \]