多维高斯概率密度函数形式为f(x,μ,Σ)=(2π)d/2∣Σ∣1/21e−21(x−μ)TΣ−1(x−μ)
其中 x 和 μ 是 d 维向量,Σ 是 d×d的矩阵,Σ 和 μ 是待求参数。
设 {xi},i=1∼N 是符合该密度函数的 N 个样本,那么我们可以利用最大似然法(Maxium Likelihood)求待定参数。目标函数为:E(μ,Σ)=i=1∑Nlnf(xi,μ,Σ)=−2Ndln(2π)−2Nln∣Σ∣−21i=1∑N(xi−μ)TΣ−1(xi−μ)此时,我们假定 {xi},i=1∼N满足独立同分布(independent and identical distribution, i.i.d)。
根据最大似然法的要求,我们要求 Σ 和 μ 使 E(μ,Σ)的值最大,由于 E 是凸函数,故可以直接求使偏导数为 0 的参数。这里为了简化计算我们可以求 Σ−1 的偏导,因为行列式容易转换,而后面有一项矩阵如果进行转换回很麻烦,求出 Σ−1 其实也就是求出了Σ
∂μ∂E=−21i=1∑N[Σ−1(xi−μ)+(Σ−1)T(xi−μ)]×(−1)=0∂(Σ−1)∂E=2NΣT−21i=1∑N(xi−μ)(xi−u)T=0
显然,第二个式子好求,化简得ΣT=N1i=1∑N(xi−μ)(xi−u)T可以看出来这是个对称矩阵,故Σ=ΣT=N1i=1∑N(xi−μ)(xi−u)T,Σ−1=(Σ−1)T再看第一个式子⟹⟹⟹⟹i=1∑N[Σ−1(xi−μ)+(Σ−1)T(xi−μ)]=02i=1∑N[Σ−1(xi−μ)]=0Σ−1i=1∑N(xi−μ)=0i=1∑N(xi−μ)=0μ=N1i=1∑Nxi
ice Alex
发布了15 篇原创文章 · 获赞 9 · 访问量 1869
私信
关注