1 概率图模型
是指一种用图结构来描述多元随机变量之间条件独立关系的 概率模型,
从而给研究高维空间中的概率模型带来了很大的便捷性
其中有三个基本问题
- (1) 表示问题:对于一个概率模型,如何通过图结构来描述变量之间的依 赖关系.
- (2) 学习问题:图模型的学习包括图结构的学习和参数的学习.在本章中, 我们只关注在给定图结构时的参数学习,即参数估计问题.
- (3) 推断问题:在已知部分变量时,计算其他变量的条件概率分布
1.2 概率图的学习问题
图模型的学习可以分为两部分
:
一是
网络结构学习
,
即寻找最优的网络结 构;
二是
网络参数估计
,
即已知网络结构
,
估计每个条件概率分布的参数
.
网络结构学习比较困难
,
一般是由领域专家来构建
.
本节只讨论在给定网络 结构条件下的参数估计问题.
图模型的参数估计问题又分为
不包含隐变量时的参数估计问题
和
包含隐变量时的参数估计问题
.
利用EM算法解带隐变量的最大参数估计问题
首先理解什么是隐变量和EM算法的直观解释
https://zhuanlan.zhihu.com/p/78311644
EM
算法的核心思想非常简单,分为两步:Expection-Step 和 Maximization-Step。E-Step 主要通过观察数据和现有模型来估计参数,然后用这个估计的参数值来计算似然函数的期望值;而 M-Step 是寻找似然函数最大化时对应的参数。由于算法会保证在每次迭代之后似然函数都会增加,所以函数最终会收敛。
参考:
https://www.bilibili.com/video/BV1aE411o7qd?p=60
白板推导系列关于EM算法的介绍