隐马尔科夫模型-前向算法

2022-09-19 16:42:09

隐马尔科夫模型-前向算法

在该篇文章中讲了隐马尔科夫模型（HMM）一基本模型与三个基本问题隐马尔科夫模型-基本模型与三个基本问题，这篇文章总结一下隐马尔科夫链（HMM）中的前向与后向算法，首先给出这俩个算法是为了解决HMM的第一个基本问题。

先回忆一下第一个问题：
第一个问题是求，给定模型的情况下，求某种观测序列出现的概率。

比如，给定的HMM模型参数已知，求出三天观察是(Dizzy,Cold,Normal)的概率是多少？(对应的HMM模型参数已知的意思，就是说的A(trainsition_probability),B(emission_probability),pi矩阵是已经知道的。)

1 前向算法

我们首先定义一下前向概率

定义：给定隐马科夫模型lamda，定义到时刻t为止的观测序列为01,02,03....0t且状态为qi的概率为前向概率，记作

可以递推地求得前向概率及观测序列概率。

下面，我们可以整理一下前向算法的流程：
输入：隐马尔可夫模型，观测序列
输出：观测序列概率

(1)初值

前向概率的定义中一共限定了两个条件。

一是到当前为止的观测序列，另一个是当前的状态。所以初值的计算也有两项（观测和状态），一项是初始状态概率，另一项是发射到当前观测的概率。

(2)递推对t=1,2,3,.....,T-1

每次递推同样由两部分构成，大括号中是当前状态为i且观测序列的前t个符合要求的概率，括号外的是状态i发射观测t+1的概率。

下面稍微解释一下公式：

(3)终止

由于到了时间T，一共有N种状态发射了最后那个观测，所以最终的结果要将这些概率加起来（因为每个隐状态都可能产生我们需要的观测值，所以都要加起来）。

公式可以用下面的转移图表示，假设我要求第二层某个结点的前向概率，等于前一层所有结点到该结点的转移，如下图：

由于每次递推都是在前一次的基础上进行的，所以降低了复杂度（计算只存在于相邻的俩个时间点）。计算如下图所示：

下方标号表示时间节点，每个时间点都有N种状态，所以相邻两个时间之间的递推消耗N^2次计算。

而每次递推都是在前一次的基础上做的，所以只需累加O(T)次，所以总体复杂度是O(T)个N^2，即0（TN^2）,这比起我们前面说的暴力法的复杂度已经好了太多了。

到这里为止，前向算法也就讲完了。本文通过一个具体简单例子，走了一遍过程，期间有一些自己的总结和理解，希望对大家有帮助~

2 python实现代码

代码如下：

近期文章预告：
《隐马尔科夫模型-后向算法》
《隐马尔科夫模型-维特比算法》
《深入浅出讲解支持向量机（SVM）》

推荐阅读文章：
隐马尔科夫模型-基本模型与三个基本问题
深入浅出理解决策树算法（一）-核心思想
带你搞懂朴素贝叶斯分类算法

全是通俗易懂的硬货！只需置顶~欢迎关注交流~

码农公寓

隐马尔科夫模型-前向算法

1

前向算法

2

python实现代码

相关文章