Kaldi的在线自然梯度方法的算法细节

在线自然梯度

Kaldi的在线自然梯度方法的算法细节

   

Kaldi的在线自然梯度方法的算法细节

Kaldi的在线自然梯度方法的算法细节

对于任意对称矩阵Σ,存在一个特征值分解(eigenvalue decomposition,EVD):

Kaldi的在线自然梯度方法的算法细节

Kaldi的在线自然梯度方法的算法细节

Kaldi的在线自然梯度方法的算法细节

Kaldi的在线自然梯度方法的算法细节

Kaldi的在线自然梯度方法的算法细节

Kaldi的在线自然梯度方法的算法细节

   

Kaldi的在线自然梯度方法的算法细节

Kaldi的在线自然梯度方法的算法细节

然后,输出将等于:

Kaldi的在线自然梯度方法的算法细节

Kaldi的在线自然梯度方法的算法细节

Kaldi的在线自然梯度方法的算法细节

Kaldi的在线自然梯度方法的算法细节

   

对方差的低秩近似

低秩近似

   

Kaldi的在线自然梯度方法的算法细节

Kaldi的在线自然梯度方法的算法细节

也可表示为:

Kaldi的在线自然梯度方法的算法细节

Kaldi的在线自然梯度方法的算法细节

   

Kaldi的在线自然梯度方法的算法细节

Kaldi的在线自然梯度方法的算法细节

  

定义:

Kaldi的在线自然梯度方法的算法细节

Kaldi的在线自然梯度方法的算法细节

Kaldi的在线自然梯度方法的算法细节

Kaldi的在线自然梯度方法的算法细节

  1. Kaldi的在线自然梯度方法的算法细节

    Kaldi的在线自然梯度方法的算法细节

  2. Kaldi的在线自然梯度方法的算法细节

    Kaldi的在线自然梯度方法的算法细节

       

来自 <https://stats.stackexchange.com/questions/22501/is-there-an-intuitive-interpretation-of-ata-for-a-data-matrix-a>

   

Kaldi的在线自然梯度方法的算法细节

Kaldi的在线自然梯度方法的算法细节

Kaldi的在线自然梯度方法的算法细节

   

Kaldi的在线自然梯度方法的算法细节

Kaldi的在线自然梯度方法的算法细节

Kaldi的在线自然梯度方法的算法细节

   

Kaldi的在线自然梯度方法的算法细节

   

更新细节如下:

Kaldi的在线自然梯度方法的算法细节

对称特征值分解:

Kaldi的在线自然梯度方法的算法细节

Kaldi的在线自然梯度方法的算法细节

Kaldi的在线自然梯度方法的算法细节

Kaldi的在线自然梯度方法的算法细节

   

Kaldi的在线自然梯度方法的算法细节

Kaldi的在线自然梯度方法的算法细节

Kaldi的在线自然梯度方法的算法细节

Kaldi的在线自然梯度方法的算法细节

Kaldi的在线自然梯度方法的算法细节

   

Kaldi的在线自然梯度方法的算法细节

Kaldi的在线自然梯度方法的算法细节

Kaldi的在线自然梯度方法的算法细节

   

Kaldi的在线自然梯度方法的算法细节

B.3 高效计算

Kaldi的在线自然梯度方法的算法细节

   

Kaldi的在线自然梯度方法的算法细节

Kaldi的在线自然梯度方法的算法细节

Kaldi的在线自然梯度方法的算法细节

Kaldi的在线自然梯度方法的算法细节

因此,主要的计算可写为:

Kaldi的在线自然梯度方法的算法细节

Kaldi的在线自然梯度方法的算法细节

Kaldi的在线自然梯度方法的算法细节

根据:

Kaldi的在线自然梯度方法的算法细节

Kaldi的在线自然梯度方法的算法细节

Kaldi的在线自然梯度方法的算法细节

Kaldi的在线自然梯度方法的算法细节

Kaldi的在线自然梯度方法的算法细节

Kaldi的在线自然梯度方法的算法细节

Kaldi的在线自然梯度方法的算法细节

Kaldi的在线自然梯度方法的算法细节

Kaldi的在线自然梯度方法的算法细节

Kaldi的在线自然梯度方法的算法细节

为方便起见,定义:

Kaldi的在线自然梯度方法的算法细节

Kaldi的在线自然梯度方法的算法细节

Kaldi的在线自然梯度方法的算法细节

Kaldi的在线自然梯度方法的算法细节

Kaldi的在线自然梯度方法的算法细节

Kaldi的在线自然梯度方法的算法细节

Kaldi的在线自然梯度方法的算法细节

为方便起见,定义:

Kaldi的在线自然梯度方法的算法细节

Kaldi的在线自然梯度方法的算法细节

Kaldi的在线自然梯度方法的算法细节

Kaldi的在线自然梯度方法的算法细节

Kaldi的在线自然梯度方法的算法细节

Kaldi的在线自然梯度方法的算法细节

Kaldi的在线自然梯度方法的算法细节

Kaldi的在线自然梯度方法的算法细节

Kaldi的在线自然梯度方法的算法细节

   

Kaldi的在线自然梯度方法的算法细节

Kaldi的在线自然梯度方法的算法细节

Kaldi的在线自然梯度方法的算法细节

Kaldi的在线自然梯度方法的算法细节

Kaldi的在线自然梯度方法的算法细节

Kaldi的在线自然梯度方法的算法细节

Kaldi的在线自然梯度方法的算法细节

Kaldi的在线自然梯度方法的算法细节

Kaldi的在线自然梯度方法的算法细节

Kaldi的在线自然梯度方法的算法细节

Kaldi的在线自然梯度方法的算法细节

Kaldi的在线自然梯度方法的算法细节

   

Kaldi的在线自然梯度方法的算法细节

Kaldi的在线自然梯度方法的算法细节

Kaldi的在线自然梯度方法的算法细节

   

为方便起见,定义:

Kaldi的在线自然梯度方法的算法细节

Kaldi的在线自然梯度方法的算法细节

Kaldi的在线自然梯度方法的算法细节

   

B.3.1 保持正交

Kaldi的在线自然梯度方法的算法细节

   

检测此问题的方法

Kaldi的在线自然梯度方法的算法细节

Kaldi的在线自然梯度方法的算法细节

   

解决此问题的方法

计算对称矩阵:

Kaldi的在线自然梯度方法的算法细节

Kaldi的在线自然梯度方法的算法细节

Kaldi的在线自然梯度方法的算法细节

Kaldi的在线自然梯度方法的算法细节

Kaldi的在线自然梯度方法的算法细节

Kaldi的在线自然梯度方法的算法细节

重正交极少发生,通常只发生存在错误时,比如参数发散

B.3.2 初始化

Kaldi的在线自然梯度方法的算法细节

Kaldi的在线自然梯度方法的算法细节

Kaldi的在线自然梯度方法的算法细节

Kaldi的在线自然梯度方法的算法细节

Kaldi的在线自然梯度方法的算法细节

其中:

Kaldi的在线自然梯度方法的算法细节

Kaldi的在线自然梯度方法的算法细节

B.5 在线自然梯度方法的总结

Kaldi的在线自然梯度方法的算法细节

Kaldi的在线自然梯度方法的算法细节

Kaldi的在线自然梯度方法的算法细节

   

Kaldi的在线自然梯度方法的算法细节

Kaldi的在线自然梯度方法的算法细节

Kaldi的在线自然梯度方法的算法细节

   

Kaldi的在线自然梯度方法的算法细节

Kaldi的在线自然梯度方法的算法细节

   

不管怎样,首先计算遗忘因子:

Kaldi的在线自然梯度方法的算法细节

然后计算:

Kaldi的在线自然梯度方法的算法细节

不更新Fisher矩阵

计算:

Kaldi的在线自然梯度方法的算法细节

Kaldi的在线自然梯度方法的算法细节

Kaldi的在线自然梯度方法的算法细节

Kaldi的在线自然梯度方法的算法细节

Kaldi的在线自然梯度方法的算法细节

Kaldi的在线自然梯度方法的算法细节

Kaldi的在线自然梯度方法的算法细节

Kaldi的在线自然梯度方法的算法细节

更新Fisher矩阵

计算:

Kaldi的在线自然梯度方法的算法细节

Kaldi的在线自然梯度方法的算法细节

Kaldi的在线自然梯度方法的算法细节

LKWJ合并为一个在内存中相邻的矩阵

   

   

   

参考文献

https://zhuanlan.zhihu.com/p/37609917

https://blog.csdn.net/u013571243/article/details/50867174

https://stats.stackexchange.com/questions/244478/is-there-a-name-for-uncentered-covariance-matrix?noredirect=1&lq=1

https://stats.stackexchange.com/questions/22501/is-there-an-intuitive-interpretation-of-ata-for-a-data-matrix-a

Povey, Daniel, Xiaohui Zhang, and Sanjeev Khudanpur. "Parallel training of DNNs with natural gradient and parameter averaging." arXiv preprint arXiv:1410.7455 (2014).

   

上一篇:Js文字特效—文字段逐个变色循环


下一篇:python加载XML格式的数据