deepFM(原理和pytorch理解)

参考(推荐):https://blog.csdn.net/w55100/article/details/90295932

要点:

其中的计算优化值得注意

K代表隐向量维数

n可以代表离散值one-hot后的全部维数(一般这样理解),也可以是n个field,每个域中取xi不为0的数(因为在使用fm1和fm2时,xi要不为0才有效,所以两种理解都可以)

上一篇:特征选择的三种方法、基本概念


下一篇:有效防止softmax计算时上溢出(overflow)和下溢出(underflow)的方法