1. 写在前面
从五月份的xdeepFM到现在,已经有一个多月的时间没有与推荐模型相关的paper了,说好的"小步快跑"呢? 来到公司实习之后, 更一直抽不出时间来更新这个系列。不过,最近这段时间, 由于开始接触实际场景下的推荐小项目, 而实习生的话一般要从模型上手,所以这一周终于又有了时间开始玩推荐模型,并进行相应的魔改。 当然,来实习之后, 从前辈们的以及周围伙伴的交流中悟出了一个真理,在推荐系统甚至其他领域(CV,NLP)等,模型都只是工具而已,遇到问题解决问题的方法和策略才是王道, 那么我为啥还要坚持通过写博客的方式记录读过的模型论文,整理模型原理呢? 这个问题之前也没有仔细想过,之前整理模型的原因,是为了梳理推荐系统模型发展脉络, 方便入门推荐系统。 可能有人会说, 新模型paper每年那么多, 怎么可能一个个的读然后尝试? 感觉意义不大呀。emmm, 首先, 我现在的想法是肯定不会把每个模型都追一遍整理, 其次,就是通过我前面的一些模型积累发现, 很多模型的思路和原理给我带来的价值比模型本身要大很多(不妨跳去局部,从全局去把握模型的发展脉络和思路),并且很多东西,都是万变不离其宗, 各种组件之间的重复调用, 对于现在的我来说,整理模型并不是我最终的目的, 通过阅读paper,学习大佬们针对实际场景中遇到个问题,提出的解决方案才是我最想学的东西。 并且,阅读完了一篇paper之后,如果不整理下的话,心理会很不踏实,没法检验自己的掌握程度。
所以我后面整理模型,也不是乱整理, 一般是较为干净清爽的工业文章,读起来利落实在,还能解决自己的问题。 基于两个原则:
- 从现在所面临的问题场景出发,然后读相关的论文,整理能解决我自身问题的模型思路和一些启发,这样的模型一般都是比较经典且工业常用的,这样还能通过看一些其他文章,把大佬们有价值的尝试思路也整理过来,比如今天整理的这篇文章。
- 经典且工业上常用,比如谈到多任务, 最先想到的可能是MMOE,谈到多兴趣, 可能会想到MIND等,这些模型在公司里都是些非常实用的模型, 结构也不是很复杂。
所以整理模型,一是爱好所在,另一个是也能把知识进行融会贯通下,检验自己的掌握水平, 这一块还得继续走着, 下面开始