雷锋网(公众号:雷锋网)按:腾讯暨 KDD China 大数据峰会在深圳举行,其中香港科技大学教授、第四范式首席科学家杨强做了一期以《从深度学习到迁移学习》为主题的演讲,本文主要阐述了杨强教授在会中讲解迁移学习在产业界的实际应用,由雷锋网亚峰、亚萌、宗仁联合编辑。
迁移学习是什么?
简单讲,就是能让现有的模型算法稍加调整即可应用于一个新的领域和功能的一项技术。迁移学习能够将适用于大数据的模型迁移到小数据上,实现个性化迁移。
人类很自然就具备举一反三的迁移能力,如我们学会骑自行车后,学骑摩托车就很简单了;会打羽毛球,再学打网球也就没那么难了。
迁移学习四种实现方法:
1.样本迁移
样本迁移即在数据集(源领域)中找到与目标领域相似的数据,把这个数据放大多倍,与目标领域的数据进行匹配。其特点是:需要对不同例子加权;需要用数据进行训练。
2.特征迁移
特征迁移是通过观察源领域图像与目标域图像之间的共同特征,然后利用观察所得的共同特征在不同层级的特征间进行自动迁移。
3.模型迁移
模型迁移利用上千万的图象训练一个图象识别的系统,当我们遇到一个新的图象领域,就不用再去找几千万个图象来训练了,可以原来的图像识别系统迁移到新的领域,所以在新的领域只用几万张图片同样能够获取相同的效果。模型迁移的一个好处是我们可以区分,就是可以和深度学习结合起来,我们可以区分不同层次可迁移的度,相似度比较高的那些层次他们被迁移的可能性就大一些。
4.关系迁移
如社会网络,社交网络之间的迁移。
迁移学习在产业界的实际应用
1.迁移学习在机器阅读中的应用
所谓“机器阅读”,就是把自然语言文本转化为机器可以理解的模式,然后机器根据这个模式对个人进行服务。
这个模式可以从不同的层次进行“理解”,比如可以在字、句子、段落、文档和多文档当中产生各种隐式表达,而这些表达可以用空间的相似度来代替,这样加一个词,可以映射到高维空间。
有了这种表达之后,可以拿一句话到比如说 LSTM 里 ,对应的就是输出,这个输出就会给我们对话一个现象。
同时,我们还可以拿 Attention 模型去标明一些问句里面的概念,它可以利用同一个对比相似性找到这个概念。因为其内部隐含的表达是一个 text,把周边字的名称给理解了,它的应用就是可以自动产生文本摘要(Automatic Summarization)。
这个在 Information Retrieval里面叫做 Summarization,过去的 Summarization 做法是“提取式” (Extractive)的。
但是今天 Summarization 可以做到“理解”,并用自己的语言或用户喜欢的语言表达出来。所以这里就要提出一个新的方式,就是既可以结合传统 Summarization,并加入用户反馈(比如用户看了某篇文章、所看时长或点赞行为)。
所以,接下来就可以把模型个性化,给张三看的 Summarization和李四看的 Summarization不一样,就像一篇文章我们需要产生一个吸引眼球的标题,但你给张三和李四看的标题都是不一样的。
2.迁移学习在对话系统中的应用
训练一个通用型的对话系统,该系统可能是闲聊型,也可能是一个任务型的。但是,我们可以根据在特定领域的小数据修正它,使得这个对话系统适应不同任务。比如,一个用户想买咖啡,他并不想回答所有繁琐的问题,例如是要大杯小杯,热的冷的?
所以我们希望这个系统了解用户的喜好,根据过去的数据分析,一步到位提供一杯符合用户需求的咖啡。
这里举个例子,买咖啡的时候,可能你不喜欢每次都回答所有问题,比如你要大杯小杯啊?热的冷的啊?而是想这个助手了解我,可以根据我们过去的小数据来一步到位。
据此,我做了一个推荐系统,把一个在三万个对话基础上做了一个通用型的对话系统,或者说任务型的对话系统,迁移到一个个性化的统计上,变成只有 9 个对话的(小数据)上,就像一个懂你的小秘书。同理,这个也可在金融系统,问一些金融和股票的问题,然后它通过强化学习,给你建议一些 Candidate。并且对收益和用户的需求做排序。
在这个过程中,我们看到:
第一部分是深度学习效果。
第二部分是强化学习效果。
第三部分是迁移学习效果。
最后我要讲最近一些做的迁移学习的工作。如果两个领域,直接迁移是不行的,我们可以找到一些中间的领域。这个我们可以用深度学习的方法,假设我们用一个大数据,已经训练好的一个系统,然后我们现在的目标是到达一个目标领域,若我们不能一步到位的话,会发现一旦我们用的小数据,各种数据的属性相差很多,怎么办呢?我们去找一些中间的领域,中间的领域可以适度的的改变, 并且一些不应该改变的部分不会改变。这样经过合理改变之后,部分数据加以梳理,最后就得到我们要的被迁移数据。
3.迁移学习在舆情分析中的应用
迁移学习也可应用在舆情分析中,如用户评价方面。以电子产品和视频游戏留言为例,上图中绿色为好评标签,而红色为差评标签。我们可以从上图左侧的电子产品评价中找到特征,促使它在这个领域(电子产品评价)建立模型,然后利用模型把其迁移到视频游戏中。这里可以看到,舆情也可以进行大规模的迁移,而且在新的领域不需要标签。
4.迁移学习在推荐系统中的应用
我们之前也与 IMBD 做过在线推荐系统,在某个领域做好一个推荐系统,然后应用在稀疏的、新的垂直领域。
风头正劲的迁移学习
当今全世界都在推动迁移学习,当今 AAAI 中大概有 20 多篇迁移学习相关文章,而往年只有五六篇。与此同时,如吴恩达等深度学习代表人物也开始做迁移学习。
为什么呢?因为要在一个领域找到高质量的数据非常难,而把现成的模型用在高质量数据量少的领域则是非常好的解决方案。
最后,我做一个总结,昨天我们在深度学习上有着很高成就。但我们发现深度学习在有即时反馈的领域和应用方向有着一定的优势,但在其他领域则不行。打个比方:就像我在今天讲个笑话,你第二天才能笑得出来,在今天要解决这种反馈的时延问题需要强化学习来做。而在明天,则有更多的地方需要迁移学习:它会让机器学习在这些非常珍贵的大数据和小数据上的能力全部释放出来。做到举一反三,融会贯通。
相关阅读:
腾讯暨 KDD China 大数据峰会之前,杨强教授就曾在 2016 年雷锋网承办的 CCF- GAIR 全球人工智能与机器人峰会大会上,深入浅出地为大家讲述了人工智能要取得成功应当具备的五个必要条件和迁移学习的本质。
本文作者:亚峰
本文转自雷锋网禁止二次转载,原文链接