无标注数据是鸡肋还是宝藏?看阿里工程师这样用它 | 开发者必读(043期)

最炫的技术新知、最热门的大咖公开课、最有趣的开发者活动、最实用的工具干货,就在《开发者必读》!

每日集成开发者社区精品内容,你身边的技术资讯管家。


每日头条

无标注数据是鸡肋还是宝藏?阿里工程师这样用它

针对业务场景中标注数据不足、大量的无标注数据又难以有效利用的问题,我们提出了一种面向行为序列数据的深度学习风控算法 Auto Risk,提出通过代理任务从无标注数据中学习通用的特征表示。

无标注数据是鸡肋还是宝藏?看阿里工程师这样用它 | 开发者必读(043期)

这种思想与目前 NLP 领域前沿的 Bert 等预训练模型不谋而合,但是由于行为序列数据和业务的特点显著区别于 NLP,模型的设计和实现又有很大区别。最终,模型在真实场景中落地并取得了显著的增益;实验验证具有较好的多场景泛化能力;相比纯粹的监督学习,在小样本情况下提升明显。


最强干货

支付宝:你长大了,该学会认识新朋友了!

在今年的拉动手淘用户增长战略中,支付宝小程序作为日活2亿同时包含大量手淘新用户的场景,在拉新中承担着十分重要的作用。我们的目标人群是将用户转化为淘宝用户,阿里工程师是用什么方法完成这样的转化呢?这篇文章马上为你揭晓!

为什么短视频会让人刷不停?背后也许用了这套技术

基于时间碎片化、视频交互强、内容丰富、体验好等因素使得短视频近几年处在流量风暴的中心,各大平台纷纷涉足短视频领域。因此,平台对短视频内容的推荐尤为重要,千人千面是短视频推荐核心竞争力。短视频一般从“点击率”与“观看时长”两方面优化来提升用户消费时长。接下来,阿里工程师从这两方面重点论述短视频模型点击时长多目标优化。

10种传统机器学习算法,阿里工程师帮你总结了

这篇文章主要介绍推荐系统中传统机器学习算法,写这篇文章的主要目的是对业界主流推荐算法的一些总结,方便大家对主流推荐算法的底层实现有的了解,从而在业务实践过程中更好地理解算法,运用算法。在这篇文章中我们将介绍10种常见的推荐算法,并且列举一些实际的例子,希望能对你的推荐算法学习带来些许帮助。


精品公开课

开放 API 场景化最佳实践

阿里云OpenAPI技术专家青塘为你挑选开发者最常见的典型API使用场景,给出使用各种工具使用API的最佳方式,帮助您顺利而高效地利用阿里云API进行企业运维和资源管理。


每天读本书

《嵌入式Linux驱动开发教程》| 每日读本书

《嵌入式Linux驱动开发教程》结合大量实例,在基于ARM Cortex-A9四核处理器Exynos4412的硬件教学平台和PC上,全面详细地讲解了Linux设备驱动开发。

它既可作为大学院校电子、通信、计算机、自动化等专业的嵌入式Linux设备驱动开发课程的教材,也可供嵌入式Linux驱动开发人员参考。


每日集成开发者社区精品内容,请持续关注开发者必读

上一篇:12个核心知识点+20个干货案例+110道面试题,Python面试宝典来啦 | 开发者必读(046期)


下一篇:Glide库的使用