机器学习技术在亲宝宝的业务应用

亲宝宝大数据技术负责人 熊杰

首先向大家简单介绍下亲宝宝,亲宝宝APP是在2013年1月正式上线的。我们定义亲宝宝为新一代家庭育儿方式,我们的使命就是运用科技的力量,帮助家庭更好的关爱和培养孩子。

机器学习技术在亲宝宝的业务应用

目前亲宝宝一共扩展了6项业务:成长记录、智能育儿助手、自有商品品牌、早教课程、品牌广告以及智能硬件,其中成长记录、智能育儿助手是APP最核心两大业务模块。

机器学习技术在亲宝宝的业务应用

截止目前,亲宝宝APP已经有累积1亿多的注册用户,月访问量达到了2000万以上,日均文件传输超过了1000万个,服务超过了5000万家庭。

这5000万个年轻家庭中用户的分布是以妈妈为主,其次是爸爸和祖辈。以宝宝为纽带,构成了我们整个APP的用户画像基础。基于用户画像,我们会做不同的运营策略,例如中国的家庭隔代育儿现象会比较普遍,目前祖辈的智能手机普及率也比较高,我们会针对性地推送相关内容,帮助祖辈来接收科学的育儿理念。

机器学习技术在亲宝宝的业务应用

机器学习技术在亲宝宝的业务应用

亲宝宝以MaxCompute的计算和存储能力为依托,构建了整个大数据链路,数据源包括了APP的埋点、Nginx、CDN。使用阿里云的日志服务、流计算、函数计算、DTS等将数据导入到MaxCompute中,在MaxCompute进行数据加工,在这个基础上快速构建用户圈选、BI报表、机器学习和个性化推荐等相关应用。

机器学习技术在亲宝宝的业务应用

亲宝宝基于 MaxCompute 加阿里云机器学习 PAI 来构建用户画像和家庭画像服务,包括了数据加工以及策略标签管理与用户家庭画像。

机器学习技术在亲宝宝的业务应用

我们开发了智能营销系统IMS,结合画像数据,一方面可以针对宝宝在成长过程中的发育特点,推送小报、育儿知识等内容,做个性化的科学的育儿指导。另一方面结合用户家庭对品牌的偏好,精准投放广告。方案上我们使用了MaxCompute加工标签,然后以BitMap的方式存储到PostgreSql数据库,实现快速高效的用户圈选。基于阿里云的MaxCompute、PAI、EMR、流计算、OSS等产品,搭建了个性化推荐系统。

机器学习技术在亲宝宝的业务应用

上图就是我们一个典型的个性化推荐系统的框架结构,最后通过用户的行为反馈,对模型和策略做不断的迭代。

机器学习技术在亲宝宝的业务应用

从收益上来看,可以提升亲宝优品30%以上的UV价值,以及50%以上的点击率,亲子小报可以提升60%以上的阅读时长和50%左右的点击率。

机器学习技术在亲宝宝的业务应用

成长记录是亲宝宝APP的两大核心业务之一,用户每天上传了很多的照片和视频,对于如何帮助用户更好的管理这些文件,我们在图像和视频领域进行了非常多的探索和尝试。旨在通过机器学习技术手段帮助我们的产品进行演进。

机器学习技术在亲宝宝的业务应用

上图就是我们在图像和视频领域部署的相关应用。在服务端我们有人脸检测,敏感内容分析,表情识别、文字检测与识别等。服务端每天要处理千万级别的照片以及百万级别的视频,需要消耗巨大的资源,所以我们把这些服务部署在Serverless,可以弹性扩容,这为我们节省了50%以上的费用。

另外在客户端为了帮助用户更快捷方便的一键上传照片,针对儿童的人像特点,我们开发了人脸检测、年龄检测、图像质量分析等SDK。为了解决性能和模型 ROM size的问题,我们采用了NCNN的框架,后来阿里有推出过MNN的框架,我们也做了尝试。

机器学习技术在亲宝宝的业务应用

这是我们一个应用事例:在检测到家庭合照以后,一个合适的时机生成一个mv推送给用户,给用户一个小惊喜。

机器学习技术在亲宝宝的业务应用

通过以上的图像和视频技术,我们的业务有极大的提升,我们的新用户的文件上传量增加了90%,mv的点击量提高了60%。

机器学习技术在亲宝宝的业务应用

关于智能育儿助手这个模块前面有提到过,基于用户画像,针对宝宝的特点提供个性化的育儿指导。

机器学习技术在亲宝宝的业务应用

除了个性化的育儿指导,我们还开发了智能问答系统,这一页就是我们智能问答系统的方案,用户的育儿问题通过机器分类,选择给KOL、运营以及智能育儿助手来回答。分发到智能育儿助手的问题,可以借助我们NLP技术,并结合用户画像信息,实现高效并科学地回答用户提问。

机器学习技术在亲宝宝的业务应用

目前我们的问答系统完成了1000多个知识点语料标注。

亲宝宝在机器学习技术和应用上具有强烈的好奇心和愿望,希望通过机器学习技术帮助年轻家庭更好的关爱和培养孩子。当然也希望阿里云能够推出更多的更好的产品,拓展我们在机器学习的应用边界。

谢谢大家!

更多大数据客户实战案例:https://developer.aliyun.com/article/772449

首月199元开通DataWorks专业版+MaxCompute按量付费黄金搭档:

https://dw-common-buy.data.aliyun.com/promc

上一篇:Yeahmobi基于阿里云的数据湖最佳实践


下一篇:leetcode力扣647. 回文子串