如何利用大数据创造商业价值?阿里云在人工智能领域做了哪些创新和实践?如何利用大数据为机场管理保驾护航?
从预测到改变
闫新发,花名算者,人如其名:在2013-2015年期间,个人几乎包揽了阿里巴巴集团内部大数据竞赛的所有冠军;2015年带领团队在世界推荐算法比赛 (ACMRecSys Challenge,算法领域的世锦赛)取得第二名的成绩,2016年该团队在该比赛获得世界第一名。
他穿着一件简单的黑色阿里云T恤,为华工的同学们带来了大数据的实际应用案例。
首先,在阿里巴巴集团,算法创造了什么价值?
在电商领域,创下1207亿人民币交易额的2016天猫双11的狂欢刚刚落幕。据统计,开场的前30分钟,每秒交易峰值17.5万笔,每秒支付峰值12万,双双刷新纪录。要知道,七年前的第一次双11,交易峰值仅为400笔每秒,支付峰值仅为200笔每秒,8年增长数百倍。
巨额的交易额背后是强大的技术支撑。阿里不仅为用户提供商品,而且希望让数亿用户从十几亿商品中迅速找到所需。依靠推荐系统,我们做到了千人千面。所谓千人千面,即个性化推荐,其一是首页的个性化,这是一个流量分发的过程,即每个用户来到淘宝之后,看到的都是为自己专门定制的个性化首页:
例如有宝宝的妈妈看到的是母婴用品及育儿常识等,如果家里有一大一小两个宝宝,系统会自动推荐婴儿用户的奶瓶和儿童用户的玩具等。相当于不同的消费者来到同一个商场进入的却是不同的楼层在每个楼层看到的也是不同的店面一样。这样就实现了上亿用户和十余亿商品之间的精准匹配,对消费者而言,获得了差异化的服务;其二是店铺的个性化,即用户来到某一个店铺看到的也是她/他最喜欢的商品。
最简单的例子就是女性用户和男性用户来到同一家淘宝店铺看到的是不一样的店铺承接页,女性看到是可爱的粉色页面,是女装,男生看到的可能是庄重的黑色页面和男装,这就好比每个人进了一家线下店看到的都是不一样的装修风格和不同的商品陈列,从而让用户产生更多的共鸣,有了更好的购物心情。
千人千面在有效提高转化率的同时也为用户提供了更愉悦的体验。正如马老师所说:“今天的成绩已经很满意了!双11已经不是数字上看销售额是多少,我们最希望双11给所有的买家和卖家带来快乐,快乐是我们最希望能够量化的东西。”
还有天猫运费险的应用、物流的革新;在金融领域,芝麻信用的评价体系构建;在云计算领域,应用跨集群的优化等等都是在技术的支撑下创新商业模式,创造价值。
其次,大数据在基础产业亦发挥作用。比如在新能源领域,对风力进行预测,解决风力和火力的均衡问题,实现电网并网负载的均衡;在农业、林业领域,通过图像识别进行病虫害检测、产量预测等。
同时,在我们日常生活中,算法无处不在。我们旅游中常常购买特价机票,实际上是预测了未来三天的低价,再以未来某一天的低价的轻微上浮在当前进行出售;即食食品零售商对未来几天的食品需求进行预测,再决定进货量,做到最大化销售,最小化退货;借助云计算不仅能进行导航、软件打车,还能预测未来路况,从而避开高峰期和拥堵地带,提高出行效率等。
在云计算领域,借助阿里云孵化器这一平台,大数据已改变许多行业,比如针对行业通用问题,建构企业图谱,让企业有谱,让舆情可控;在传统零售业预测销量;针对创业类公司,利用调度算法创新其商业模式;利用技术服务客户,利用云计算平台进行3D建模,提高效率;在传统工业通过算法优化提高工艺良品率。
从科技到普惠
通过算者的详尽介绍可以发现,过去我们对大数据的研究多侧重于理念、发展未来、研究性产品,现在的重点更在于大数据的落地。数据技术的应用不仅仅局限于阿里系的物流、电商、金融领域,而是拓展到各行各业,阿里云致力于将它的能力赋能给各个行业,在各个产业落地。
“人工智能是基础,行业才是成为数据科学家的关键。”这是阿里云人工智能首席科学家、小Ai之父闵万里博士在内部常说的一句话。
阿里巴巴从来就不仅是一家科技公司。计算,一定要成为普惠科技,成为各行各业能够简单获取的能力,才能不断去创造“无法计算的价值”。
阿里云搭建的天池大数据平台(tianchi.aliyun.com),基于阿里云的海量数据处理服务MaxCompute,向社会提供科研数据和开放数据处理服务,旨在打造“数据众智、众创”第一平台,目前,天池平台拥有5万+名高质量数据人才,是最大的数据爱好者社区。天池大数据竞赛是基于天池平台开展的数据类竞赛活动,包括算法大赛、可视化大赛和程序设计大赛等多种形式的竞赛,向社会提供科研和实际产业的数据,大赛让所有参与者有机会运用其设计的算法解决各类社会生活问题和商业世界中的实际问题。
正如此次2016“数据引领飞粤云端”广东航空大数据创新大赛,在广东省*和阿里巴巴集团的有力推动下,联合广东省经信委、惠州市人民*、阿里云、广州机场白云科技有限公司共同举办,首次开放航空数据,不仅是一场比赛,更进一步是培养大数据应用人才,鼓励数据创新创业实践,推动民航业大数据技术成果转化和落地。
讲座现场,算者对同学们提出期待:借助阿里云天池平台提供的丰富资源,希望学生通过拓宽眼界,除了学好理论知识,做好研究之外,学生还要多看看外面的世界,思考大数据有可能在哪些行业落地,自己将来会进入哪个行业,如何将对技术的热爱与职业发展相结合。埋头看书的同时也要抬头看路。
(大)数据+(高级)算法=(小)目标
回到问题的原点,是不忘初心。大数据的“初心”是明确其目标,再去思考所需的数据和算法。目标的优化能带来方法的改进和效率的提升。比如阿里云的人工智能ET,待解决问题是如何做决策,如何优化交通,解决方法是通过不断强化学习,而这整个过程都是围绕优化路线这个目标进行的。在我们日常生活中、各行各业的运行中有各种各样的目标,这些目标有大有小,有宏观为微观,大到如何让出行更顺畅,小到如何通过图像识别技术自动识别几百万公里线缆上的某一处是否有厘米级的破损,让我们一起探索用大数据来实现它。
说到人工智能ET,就不得不提阿里云的一支神秘“特种部队”——阿里云大数据孵化器。这是一群由科学家组成的团队,通过利用阿里云强大的计算平台加上*专业的算法与行业数据有机的融合,正在积极探索人工智能在各行业中的应用,不断的挖掘数据的价值,实现用数据驱动行业创新,用数据提升业务效率。
▲阿里云大数据孵化器团队首席数据科学家闵万里(山景)博士▲
数据,即是创新的源泉,也是创新的工具。经济和商业的本质从某种角度来讲,是在各种有限资源的输入下,采用新的方法整合这些资源,提供差异化的服务,创造商业价值的过程。整个过程就是创新的过程,数据既是一种资源(创新的源泉),也是盘活资源的工具(创新的工具)。
数据,使不可能的东西变成可能,使传统产业重新焕发活力。双11,00:00:09付款成功,00:06:51商品完成打包从仓库发出,00:13:19签收成功。佛山芦苞镇黄先生还在买买买的时候,菜鸟联盟成员EMS就送来了包裹。通过用户需求预测,提前铺货,双11第一单快递仅用13分钟便送达,正是大数据对物流业的创新。
菜鸟网络CTO王文彬在2016云栖大会上说:“物流行业的竞争力已经走出单纯依靠规模和价格的竞争,技术竞争将成为关键。物流云的加速发展能够重新定义整个智慧物流,帮助行业升级,应该成为行业的基础设施。我们的目标是国内24小时送达,全球72小时送达。”
数据也变成了一种资源。工业时代机器烧煤来产生动力,而数据时代我们烧“数据”来推动产业,比如天猫推出的运费险,综合商品退货率情况、用户退货行为习惯等数据信息,进行个性化运费险定价,提高转化率,增加收益;比如综合用户的支付历史行为、履约能力、行为偏好等数据信息评估,评出的芝麻信用分数可用于“未来酒店信用住”,先住店后付款。
在讲座最后的问题环节,无论是“业务与数据哪个更重要”等方向性疑问,还是“推荐算法在具体推荐商品中如何选择”等拓展性问题,还是“非科班出身如何在数据时代发挥价值”等职业困惑,同学们抓住机会纷纷抛出问题。直到讲座结束,仍有许多同学围着算者请教疑惑。从这群90后甚至95后年轻人对数据的兴趣和未知的求解中也许可以期待,新生代假以时日会成为主力军。
正如马老师在2015年云栖大会的主题演讲中所总结的那样:中国一定会成为一个计算大国,因为未来的数据是一种生产资料,而未来的生产力就是计算能力和在座的所有创业者的创新能力,企业家精神。