AI崛起,阿里的科技孵化力|甲子光年

塑造者No.56

阿里是从什么时候开始变成一家世人眼中的科技公司的?

至少2012年时不是。

当时浙江大学计算机学院的毕业生都不愿意去同城的阿里,他们认为百度才是极客的理想目的地,而阿里是个“电商公司”。

甚至到2017年时,也不算非常明显。

否则,当年3月9日的黄龙体育场里,在阿里成立18年来举办的首届阿里巴巴技术大会上,阿里巴巴CTO张建锋也不会特意强调,“阿里巴巴的商业太成功了,所以掩盖了阿里巴巴在技术上的光芒”。

而站在2019年回看,阿里的科技之力已深入人心。

这种新形象由多块拼图汇聚而成,比如:

一群疯子是如何在“疑似骗子”的王坚的带领下,流汗、流泪,死磕出自研的阿里云的。

10年间,以北京汇众大厦的一行代码“##Created at 2009-02-19 by Apsara”为起点,“飞天”是如何更迭、裂变,成为连接全球49个地区,绵延上百万台服务器的庞大复杂系统的。

漆远、金榕、华先胜、贾扬清等业界知名科学家是如何陆续被阿里吸引的。

逐渐成为程序员心中Java圣地的阿里,是如何掀起一场Java规范风暴,攻克了万人技术公司在研发、维护大规模代码上的共同难点的。

……

正是这一群群人的一个个故事,一点点筑就了阿里的科技形象。

而所有故事中,最新、最不可忽视的一个是2017年10月横空出世的达摩院。

阿里科技看达摩,达摩先锋看AI。

AI崛起,阿里的科技孵化力|甲子光年

达摩院下设机器智能、数据计算、机器人、金融科技、X实验室几大分支;其中AI力量集中在机器智能实验室。

今年以来,此前相对低调的阿里AI视觉能力开始高频亮相:

从被誉为人工智能世界杯的WebVision,到指向多模态AI新趋势的视觉对话竞赛Visual Dialogue Challenge,再到CVPR2019的LPIRC(低功耗图像识别挑战赛),达摩院AI视觉团队创下了一个月内连夺五冠的纪录。

落地方面,达摩院视觉AI日调用量已超过10亿次。

成立两年来,整个达摩院的AI力量,更是在国际*赛事上斩获40多项第一,近400篇论文入选国际顶会,并落地了包括遥感影像分析、违禁物品X光检测、工业质检等在内的多种行业AI。

而在最初的起点,马云并没想过做技术公司。十年前,业界流行的说法是“百度的技术,腾讯的产品,阿里的运营”。

那么,从支撑年年经受双十一考验的超大规模电商平台,到云计算,再到达摩院AI,一个day one技术基因并不重的公司,如何成长为世界第二大经济体中最重要的科技力量之一?

正如世人惊异于有机生命何以从无机物中诞生,一个企业摆脱“基因论”重力场,实现升维的机制也令人着迷。

由于出发时的相似处境,阿里的“科技孵化力”,对思考未来5到10年各行业传统企业的科技转型之路有别样意义。

诚然,这是个宏大命题,一篇文章讲不完。

本文,「甲子光年」采访了阿里达摩院高级研究员华先胜(达摩院城市大脑实验室负责人),达摩院研究员徐盈辉(达摩院机器智能实验室机器视觉团队负责人),和机器智能技术事业部首席架构师王骏(负责达摩院机器智能技术的整体产品设计),聚焦体现阿里科技孵化力的最有代表性的一张牌——AI视觉技术。

它值得被仔细观看的意义在于,AI视觉能力勾连了更早起步的阿里云,又指向阿里科技孵化的下一站——输出科技转型方法论。

这关系阿里的又一次蝶变,也关系着全行业数字化、智能化的未来。

1.AI显形

2014年8月,手机淘宝上线了一个不起眼的新应用——拍立淘。

产品如其名,解决的是“拍照搜货”的需求:淘宝用户可通过上传自己随手拍到、看到的好物图片,寻找淘宝上的相应商品。

刚上线时,拍立淘的入口在一个毫不起眼的4级菜单里,每天的调用量就几百。而如今,它一路升级成一级入口,日调用量已过千万。

这背后,是达摩院AI视觉团队目前的王牌技术之一——图像搜索。

在2018年3月在巴塞罗那MWC(世界移动通信大会)上亮相,正式以阿里云为依托对外输出前,图像搜索技术已在内部“hard模式”里验证了4年,载体正是当年名不见经传的拍立淘。

今年7月的一场小型沟通会上,机器智能技术事业部首席架构师王骏谈起阿里图像搜索技术:

“我们去谷歌演示过,至少我看到的是,谷歌没有我们做得好。”

这个功能对用户来说非常好理解:拍照、搜货、比价、挑选、购物;类似Google在2010年推出的图片搜索。

但用户的方便背后,却是一众工程师的山高水远,电商场景为图片搜索提出了更多新要求:

一是卖家、买家上传的真实拍摄图片,背景复杂、环境多变、拍照终端的图像质量参差,而阿里技术团队要把这些角度不同、环境不同的图片定位到同类商品;

二是一般的图片识别,只需识别“这是猫还是狗”,而电商图片识别和搜索则要定位到SKU(库存量单位,可以理解为最小品类),完成型号、制造商、出厂年代等细致标签的“细粒度识别”;

三是阿里电商自身的超大体量对算力和算法的挑战:每天会有超过2亿人登陆手淘,淘宝已汇聚超过10亿种商品。这倒逼着拍立淘索引了淘宝大约30亿的图片,囊括了近1亿商品——这是任何实验室无法匹敌的数据量和训练量,而且算法迭代全部发生在真实业务场景。

图像搜索技术的诞生,揭开了阿里科技孵化力的第一层基础:丰富的自有场景。

而电商之外,阿里经济体涉及的进出口贸易、支付、金融、物流等多种商业场景也像一个个练兵场,孕育着多种AI应用:如服务速卖通(阿里B2B对外贸易平台)的机器翻译能力;服务淘宝、天猫等阿里系海量电商业务的智能客服能力(后发展为阿里小蜜)等。

达摩院机器智能实验室机器视觉团队负责人徐盈辉告诉「甲子光年」,到现在,达摩院AI视觉已积累了3个核心能力:

超大规模视觉训练引擎,在模型压缩技术上的创新,和在AutoML(自动机器学习)上的创新。

这些能力像一个强大底盘,“这决定了我们能在遥感影像分析,X光(机场、火车站的违禁品安检)和OCR(文字识别)方面能快速落地并做到领先。”徐盈辉说。

丰富的自有场景和巨量数据,为阿里技术体系带来一个长期效应:吸引*人才。

与数学、物理等基础科学不同,计算机科学的试炼场和磨刀石就是工业界,顶尖技术往往喂养于“研究→实践→反馈→研究”的业务一线。Google、Facebook、Amazon、阿里、腾讯等大公司的真实场景和海量数据,无疑是全球计算机科学的“顶配实验室”。

达摩院的前身、成立于2014年的iDST(数据科学与技术研究院)当年在硅谷能吸引到金榕、漆远、华先胜、周靖人、任小枫等顶尖人才,就得益于场景和数据的“诱惑力”。

AI崛起,阿里的科技孵化力|甲子光年

从左至右:任小枫、金榕、华先胜

比如,美国密歇根州立大学终身教授金榕在正式加入iDST前,曾给阿里做过一年顾问,在解决了一个大规模算法优化问题从而将广告展示收入提升15%-20%后,他第一次深刻感到“理论的东西原来可以改变生活”。

游说普渡大学终身教授漆远加入时,阿里云创始人王坚拿出了当年彭蕾和他说过的话:

阿里是坐在金山上啃馒头,丰富的数据就就是金山,但价值却没有被挖掘。

这场交流后,漆远决定加入阿里,王坚自己都有点吃惊:“他真的非常果断就来了。”

图像搜索,只是阿里技术百宝箱中的一席。回顾阿里20年历史,以阿里云诞生为节点,可划分为上下两程:

上半程,1999~2009,积累金山的10年;

下半程,2009~2019,吸引人才、挖掘金山、再吸引人才的10年。

这令人敬畏的正向“飞轮”已打磨许久,只是近两三年,它的威力才逐渐对外显现。

2.阿里的技术价值观

拥有场景和数据,就能充分解释阿里“基因改造”般的进化吗?

百度、腾讯同样坐拥金山,手里有“地”,有盖房资本。为什么当年率先重仓云计算的是阿里?

因为各家的“地”禀赋不同。

阿里的“地”有独特之处:贫。

腾讯的游戏可以直接搞氪金,《王者荣耀》日流水曾在2017年2月一度超过2亿人民币;百度搜索则能借助海量访问做广告,商业模式堪称印钞机。

而阿里的基本盘电商,从赚钱能力看,是个运营重、服务重的贫地;支付、物流等场景也不轻。Amazon和京东的长期亏损也侧面佐证了电商并不好赚钱。

先天不足,就要后天努力,这逼迫阿里在挖掘业务积累的海量数据价值上花了更多心思和功夫——他们的动力不是锦上添花,而是雪中求炭。

根据启动云计算时期的2010财年财报,当时已成立11年的阿里,年利润是-5亿人民币,腾讯则是52亿。

但同时,相对重的电商场景却带来一个好处——阿里积累了大量的交易、金融、供应链、物流链等高价值商业数据。

如果说在互联网时代,这些数据的独特性尚不显现,那么在产业互联网时代,阿里对物流、商业等整个产业后端的深刻渗透和对制造环节等前端的部分涉及就有了巨大优势——最重的阿里,与传统行业有最深的接触。

这对转型中的传统企业也是一种启示:零售、商旅、金融、制造领域的许多龙头企业其实有场景金山,但有些还暂未转化为数据金山或尚未充分挖掘已有数据的价值——他们在未来都有可能进化成依靠技术驱动的新业态。

这不是一条好走的路,但越难的事,做成了,往往价值越大。

在独特场景为阿里植入了“向技术要红利”的饥渴后,阿里到底该如何从马云口中的“没想过的技术公司”真正变成科技大厂和工程师汇聚地?

这关系到阿里科技孵化力的第二层基础:阿里的技术价值观。

马云曾说:“我更喜欢从商业需求倒逼出来的技术公司。”

在阿里CTO、阿里云智能掌舵人张建锋身上也能看到这种“商业倒逼技术”的倾向。

张建锋说,世界上有两种CTO,一种站在业务角度看技术,一种站在技术角度看业务,他自己偏向前一种。

在于2016年4月被任命为集团CTO之前,张建锋的职业经历兼具技术和业务:刚加入阿里时,他是淘宝网技术部的架构师;随后转战业务条线,在2015年统管淘宝、天猫和聚划算,这是阿里最实权的业务岗位之一。

那么,当一个务实、接地气、结果导向的阿里开始在2014年后引入AI顶尖科学家,新血液能适应这种“草莽”氛围吗?

技术价值观不是一日建成的。

达摩院机器智能实验室主任金榕,在融入阿里的过程中就经历了磨合的波折。

最初加入阿里时,金榕是iDST共同创始人,他接手的第一个工作是优化聚划算算法,目标是提升GMV(商品交易总额)。

这个任务技术上不难实现,却面临业务的两难:提升GMV最快的做法是把便宜的东西往前排,价格刺激能击中大部分人;但长此以往,用户人群会下沉,影响聚划算的整体商业价值。

到底怎样才是“有价值”?业务和技术团队达不成共识。

争议背后,新血液加入,带来的其实是赚钱的和烧钱的、打*的和拓*的技术团队之间的暗流涌动。

到2015年7月,被业务部门吐槽“不懂业务”的iDST经历大变:

研究院被拆分为3路人马——漆远加入蚂蚁金服;金榕带视觉团队加入淘宝、天猫搜索部;漆远本来带领的语音团队留在了阿里云。iDST也从集团直属,变成了隶属阿里云。

“上山下乡”,金榕后来如此形容这次融入业务的练兵经历,“必须要知道粮食是怎么长出来的,钱是怎么挣的。”

在分流到各业务部门后,科学家接受了一次“再教育”,金榕所在的淘宝、天猫搜索部就是后来在2014年做出拍立淘的团队,这是一个简单需求+复杂、前沿技术+用户价值结合的典范。

第二年,已逐渐从30人扩展到约120人的金榕团队拿到了集团CEO奖,这是阿里的最高荣誉。

回想过去做聚划算的经历,金榕说当时一是听不懂业务,二是确实心里并不欣赏业务部门的人,但理解了从技术到产品的全过程后,才了解了业务部门的KPI有千钧之重,这是真金白银,是公司也是用户的价值命脉。

达摩院延续了iDST的风格。

马云在2017年成立达摩院时说过,达摩院不是贝尔实验室,也不是英特尔研究院,达摩院不会“研而不发”,达摩院要做最适合21世纪的研究院。

从达摩院的人事安排中,能窥见这种研与发并重、技术与产品并重的特点。

目前达摩院AI视觉能力的两大力量:城市大脑实验室和视觉实验室,其负责人分别是华先胜和徐盈辉。

两人都身经多年行业打磨:前者曾在2015年到2016年于淘宝、天猫搜索部负责拍立淘算法开发;后者也待过同一个部门,加入达摩院前,还曾任菜鸟人工智能事业部负责人。

据徐盈辉透露,达摩院机器智能实验室各细分方向带头人大多和他经历相似,拥有技术、产品双重背景:

“要把技术融入一个产品时,你要有一定的系统架构能力,能让这个东西真的高效运转。同时要有广泛视角,知道如何将客户需求定义成技术问题,再去求解。”

徐盈辉概括的这两种能力,支撑着达摩院从研发到产品和从业务需求到技术沉淀的双循环。

在技术与业务的理想关系上,金榕非常推崇亚马逊,认为亚马逊从一个电商公司变成了一个技术公司,某些方面甚至比Google还有竞争力。

亚马逊与Google在科技孵化力上有一个明显区别:

在搜索之后,Google许多拿得出手的成果来自外部收购,如DeepMind和YouTube,其中最重要的是奠定了Google移动互联网地位的Android。

而亚马逊内部却先后诞生了Kindle、Echo、Alex语音助手、Amazon Go无人零售解决方案等具有重大商业影响力的项目。

“谷歌的机器视觉技术有200多个博士,但YouTube不用他们的东西。亚马逊的技术人才没Google多,但它能把东西做得很有影响力。”金榕曾说。

追求“有影响力”的技术,这是阿里的技术价值观。

绕了一圈,金榕回到了他加入iDST前给阿里做顾问那一年的美好体验:理论的东西,原来真的可以改变生活。

3.从以云为工具,到以云为场景

在追求“有影响力”的技术之外,近年来,随着业务走入无人区,阿里的技术价值观又多了一层新含义:拓边力——拓展边界的能力。

2017年达摩院成立前后,张建锋曾说,阿里的技术正处于从应用型向研究型的关键转型期:“你把现有技术的可能性都挤干之后,必须考虑新技术的可能性。”

他把阿里的技术分为优化和创新两个部分,推荐、搜索和广告属于优化;而真正的创新是“定义一个新市场”,“今天我们两件事都要做到极致。”

在阿里定义新市场的拓边之路上,云计算既是起点,也是近10年最关键的一场战役。

起步于2009年的云计算,出发点是解决日益增长的IT基础设施的巨额成本,但在具体路径抉择上,却极具开拓精神:坚持自研。

当时,胡晓明内部创业的阿里金融(蚂蚁金服网商银行前身)成了阿里云内部的第一个小白鼠,马云非常有魄力地把这个关键场景放到了阿里云,胡晓明经常被bug频发的早期阿里云整到崩溃。

但9年后的2018年5月,云栖大会·武汉峰会上,时任阿里云总裁的胡晓明却充分肯定了自研的意义:“拿来主义盖不起高楼大厦,自主研发的云才能走更远。”

当年的杭州云栖大会,阿里云技术研发负责人蒋江伟更详细地阐释了自研的必要性:

阿里云之所以可以进化出更多功能,是因为飞天的代码都是阿里人一行行敲的,知道哪里有坑、何时该填、如何优化,确保了整体架构的有机统一和快速升级。

阿里云闯入无人区的开拓之路,奠定了如今阿里在中国公有云市场近50%的占有率,做到了张建锋所说的“定义新市场”。

而当阿里云计算站稳脚跟,这个庞大经济体又启动了下一棒科技接力:

云,这个本身由电商场景倒逼出的“新工具”,开始成为继电商、支付、物流后,AI技术落地的“新场景”。

其中,以AI视觉技术为核心的“城市大脑”是一个典型代表——它是阿里第一个“原生于云场景”的重点业务。

蓝图很大的城市大脑其实是“卖云”的自然演进:最初是某街道、某区的交通部门、城管部门、消防部门有了基础设施上云、减少IT成本的需求。渐渐这类业务做多了,阿里想到了“城市级的整体上云”。

这带来了完全不同的空间,阿里云的角色不再是简单的卖存储和计算力,创造的价值也不只是减少成本,而是让前期部署的摄像头等各种传感器的整体能力升级,从“功能机”变为“智能机”。

阿里把这种进化过程凝练成了一个场景:

世界上最遥远的距离,是同一根杆子上,摄像头和红绿灯的距离;摄像头看到了这个路口所有的过去和现在,但它从不告诉红绿灯该怎么优化。城市大脑要做的就是让红绿灯和摄像头能互诉衷肠。

城市大脑实验室负责人华先胜告诉「甲子光年」,目前阿里的城市大脑已能做到处理数十万甚至上百万路视频数据,通过比拍立淘图像搜索更上一个台阶的技术,实现了大规模实时交通事件事故检测,跨区域、跨时段寻找肇事逃逸车辆、失踪人口,预测车流、人流,给出市政规划建议等功能。

AI崛起,阿里的科技孵化力|甲子光年

阿里城市大脑在杭州萧山区的区域试点

3年多来,阿里的城市大脑已在杭州、北京(西城、通州)、上海、苏州、衢州、澳门、吉隆坡等境内外十几个城市落地。

华先胜告诉「甲子光年」,阿里的竞争力在于通过沉淀标准化产品,大大降低了城市大脑资金和时间成本:

“一个星期上线没问题,快的话3天。而且速度和城市规模没什么关系。”

在原生于云的城市大脑等应用之外,达摩院与云的深度绑定,也帮助脱胎于电商等阿里老场景的AI视觉技术在更广阔的天地落地。

目前,图像搜索技术已服务了东南亚、澳洲的十几家本地电商;它在2018年初于巴塞罗那亮相的第一天,就吸引了一家日本技术代理商,类似的商务合作伙伴也在1年多以来日益增多。

电商之外,图像搜索技术的延伸应用则有为纺织、服装企业提供布料搜索能力;为国家商标局提供查重能力;未来,还可服务专利、版权领域。

在对外落地上,达摩院AI视觉团队已形成了挑选场景的方法论:

“需要证明客户价值,锦上添花的视觉应用很难形成规模。有时,客户让你解决的可能不是一个纯视觉问题,而掺杂了很多其他业务因素。视觉做好了,不意味着问题就解决了,或者这个问题也不一定要用视觉解决。技术感兴趣的点不一定是客户真正的痛点。”徐盈辉告诉「甲子光年」。

从以云为工具,到以云为场景支撑AI技术多方落地,阿里技术体系继续拓边,也带来新的思考维度和商业敏感。这种对外落地方法论,和在阿里内部用AI技术服务天猫、淘宝已是很不同的逻辑。

阿里改变了他们,他们也改变了阿里。

4.定义科技转型路径的野心

阿里想改变的还有更多。

对达摩院来说,从应用型技术到研究型技术又到了一个新的“交棒关头”,在对AI技术的探索上,达摩院的下一个方向指向更底层、更硬核的芯片。

和过去20年一样,阿里的逻辑仍是在“沿着业务需求加科技”。

在AIoT时代,终端对低功耗、高算力的需求,给芯片行业提出了挑战,也创造了机会;另一方面,摩尔定律逐渐失效,硬件突破已十分艰难,这就需要软件层的AI算法和芯片之间形成更深度的配合,“算法定义芯片”成为行业趋势。

已在AI领域积累一定优势的阿里,有能力也有必要做芯片;此前,Google、Facebook纷纷涉足芯片也是出于相似逻辑。

而在讲到“技术从应用型转向研究型”时,张建锋还加了个定语,“所有中国公司都面临这个过程”。

20年来,阿里从一个技术基因不明显的公司成长为中国重要的科技力量,其转型历程和方法总结会给相当部分志向高远的各行业公司带来启示。

在今年3月的阿里云智能“十年再出发”的大会上,张建锋把阿里云智能的整体能力总结为3条:

基础设施云化

核心技术互联网化

应用的数据化和智能化

AI崛起,阿里的科技孵化力|甲子光年

2019年3月北京阿里云峰会,张建锋首次作为阿里云智能掌舵人亮相,阐述阿里云新思考。

细数阿里云智能的这套3段论,其实每一点都可在阿里10年来的自我发展中找到内部实践:

基础设施云化

——2009年,阿里在成本压力下,挺进云计算,解决的是存储和计算问题;阿里云在初期主要卖的也是这两个能力。

核心技术互联网化

——2015年,马云从芬兰归来后开始在阿里推中台战略,最终形成了业务、数据双中台架构,构建了互联网分布式架构、下一代数据库、中台技术等系列方案;这为打通阿里经济体内的数据资源,整合四散的金矿,减少重复投入和快速进行业务创新奠定了基础。

应用的数据化、智能化

——基于云计算和中台对数据的整合,高效发挥AI、IoT等技术的潜力,带来应用和商业价值的升级;以图搜货的拍立淘,让城市感知系统从“功能机”升级为“智能机”的城市大脑都是这类实践的代表。

一头AI、一头云,阿里释放出了定义科技转型路径的野心。

这套方法论是否适用所有企业还有待验证,但非常有说服力的一点在于,它已在阿里内部被验证了10年,目前则进入了逐渐输出的阶段。

至少在思维意识上,阿里又已领先腾讯、百度半个身位。

而对同属AI赛道的成长期公司来说,这不算好消息。

面对巨头在底层云计算的优势和上层商务合作、打造完整解决方案上的猛扑,商汤、旷视等头部AI创业公司面临抉择:

是集成到大的云生态上,还是自己来?

“它们想要形成一个像阿里或腾讯这样有稳定业务的商业闭环,选项其实不多,其中必定有一项是走阿里曾经走过的路。”王骏说。

而抛开云计算、AI行业内部可能发生的直接竞争,对更广阔的市场来说,科技企业与各行业企业之间也许能形成“小山头林立”的多元创新局面,一个可能的路径就藏在AI+云本身的图景里。

按阿里自己提出的这套科技转型3段论,一个可预见到拐点是,整个云和智能的生态正从“数据和业务靠近系统”,变成“系统主动靠近数据和业务”。

各行各业里,掌握场景、数据的公司的重要性会持续提升。毕竟,仅凭一家或几家公司,无力激活金山万千,自己行业的金山怎么挖,自己最清楚,行业龙头若能抓住新的转型机会,可能在体量和质量上都跃升一个层级。

而对阿里云、腾讯云来说,卡住底层基础设施,服务开发者,借助生态撬动更大价值才是理想状态。

这也是为什么阿里云今年3月以来反复强调“被集成”;腾讯则甘当绿叶,要做各行各业的“数字化助手”。

人类已完成了机械化、电气化、信息化,下一个时代属于数字化和智能化,投射到各行业,便表达为新零售、新制造、新金融、新物流……这注定是一幅波澜壮阔的图卷。资本家、企业家、工程师、观察者、普通人,都会在其中,有一个主动或被动的位置。

日调用量已超过10亿次的达摩院图像AI,只是完整拼图中的一个小小起点。

10亿,很多吗?

不够,还远远不够。

AI崛起,阿里的科技孵化力|甲子光年

文章来源:百度代码派-甲子光年

上一篇:开放下载!从RCNN到SSD,这应该是最全的一份目标检测算法盘点


下一篇:PS调整图片像素、格式、大小方法介绍