3月28-29日,在工业和信息化部的指导下,为期两天的“2017大数据产业峰会”在北京国际会议中心召开。本次会议由中国信息通信研究院和中国通信标准化协会共同主办,数据中心联盟大数据发展促进委员会承办,旨在宣贯和解读《大数据产业发展规划(2016-2020年)》,支撑大数据国家战略落地,展示大数据产业发展成果,探讨发展面临重大问题,推动产业交流与合作。北京大学软件研究所副所长黄罡在28日上午的《大数据产业发展规划(2016-2020年)》宣贯会上发表了题为《大数据视角下的API经济》的演讲。
黄罡教授在大数据产业峰会上做主题演讲
以下为现场演讲实录:
今天上午邬院士讲了以数据集为核心的大数据共享开放、流通交易环节产生的种种弊端,但是我们放眼看世界,以美国为代表的数据开放流通共享交易几乎都不是以数据集为核心,而是以API也就是应用程序编程接口为核心。今天我跟大家分享的主题是大数据视角下的API经济是怎么回事。
API经济是针对APP的,APP是手机里的应用,移动互联网出现以后,所有移动互联网的产业价值和用户价值都是以APP来体现的。但是我们知道,在iOs平台上的APP过100万种以后,95%以上的应用已经变成了僵尸应用。美国由此产生新的应用分发模式API,就是开发者根本不用再花心思开发一个APP,然后在应用商店上大力推广,大家要做的事情是把自己的业务做好,把业务以API的方式开放出去,别人会在他们的应用里面集成对应的API:不管是微信还是Facebook,不管是电商还是采购软件都会集成我们的API,只要我们的业务功能有价值,我们的数据就有价值。
我们可以看这张统计图,推特的API每天会有150亿调用,这些API调用并不是通过推特的APP实现的,谷歌每天API的调用次数也超过100亿次,当然还有美国其他的一些例子。我们可以看到,越来越多APP的功能其实不是通过打开应用使用的,而是通过API来实现。
当然大家要问了,为什么要把API开放出来?从大数据领域得到了什么?越来越多的人可以看到,我们的API开放之后,随着用户对API的调用,会得到用户对业务的诉求,从而可以对业务进行优化。所以当今不管是微软、谷歌还是Facebook,他们人工智能的核心业务模式有两点,一是开源,二是开放API。开放API之后,随着用户对API的调用,可以得到所有的客户应用请求,从而进一步优化算法,推动产品发展,这就是我们的API经济。
API应用模式有两种,第一种是对外提供API,第二种模式就是应用集成。大家可以看到当今的Top应用里,微信2015年就已经集成了583个第三方应用的API,包括滴滴打车、大众点评等,我们根本不用在手机里一一打开那些APP,在微信、淘宝里就可以打开。美国亚马逊的Echo,最顶层的应用是定时、播放音乐、帮我读新闻、帮我开灯关灯、帮我调温控等,Echo把家庭智能服务以及移动互联网上的APP以API的方式塞到了音箱里面,以语音交互的方式给用户,这是我们看到的第二个趋势。
API很像当年的网站,应用集成很像当年的门户,自然而然我们可以想到应该有搜索引擎存在,而且这块正是我个人要呼吁的。大家都在说苹果不创新了,国内的手机厂商说今天干掉苹果明天干掉谁,大家可以看看,苹果在2015年10月推出的iOS9之后,在通知栏已经可以让我们收到苹果自己的应用。2016年8月份iOs10已经实现第三方APP应用类数据或者API的搜索。以上图片是我们的截屏,在手机里搜美食就可以把美团搜出来,是美团里的数据,不是美团APP。谷歌在数据API上走得较慢,苹果是成功的,谷歌去年10月份推出的手机里面Google Assistant有类似苹果的搜索功能。
API真正遇到什么问题呢?最大的问题就是数据孤岛的问题,就像今天陈部长、谢司长说的,越来越多的数据是从移动设备、物联网设备产生的,这些数据不是网站可以用爬虫公开爬到的。今天上午邬院士讲了很多数据开放共享流通的问题,API经济能解决类似的问题,以应用为驱动的方式。
那么应该如何解决数据孤岛问题?据我们对国内一流大企业调研,打开一个典型的*和央企的信息孤岛要花费数百万人民币,而且这里面从数据开放流通的角度来看,最大的问题是应用开发商成了关键角色,但这个关键角色不合理,因为在大数据里面真正关键角色是数据的产生者和运营者,跟开发商没关系。就像iOS和谷歌,后端数据不好拿,中间逻辑层重构太难,重点就是我们在前面的讲过的,在表现层通过智能感知把数据拿出来,具体的技术就不展开说了,总而言之,这套技术目前除了斯坦福等*高校之外,也就是iOs里面有一点。
北京大学从2003年开始做类似的研究,经过十几年研究,得到现在的成果,就是打破APP的边界,在各个不同的APP之间跳来跳去,再也不用关心接下来的APP是要去打车要去订餐,全部可以给你打通。
接下来是邬院士反复强调的,就是数据的安全问题,现在我们通过APP搜索平台搜索到大量的个人数据,然后卖给了别人:在淘宝里的一双鞋在今日头条马上给你推,我们每个人都被边缘化甚至都被忽视掉,没有数据的*。而利用我们这套API技术则可以解决其中的安全问题,这是我们做的demo程序,你可以看到在你的手机上有什么数据,第一你知道你的数据在哪个地方,第二你也可以知道每天在这些APP里产生了哪些数据,第三只要你授权,我们可以帮你把所有的产生的数据进行优化整合。
这样达到一个什么好处呢?我们解决了数据开放共享流通里个人的问题,第一每个人本身是有权利而且确实知道个人产生的数据在什么地方,第二可以通过API的方式可以把数据取出来,当然我们不能阻止APP厂商使用,因为你跟它签了和约,但是这个数据本身是属于你,但是此前是因为APP根本不提供任何方式让你把数据拿出来,所以数据根本不能使用,而采用我们这一套技术就可以实现个人对数据的掌握。最后你也可以进一步的利用加工,所有这些东西全是在你个人的手机上,永远不会上网,这样就极大保护了个人的隐私,当然这套数据*保护合不合理、能不能成功,我不知道,我们只是从学术上提供一个可能的探讨思考。
我们同时也在帮*和企业做了燕云DAAS平台,*和企业信息系统里的数据全部是*和企业的,但是今天真正要把它开放的时候,往往受制于系统的开发商和很多其他的因素,这样就给数据开放带来了极大的问题。燕云DAAS提供了API的方式,以API的方式把数据开放出去,可以做到流程可控、来源可溯。
北京大学花了十几年时间,在这套系统软件上做了一套东西,我们希望把互联网、移动互联网以及物联网等分布在各个系统里的数据,在数据拥有者授权的情况下帮它开发出来,帮它进行流通、进行共享,这是一套大的生态,北京大学希望跟产学研各界和*合作,共创中国特色的而且是领先的API经济。