近日,世界顶尖大数据峰会Strata+Hadoop World(SHW)在Suntec Singapore International Convention & Exhibition Centre召开。受到主办单位Cloudera邀请,小编有幸来到现场感受大会氛围。在这里,小编领略到最领先的大数据技术、最广泛的应用场景、最生动的用例,以及最全面的行业趋势,真是不虚此行!
Keynote Speech
(图片来自大会官网)
Keynote作为开场演讲,是SHW大会上场面最为宏大的环节,以最紧凑和最生动的形式奠定了整场大会的主题和基调。虽然每一场演说都很简短,不像Session部分可以深入探讨技术细节,Keynote的每一位嘉宾却都是主办方专程邀请的行业专家,他们所探索和传达的往往是圈内人最为关注的话题。下面小编试着从几个主题向大家展示一下Keynote的精彩内容。
丰富的应用场景
SHW大会的一项重要宗旨,就是交流商业应用经验,一起探索最新技术向商业应用的价值转化,帮助技术发展有的放矢,真正造福于生产生活。本届大会同样邀请到诸多知名企业,共同分享大数据应用的成功经验。
Cloudera董事长兼首席战略官Mike Olson 开场便提出,金融行业有着完善的数据积累传统,一直以来都是探索大数据价值的风水宝地。Cloudera和DBS(新加坡发展银行)就保持着良好的战略伙伴关系,共同探索大数据如何推动金融服务的发展。
DBS首席信息官 David Gledhill 随后就DBS关于大数据的探索做了精彩分享。小编印象比较深刻的有如下几处:
1)星罗棋布的ATM机及其交易历史是银行重要的数据来源,DBS分析了用户存取款习惯和不同地区ATM机的交易频率,实现设备智能补款,大幅减少cash out的投诉;
2)DBS通过摄像记录,分析了用户操作ATM机时的注意力焦点,帮助设计师改善UI界面,提升用户体验;
3)DBS发现同一排ATM机中左边的取款频率高而右边的存款频率高,因此有意识调整了引导标识,实现终端设备负载均衡;
4)DBS还把大数据应用到内部管理,通过行为分析预测资深销售人员离职跳槽的可能,从而最大限度保护企业人才,避免业务缺口。
无独有偶,来自OCBC(华侨银行)的Donald MacDonald分享了OCBC最新的数据平台建设成果。OCBC建设了大型市场分析卓越中心,对集团下属的银行、保险、股票交易、私人银行等业务提供了数据科学、决策支持、内部管理分析、客户关系管理CRM和人力资源分析。OCBC的统一销售桌面系统ROME是业内屡获殊荣的CRM管理平台。
来自MetLife(大都会人寿)的Zia Zaman带来了MetLife旗下创新中心LumenLab关于大数据如何影响和颠覆保险行业的思考,并总结出7条深刻的行业预言,比如:
1)过去保险销售主要依靠上门推销,未来保险公司将会根据用户行为精准定位有购买需求的用户,适时推送产品信息,让用户主动寻求购买;
2)保险产品的设计评估将从精算为主逐步发展为精算师加大数据的模式;
3)保险企业的责任将会从事后赔补发展为事先预防服务;
除了金融,大数据还和生产制造、公共出行、农业发展等诸多领域息息相关。与金融行业不同的是,这些领域对数据的选择、采集和使用还缺乏成熟的经验,因此更加需要一大批先驱去摸索和创新,很多时候数据研究和物联网的发展紧密地联系在一起。
Fusionex的Issac Jacob为大家带来了Fusionex在工业制造和物联网领域的探索和尝试。众所周知,生产活动会产生大量的运行数据,如何从这海量数据中发掘出价值一直以来是困扰业界的难题。Fusionex认为,生产设备故障引起的停机维修会造成巨大的经济损失,通过科学地布局监测网络,实现生产过程的主动监测、预测分析、提前维护,可以大大减少不必要的损耗和经济损失。
Vijay Narayanan分享了Microsoft的农业生产解决方案 ACID(Algorithms, Cloud, IoT, Data),以及在印度的成功实施案例。Vijay认为影响农业产出的主要因素有降水、温度,以及合理的播种时间。首先他们分析了Andhra Pradesh的降雨和气温记录,实时监测和预测当地天气状况;在合适的播种时机,通过Azure平台向农民的手机发送建议,提供基于数据的播种指导,最终实现产量的大幅提升。
来自Uber的M.C.Srivas向大家展示了Uber不仅是一家出行服务公司,更是大数据实时分析技术的领航者,相关的应用场景包括:
1)分析每天各个时间段的出行需求,在出行高峰前合理调度车辆,保障司机有单可接,乘客有车可坐;
2)根据出行需求,保证合理的空车裕量,解决乘客出行难;
3)合理布局服务器架构,保障服务信息的快速响应,抵御庞大的负载;
4)迭代的机器学习算法,提供准确、合理的预测分析;
5)犹抱琵琶半遮面的无人车研究,包括图像识别、智能决策等前沿研究。
全新的技术探索
由于Keynote演讲时间不长,一般不涉及深入的技术交流,但是也会有极其精彩的项目在Session之前亮相打个招呼,带起大会的创新节奏。
相信大家不论对计算机专业是否了解,都对今年年初AlphaGo大胜李世石的新闻记忆犹新,而AlphaGo的活跃进一步带动了人们对AI、Deep Learning,以及深度学习框架的广泛关注。来自Google的主讲人Wolff Dobson恰恰是来自TensorFlow团队并参与过DeepMind项目的Geek大牛。本届大会上,Google最大的目标就是把TensorFlow最新最全面的信息带给大家,大有我就是创新我要改变世界的领袖气质!更多资讯欢迎关注小编之后带来的Session分享~
来自Sapient Global Market的Julie Rodriguez分享了数据可视化的一项有趣创新。Julie认为以报表的形式展现数据容易增加用户的疲劳,而且无法快速地展现出对象的直观特点。Julie尝试了一种生动的图形化方法,把数据结果建模为小鱼的形象,并把每个数据关联到小鱼某一部位的绘图属性,比如长度或者宽度。面对不同对象时,小鱼会根据数据的变化表现出不同的形象。经过合理的设计建模,就可以通过小鱼形象所体现的性格和情感色彩,帮助用户快速直观地把握数据的宏观特点。
未来的发展方向
个性化推荐和精准营销一直是大数据分析的重要应用,来自Digital Asia Hub的Sara Watson结合个人经历提出了她对服务推荐功能的思考。很多时候,个性化推荐的基础是用户标签,系统会根据我们在社交网络上的只言片语,或者我们在购物网站上的某次点击,将我们归类为某些产品的潜在用户,然而这些关联背后的逻辑并不总是成立。错误推荐的坏处,一方面是带来大量垃圾信息,更坏的情况是某些产品会给未成年人等群体带来消极的影响。Sara希望,未来的个性化推荐可以更多地挖掘用户的意图,而非给用户打上平面标签;可以尝试挖掘用户长期的行为特征,而非某几次的偶然操作。
来自Altimeter的Susan Etlinger提出了Image Intelligence的新概念。她举了这样几个例子:一幅网球比赛的照片,可能隐含着赞助商的广告信息;一幅社交网络上的美食照片,可能隐藏着店家小小的营销目的。过去我们对图像的分析局限在识别表层信息,如果可以掌握图像话中有话的深层信息,就有可能实现更高级的智能服务。这一想法的内涵真是极为丰富,它需要精准的图像识别作为基础,更需要对高维度特征的分析挖掘,而之后的智能决策又是更加深刻的命题,相当开阔眼界哈。
大数据和AI的蓬勃发展带动了新一轮创新浪潮,同时也引起社会迷思:未来的人类是否会因为AI面临大量失业?来自McKinsey的Ferry Grijpink分享了麦府关于机器是否会代替人类的研究和思考。Ferry给出以下几个观点:
1)技术发展会造成一部分工种消亡,但同时会催生出新的工种;
2)技术发展某方面可以促进就业,如在线人才平台的诞生比如LinkedIn;
3)麦府自身也采用数据驱动的方法进行研究,把职业分解为行为,以行为进行数据建模,分析各种工作的行为需求以及行为的可替代性;
4)经过分析,目前并没有工作可以完全被机器替代。不过,越是重复劳动的工作可替代性越强,而依赖经验和主观决策的工作替代性就较弱。
一点感想
回顾演讲内容,小编对大数据最新发展产生了几点拙见:
1)Location Based Service 和 Personalized Recommendation依然是数据分析在商业领域最多也最成熟的应用;
2)实时数据分析的比重会越来越大,流式数据、在线分析等技术也会在Session当中频繁提到;
3)业内一直在积极探索物联网应用,以及大数据对重资产领域的推动。
另外小编还想说,参加SHW的机会有限,但是了解大数据最新发展的机会很多。清华大学数据科学研究院会定期组织专业讲座,包括RONG系列论坛、“应用·创新”与“技术·前沿”讲座、及清华大数据思享会。精彩干货,尽在THU数据派!千万不要错过哦~