车来了赵祺:贴近业务,是DT时代第一驱动力

晚上八点,公交站点。

几个夜班族拼命追赶,无奈公车呼啸而过,留下一屁股恶心且油熏烟绕的漠视;

也有人轻倚栏杆苦盼,望眼欲穿,等的好焦灼;

……

任怨声漫漫,小李闲庭信步。像千万位车来了用户一样,车何时来?何时到家?尽在其掌间。DT(Date technology)时代来临,在移动出行行业中,大数据的智能应用能够让快节奏的城市远离拥堵。车来了是国内知名的查询公交车实时位置的手机软件。目前已覆盖全国76个城市,20万辆公交车,每天会有4000万次的报站,10个亿的GPS点数这样的数据量。

车来了每日从容应对1TB的庞大数据,界面简简单单,背后一套庞大的智能分析系统。11月4日,在神策数据驱动大会上,车来了副总裁赵祺对此进行分享,给予行业较高的参考价值。


降低数据噪音干扰聚焦关键数据

“让数据为业务所用,而非更大的复杂性。化繁为简,是让数据产生效果的第一步。” 

车来了赵祺:贴近业务,是DT时代第一驱动力

噪音使数据变得混乱,掩盖了变量间的真实关系。原始数据的混乱与无效不能代表决策与洞察,如何去除噪音是实现大数据分析每天必须面对的因素。借助神策数据,车来了用户数据平台分为五个层级:

1.原始的用户行为日志:1TB/天。经结构化整理,存储到神策数据的数据库中。

2.结构化日志数据:500M 条/天。筛选出来的最有价值部分的日志数据,支持结构化查询。

3.建立多维的数据仓库:30M - 100M 条/天。会根据业务对数据的使用情况来建立不同的模型,用户分析的核心部分。如日活用户来自哪个平台?隶属于哪个城市?激活的时间等。

4.自助查询系统平台:每天数千次。

5.可视化的报表:20+ / 天。

这是一个将原始数据逐渐化繁为简的过程。该结构如同漏斗般将庞杂数据层层精进,数据量级逐层递减,如此优化数据使用规模,不断提取特征值。用户可专注于关键问题和关键数据,不被大量的数据噪声所干扰,数据价值真正为用户所用。


贴近业务需求,建立专属多元业务模型

“数据的采集和结构一定是以业务需求为基础的。需要根据业务需求的变化,来对自己的数据维度进行自定义。只有这样,才能保证数据是可用的,才能让数据成为驱动业务的动力。”

究竟,我的用户在哪个城市?

车来了赵祺:贴近业务,是DT时代第一驱动力
出行数据能够反应社会成员在城市结构网络中的行为特点,并依此掌握用户的出行意愿与决策习惯,精准勾勒用户画像。作为一家出行企业,实现数据分析与优化的基础,应知道用户在哪个城市?

赵祺坦言:“由于各城市经济发展与区域特点的差异性较大,为准确判断用户的城市维度属性,市面流行的开箱即用的数据分析产品让车来了走了不少弯路。”比如,该类产品仅通过IP地址无法分辨出用户属于济南市,还是青岛市,毕竟IP地址定位局限于省和直辖市级别。

定制多元模型,从模糊分辨到精准定位

基于各种定位的局限性,车来了借助神策数据建立定制化多维度模型。判断一个用户属于哪个城市,可以通过三种方式: GPS定位、IP地址定位、用户选择城市。

显然,GPS定位是最精准的来源。而有数据显示,大约5%到10%的用户并未开放GPS权限。对于这部分用户,可辅助使用IP地址定位,以及让用户主动选择城市,来确定其所属城市。

如此城市定位准确度大大提升,在确认了用户所在城市后,配合其他维度数据,比如月活,用户查询,广告点击等,即可针对发展不均衡的城市,做一些数据对比分析。

该案例仅是车来了根据实际业务需求,建立专属的多元模型的缩影。数据的智能分析与优化,并非简单的记录日活、月活、留存率。以业务为起点,处理特有的数据维度、数据采集与跟踪方式,就需要神策数据这样可定制化的数据平台了。


以业务场景为起点,数据驱动优化“模式”

 “无论是在数据结构层面,还是在数据驱动优化模式层面,都需要贴近业务。只有这样才能真正让数据来驱动产品优化,带动增长。”

让用户第一时间找到需要的线路?

80%的车来了使用者为通勤用户。他们特点是,早晚高峰用户乘坐的公交车是一样的。“让用户在首页的前三条找到自己想要的线路”,即为车来了的优化目标。

在大数据优化中,这显然是一个典型的基于“模式”的数据驱动优化。赵祺介绍,车来了基于模式的数据驱动优化由三部分组成:场景、工具、策略。这是一个确定场景、匹配工具、选择与执行策略、检测策略有效性的闭环,最终优化产品,促进增长。

首页进线来源由50%优化至85%以上

车来了赵祺:贴近业务,是DT时代第一驱动力
如图所示。当明确了“让用户在首页的前三条找到自己想要的线路”场景后,工具计算出了每一张卡片的点击率(公交路线,如106路、301路,均为一个卡片),配置如收藏线路优先、常用线路优先策略等。最后通过AB测试,跟踪后续的实际效果来验证策略。赵祺表示,借助神策数据,车来了数据分析团队将首页进线来源从50%优化至85%以上。

“业务是一切数据分析与优化的起点。贴近业务需求,是通过数据分析来优化产品,促进增长的重要条件。”赵祺总结道。神策数据理念与此如出一辙,通过客户的业务实际需求与业务场景实现数据可视化分析与优化,化繁为简精进了数据使用规模,聚焦关键数据,从而驱动数据优化与增长,从而增加用户的使用黏度,提高企业生产力。


点击屏幕下方“阅读原文”,获取秒拍副总裁陈太锋演讲PPT。

车来了赵祺:贴近业务,是DT时代第一驱动力


上一篇:pythonchallenge Level 14


下一篇:【2022-02-08】小程序逆向之安居客sig