概述
演进背景
谈用户画像的发展,其实跟用户运营息息相关。用户运营由粗放式的泛运营渐渐发展到精细化运营,到今天有些企业甚至已经迈进单对单运营的阶段。
用户运营1.0时代
早期网站充当的角色和传统报纸类似,流量变现方式较为单一,主要依靠网页边栏广告进行盈利,运营重心偏重于商业诉求,对用户关注相对较少。由于当时技术的局限性,服务器后台记录的用户行为比较原始单一,用户画像体系不像今天那么丰富完善。
精细运营2.0时代
此阶段开始,流量产生的价值远高于上一阶段。流量的变现方式除了广告之外,电商、增值服务甚至当下的自媒体营销也开始扮演着越来越重要的角色,此外传统依靠广告作为主要营收的经营者,为使流量换取更大的广告价值,开始对用户特征进行挖掘,目的是为了对流量进行细分,以便提高精准流量的售价。
如下图所示,早期网站边栏做了剃须刀的广告,100w点击,获得了1w广告费。有了100w的点击,服务器上有了这些行为数据。经过分析和挖掘,识别出点击的用户在行为上属于男性还是女性,然后按照性别进行分类,对50%行为偏好上识别为男性的用户继续投放剃须刀广告,对其余50%的女性改投美妆广告。可能两种广告各自的收入略有下降,比如都从1w降到了8k,但是总体上却从1w增长到了1w6k的广告费收入。
从流量角度来说,精细化运营是流量价值最大化,从用户角度来说就是按需投放。因此可以总结精细化运营有以下三方面特点:
- 用户:更加关注用户特征,对用户进行打标签,做用户画像分析,在用户特征挖掘上也更加关注除了显性特征之下的隐性特征。
- 内容:更强调把合适的内容放在合适的位置,基于兴趣标签精准推送内容,实现信息找人,更关注流量的价值化利用,跟过去粗放式不同,强调精准,更多的去关注留存和转化,更重视发挥流量的价值。
- 数据:通过关键转化路径埋点进行用户行为数据记录,挖掘用户行为数据,更加关注关键用户行为数据表现,更多元的数据分析方式和维度,强调数据价值的有效利用和充分发挥。
单对单营运3.0时代
此阶段留存比新增更重要、在运营上精细深耕比单纯寻求产品上的差异更值得投入,单一用户的价值越来越被重视,而技术已经完全能够满足app内单一用户的行为追踪。
单对单运营最突出特点表现在实时性,之前的运营模式往往是通过对用户历史数据的分析来进行一系列运营操作,由于用户画像过程复杂、数据处理体量庞大、技术难度高等原因,导致数据的延迟,运营效果往往不能达到最大化,单对单运营可以实现实时分析单一用户行为并给出运营方案。
用户与产品进行交互的过程也是产品在用户心中留下印象的过程,如果把一款产品当做一个人的话,每个产品在用户心中的印象都是不同的,单对单运营能做到千人千面。
宏观情况
前面横向的来阐述了用户运营的发展历程,这里从数据应用体系层级的角度,纵向的来看用户画像应用在体系层级中的位置。通过下图所示,人们熟知的StarRocks这款MPP数据库所擅长的,就是红框所圈的部分:各种运营报表、自助分析、用户行为分析、用户画像等等
1.基础平台建设
如图所示,应用体系金字塔的底座是基础平台建设。包括了基础设施建设,从最基础的网络连通、服务器上架、存储、安全、操作系统安装、基础环境部署、监控系统等等基础设施环境建设。ETL工程,涉及整个数据采集、接入、清洗、持久落盘等等ETL过程,为后面DW数仓建设做准备。DW数据仓库建设,会根据业务场景按一定的数据建模原则分层构建,常见的维度模型包括雪花型、星型等。另外像统一SDK和接口开发,数据湖乃至最新提出的LakeHouse等概念,从应用体系层级的角度都属于基础平台建设的范畴。
2. 报表及可视化
有了基础设施底座,用户已经有相对规整的数据。往往会基于这些数据来构建报表,来满足日常的运营统计分析,包括广告主报表、OLAP多维报表、BI报表乃至实时大屏看板等等。到了这个曾经,营运人员已经有了一定的数据分析能力,但是对数据的掌控还是相对固定,依赖大量的数据准备和前导开发任务。这一次对于一款OLAP引擎来说,会遇到高并发低延迟的挑战,会有多维上卷、下钻的OLAP分析需求,既能回溯海量历史数据,又要求能实时导入和查询当前的数据。这些对于OLAP引擎都有巨大挑战。
3.产品运营与分析
到了这一层,运营和数据分析师对数据的掌控要求更强,他们不满足业务/数据开发人员提供的固化的报表,而是希望有更灵活的看数、用数需求。从而像Adhoc即席查询、自助BI、订单可视分析、交互式数据探寻等场景,要求OLAP分析查询引擎能够有很好的支撑能力,能够近乎「随意」的在页面/工具上拖拉拽指标和维度,能够对数据灵活的下钻、上卷、关联查询,并且能快速的返回查询结果。提取聚合好的指标结果,已经不能满足需求,在某些情况下,分析人员可能还需要直接访问最细粒度的原子数据,从而满足更灵活的自助分析。
4.精细化运营
前面2层所做的指标统计和数据分析,即便会涉及个别多维统计分析的环节,但整体还是偏宏观的运营范畴。而精细化运营这一次,对数据的把控会更加精细,涉及的数据的体量大、属性多、粒度细,无论从ETL复杂度还是画像标签建模的难度都具有非常大的挑战。而基于海量的明细数据,进行组合标签计算,从技术实现上也颇具挑战。用传统方案写复杂SQL来做精确去重人群圈选会非常消耗资源,而用诸如Hbase、ES等技术栈,某些情况下可以满足需求,但是基于接口或算子的程序开发来说,灵活性差、开发效率低、维护成本大,这些都成为组合组件架构下进行用户画像客群圈选业务开发的痛点所在。
继续往上就到了数据挖掘、图像识别、个性化推荐等等机器学习等数据科学的范畴了。
5.战略决策
这一层是通过下面4层提供的一些数据应用产物,组合而成的数据产品和服务,从各个运营视角和分析维度为组织的战略目标服务,方便决策者用数据驱动业务,精准做出正确决断。