数据中台:前台调用能快速响应、数据口径一致(4)

3.标签是数据商品最适合的颗粒度


数据商品中的数据本身根据不同的颗粒度可以分为对象层、表层、字段层、字段取值层。例如,用户是一种对象,用户下会有用户基本信息表、用户交易明细表、用户注册认证表等表级信息组织。每张表里都会有围绕这种表的详细字段,例如基本信息表中会有性别、年龄、职业等基本信息,用户交易明细表中会有交易时间、交易金额、交易商品等交易信息,用户注册认证表中会有注册日期、注册会员号、注册手机号、认证日期、认证绑定身份证号等注册认证信息。在职业这个字段取值中,会存在教师、医生、工人等多种取值类型。表3-1为不同的数据粒度示例


表3-1 不同的数据粒度示例


数据中台:前台调用能快速响应、数据口径一致(4)


从中可以发现,同一对象群体的不同个体在“对象”“表”“字段”层面都具有相同的信息项,在字段取值层面存在差异性。字段粒度是刻画某一对象群体通用特征的最小粒度。例如每个用户都会有其“基本信息表”“职业”等信息,但是在“职业”的字段取上每个用户都不太一样。


可规模化商业运作的商品应具备一定的通用性和多样性,以达成有效平衡:过于个性化的商品不利于规模化组织、售卖、管理,过于笼统的商品分类又不利于商品的有效选用。


在标签类目体系方法论中,对象对应于根目录,多种表对应于多级类目,属性/字段对应于标签,属性/字段值对应于标签值,如表3-2所示。标签类目体系中的标签是属性粒度的业务向资产形式,最适合作为数据商品中数据本身信息的业务逻辑封装形态。


表3-2 标签类目体系方法论中各概念与数据粒度的对应关系


数据中台:前台调用能快速响应、数据口径一致(4)


4.数据商品化全流程运营


以标签为核心的数据商品化全流程运营过程如下。1)根据业务场景需求,按照标签类目体系方法论设计标签集。例如某女装频道的业务部门打算开展千人千面的精准营销,需要对用户进行肖像刻画,数据产品经理会与业务人员沟通,然后设计业务部门所需的标签,例如“性别”“年龄”“预测购买力”“预测风格偏好”“最近购买品类”等。


2)标签创建后生成标签开发任务,分配给数据开发工程师或算法工程师。当具体字段开发完成后,将数据字段与标签进行关联映射。至此,标签的设计就完成了,经过审核后可以在标签集市中上架,作为数据商品信息呈现。


3)业务人员可以搜索、浏览、查看标签化的数据商品信息,包括标签名称和标签详情、功效、可应用场景、用户评价等。如果发现自己需要或感兴趣的标签,业务人员可以将其加入购物车或收藏夹,以供下一阶段配置数据服务使用。


4)通过服务化的工具,可以将选中的标签集合快速配置成数据服务或数据应用(真正的数据商品形态),供业务部门使用。


5)业务使用过程中所沉淀的日志、反馈、事故等信息都可以用来更好地管理标签和服务,帮助优化数据商品的质量。


6)标签管理过程可以更好地优化现有标签设计。例如,对于质量不高且无人使用的标签,可以吸取教训,避免以后再设计类似的标签;对于质量不高但需求高的标签,寻找更好的设计思路来提升标签质量;对于质量高但需求不高的标签,分析原因后修正标签设计思路;对于质量高且需求高的标签,可以不断优化或设计出更多类似特征的标签。


通过标签化的数据商品参与价值分配,可以预见以下几个结果,如图3-4所示。


数据中台:前台调用能快速响应、数据口径一致(4)


  • 数据部门将会从成本中心变为利润中心。数据部门生产的数据商品会在业务中发挥价值,并通过商品化进行价值衡量与结算,而不产生价值的数据都会被下架以减少成本支出,最终数据部门会收支平衡,乃至变成一个以数据作为核心生产要素的产能工厂,实现数据变现。


  • 数据部门中的标签运营部门会成为重中之重。标签运营部门的人员包括数据产品经理或标签设计师、标签管理员、标签运营专员等。标签运营部门会以业务为导向,以实现数据价值为目标,全链路开展标签价值的测算、计量和扩大化的工作。


  • 通过价值才能真正解决数据打通、治理、使用等“老大难”问题。对奋斗在第一线的数据人员来说,数据打通、治理、使用是压在心上的三座大山。数据打通是数据资产化的前提,但因为存在部门墙、信息孤岛等问题,大家对原始数据过度保护了。数据治理环节复杂、推动困难,导致业务人员没有耐心,数据人员没有信心。数据使用问题是针对业务人员而言的,有时候数据部门非常希望业务部门的人员能对数据感兴趣,能使用起来,但往往因为沟通不畅及数据门槛较高,双方在认知层面存在较大鸿沟。通过标签可以很好地将数据价值发挥出来,用价值倒推业务人员主动理解数据。DT时代,谁掌握了数据谁就有制胜权,没有使用上数据的公司、业务只能被动受限。在数据价值展现后,业务部门会主动与数据部门沟通数据源打通、数据质量提升优化、数据场景化使用等问题。这些问题在价值面前都能迎刃而解,千万不要仅仅依靠技术手段或行政命令来解决。


  • 数据价值运营是一个持续运作、坚持不懈的过程。数据价值运营是一个艰苦、持续的运行态,环节中的任何一环“罢工”,都会使得整个环节运行卡顿或减慢速度。例如数据源头有3个月不更新,产出的数据质量就会变差,业务部门就会投诉或拒绝使用。一旦业务部门在整个闭环中的参与度降低,三座大山又会从头再来。所以数据问题不是解决一次就能“长治久安”的,数据事业是一条需要长期耕耘、时刻警惕的艰辛之路。


对于以数据价值实现作为自身理想坚守的数据人来说,当数据魅力真正迸发的时候,那种兴奋和感动会让我们觉得人生的价值也一起得到了实现,也许就像有人说的,人生和理想互指迭代、同频共振了。所以真正的数据人并不会在数据问题面前失落和放弃。

上一篇:100页ppt讲清楚云原生(7)


下一篇:Project Euler 73: Counting fractions in a range