OneModel体系能给数据中台的建设带来什么?

作者:柯根 更多内容详见数据中台官网 https://dp.alibaba.com
重要地位
造成企业大数据建设的痛点原因,概括起来就是“烟囱式”开发造成数据不标准、不规范。所以数据中台建设的切入点需要以“数据公共层建设”消除因“烟囱式”开发给业务带来的困扰和造成的技术上的浪费。而OneModel方法论则是打开局面和推动数据中台建设的关键。
核心能力

  • 规范定义
    在业界中常用数据字典文档的方式维护标准规范定义,但是往往“计划很丰满,现实很骨感”,文档在项目实际实践过程中,很难保证及时维护,到最后往往变成无人问津的“空中楼阁”;并且文档与开发严重脱节,到最后形成“上有政策,下游对策”的混乱局面。

就算数据字典能及时维护并严格遵守,它也只能短暂缓解业务痛点,但只是治标,对技术痛点几乎无用。因此,必须从源头出发,找到可以同时解决业务痛点和技术痛点的方法,而全局规划和数据规范定义就是治本的方法。
OneModel方法论保障了数据唯一性的数据域、业务过程,以及在数据域、业务过程之下的指标、实体属性等的结构性封装、命名和定义。
数据规范定义是在开发之前,以业务的视角进行数据的统一和标准定义,确保计算口径一致、算法一致、命名一致,后续的数据模型设计和ETL开发都是在此基础上进行的。主要基于以下几部分内容:

  1. 基于对业务和数据的理解,对数据进行基于业务本身但超越和脱离业务需求限制的抽象。主要的抽象不随着业务团队的组织架构变动而变动,即抽象出业务板块、数据域、业务过程、维度。
  2. 基于以上抽象出的业务过程和维度,进一步定义原子指标、业务限定、计算周期、计算粒度。
  3. 基于定义的原子指标、业务限定、计算周期、计算粒度,可结构化定义出派生指标,并继承原子指标的数据类型、算法,并形成标准化的派生指标名称定义。
  4. 通过数据中台不断的迭代优化,积累大量统一、标准的指标。
  • 模型设计
    在数据模型设计中,OneModel方法论保障模型复用和稳定的数据基础层、数据中间层、数据应用层分层架构设计,以及各层模型设计的核心原则。

数据模型设计在数据规范定义的基础上,从业务应用或者需求来源端控制了数据模型设计的重要输入源头。其次,对数据模型严格分层,在统一数据公共层的同时允许数据应用层百花齐放。第三,从业务和技术双视角下,严格要求数据模型设计满足“高内聚、低耦合”的标准。

  • 数据开发
    在ETL开发中,开发过程遵循标准有效的开发规范,并将以往ETL开发人员所积累的经验做沉淀。

工具沉淀
仅仅有方法论是远远不够的,很多企业不乏拥有业界通用方法论以及成型的数据模型。但往往发现若没有产品做支撑,方法论落地存在很大的困难。需要有足够多建模经验丰富的模型架构师、经验丰富的数据研发工程师,以及要在企业内部对方法论达成绝对的一致。这对于有一定规模的企业来说都是很难实现的。
因此阿里巴巴云上数据中台团队基于多年在集团内部的实战经验,将OneModel方法论沉淀到数据中台产品Dataphin中。
Dataphin通过OneModel方法论为指导,沉淀出一站式的规范、工具型数据产品,产品主要包括以下几部分:规范化数据建模,特别关注数据规范定义、数据模型设计和ETL开发等全流程;落地和承载规范化数据建模的规范化研发工具;规范化建模产生的所有分层数据模型;所有数据在面对应用时都会被监控和调度,且对上线、下线调优监控会反馈到规范化数据建模中。
将原先割裂的数据规范定义、数据模型设计、ETL开发连接在一期,实现“设计即开发,所建即所得”。将数据规范定义从工具层面的数据命名+结构化抽象定义合二为一,并与数据模型设计连接,进而直接支撑ETL开发。当数据规范定义完成之后,每一个指标都可以根据结构化命名规则和计算逻辑快速映射到对应的物理表中。
只要某个指标能够被规范定义,针对该指标的代码即可自动化生成,而一系列经过规范定义的指标则会根据相同计算粒度,聚集到若干物理表或逻辑表中,这样形成的物理表或逻辑表,其全部代码和自动化生成。对于中间生成过程不必关心,因为这是系统内部的智能黑盒要以智能化的方式来解决的。并且智能黑盒不仅实现代码自动化生成,还关心优化生成代码及其任务调度所对应的计算逻辑。
下图为Dataphin通过基于逻辑模型的数据规范定义、智能设计及智能研发(黑盒实现代码自动化及任务优化)、基于逻辑模型的主题式查询等特性,带来全新、高效、标准的一体化设计及开发的数据中台构建和使用模式。
OneModel体系能给数据中台的建设带来什么?

结语:
阿里巴巴数据中台团队,致力于输出阿里云数据智能的最佳实践,助力每个企业建设自己的数据中台,进而共同实现新时代下的智能商业!
阿里巴巴数据中台解决方案,核心产品:
Dataphin,以阿里巴巴大数据核心方法论OneData为内核驱动,提供一站式数据构建与管理能力;
Quick BI,集阿里巴巴数据分析经验沉淀,提供一站式数据分析与展现能力;
Quick Audience,集阿里巴巴消费者洞察及营销经验,提供一站式人群圈选、洞察及营销投放能力,连接阿里巴巴商业,实现用户增长。
欢迎志同道合者一起成长!更多内容详见数据中台官网 https://dp.alibaba.com

上一篇:数据中台交付专家告诉你,数据架构的分层怎样更加合理?


下一篇:Dataphin新版本功能解读系列之-V2.5