数据地图产品设计的一个重要原则是让数据资产尽可能地在组织内(一个租户,可以是公司或者部门)被更好地共享、发现,从而提升数据的使用率、降低数据重复率,以助力数据价值的挖掘和成本节约。本文以数据地图对MaxCompute表的管理为例,介绍几种常用的数据组织和数据查找的几种方式,以便帮助您更好地使用产品。
数据组织
在数据地图中,对数据表进行分类组织有如下多种方式:
- 使用类目:
类目是被用来进行表组织的最常用方式。可以按照实际需要,按组织维度或者按业务维度来定义类目树,然后将表归属到对应类目下
-
操作入口
-
新增表到类目中,通过选择项目,用关键字检索,选择表添加到类目中即可
- 收藏表:
将关注的表加入收藏夹也是用来组织的另外一个常用方式之一。加入收藏夹的操作入口有以下多种:
-
在全部数据列表中,收藏表
-
在表详情页中加入收藏
-
在项目下表列表中进行操作
-
其它隐藏的组织逻辑:
-
按数据类型自动组织
- 数据地图除支持MaxCompute数据之外,已经支持了E-MapReduce、AnalyticDB for PostgreSQL等多中数据类型,在“全部数据”所有表列表中,表会按照类型分门别类组织展示
-
按MaxCompute项目/其它类型的数据库自动组织
- 此项无需手动操作配置,系统在进行元数据收集和数据目录构建时会自动处理,将相同MaxCompute项目下的表自动组织到一起
-
数据查找
数据查找->查看表详情是在日常工作中最高频使用的场景。在上述介绍的数据组织的工作基础之上,数据地图提供了如下几种方式来供您进行快速数据查找。
- 全局搜索
全局检索是可以说是用来找表的最频繁的功能,没有之一。当前支持对表名、字段名、MaxCompute项目名称中的关键字进行文本检索。表描述、字段描述等更多的检索对象在产品路线上,会在稍后带来。
数据地图中,对象检索的搜索框入口有以下几处:
-
数据地图首页:
-
全部数据的表列表页:
-
表详情页:
介绍检索时几个实用小的技巧:
-
搜索项目名、快速切换到MaxCompute项目,查看该项目下的所有表,如下图所示
-
在搜索结果页面,灵活利用左侧的项目过滤,缩小查找范围
- 利用类目导航
在配置好表的类目归属的前提下,类目导航是非常实用的一个分类找表的方式。这个入口有点隐蔽(需要优化),在下图所示。点击特定类目后即可找出该类目下的所有表。这种方式非常适合按图索骥,去按照部门或者业务域的划分,来找到逻辑分类一致的表。
-
使用入口
-
查看我的数据
-
“我的数据”中提供了“我拥有的数据”、“我管理的数据”和“生产账号的数据”三种组织方式,其含义分别如下。通过切换不同Tab,可以来查找不同分类的数据,这也是找数据的常用方式之一。
- 我拥有的数据:我是MaxCompute表负责人的表的列表
- 我管理的数据:我是DataWorks工作空间管理员的MaxCompute项目下的表
- 生产账号的数据:我是DataWorks工作空间成员,对应的该MaxCompute项目下的所有的表
-
“我的收藏”Tab也在“我的数据”这个一级导航之下,充分利用“无处不在”的搜藏按钮,可以大幅提升找数据效率
-
-
首页的快速导航
-
首页上提供了个人视角和全局视角的浏览和读取数据的一个榜单,此处也是快速找数据的方式之一
-
-
最后的黑科技
- 细心观察的用户会发现,在数据地图的MaxCompute项目详情和表详情的URL,实际是有规律可循的。通过修改URL的项目名或者表名,也可以达到快速切换对象的目的。
-
MaxCompute项目和表的典型的链接如下:
-
项目详情:https://dmc-cn-shanghai.data.aliyun.com/dm/project/odps.xc_dpe_e2_dev#/
- 红色标识部分是项目名,比如去掉‘_dev’可以在开发项目和生产项目之间快速切换,或者整体换成其它项目名称
-
表详情:https://dmc-cn-shanghai.data.aliyun.com/dm/table/odps.xc_dpe_e2_dev.account_record/detail/col
- 红色标识部分是项目名和表名,替换后可以快速切换到其它表**
-
DataWorks百问百答历史记录请点击查看
更多DataWorks技术和产品信息,欢迎加入【DataWorks钉钉交流群】