元数据的来源

一、  源系统
1、   操作型系统数据模型(手工制作或建模工具)
2、   来自于系统文档的数据元素定义
3、   物理文件布局及字段定义
4、   程序规范
5、   外部数据来源的文件布局和字段定义
 
二、  数据抽取
1、   源平台的数据和连接
2、   所选择的数据源的布局和定义
3、   用于抽取的字段的定义
4、   在每一个平台上初始抽取文件的合并准则
5、   标准化字段类型与长度的规则
6、   数据抽取计划
7、   增量修改的抽取方法
8、   数据抽取任务流
 
三、  数据转换和清洗
1、   抽取文件到数据准备文件的映射规范
2、   单独文件的转换规则
3、   字段默认值 
4、   有效性检查和商业规则
5、   分类及重排序安排
6、   从数据抽取到数据准备的审查跟踪
 
四、  数据装载
1、   从数据准备文件到装载映象的映射规则
2、   为每个文件分配键时的分配规则
3、   数据准备到装载映象的审查跟踪
4、   完全刷新的计划
5、   增时装载的计划
6、   数据装载任务流
 
五、  数据存储
1、   集中式数据仓库独立数据集市的数据模型
2、   由多个表组成的主题区域
3、   统一化数据集市的数据模型
4、   物理文件
5、   表和列的定义
6、   有效性检查的商业规则
 
六、  信息传递
1、   查询和报表工具列表
2、   预定义查询和报表的列表
3、   特殊OLAP数据库的数据模型
4、   OLAP检索数据的计划
本文转自   wenyan  51CTO博客,原文链接:http://blog.51cto.com/wenyan/10086
上一篇:如何选择合适企业自身的云服务器机型?


下一篇:《淘宝店铺 大数据营销+SEO+爆款打造 一册通》一一1.2 淘宝流量来源分析