数据仓库的基本特征

面向主题:

主题是一个在较高层次将数据归类的标准,每一个主题基本对应一个宏观的领域,基于主题组织的数据被划分为各自独立的领域,每一个领域都有自己的逻辑内涵互不交叉,如:产品,客户,销售,财政收入等。因此,在数据进入数据仓库之前,必然要经过加工和集成,将原始数据结构做一个从面向应用到面向主题的大转变。

集成特性

指数据仓库能将多个异种数据源,如关系数据库、一般文件、层次数据库和网络结构化的数据库等集成在一起。在数据进入数据仓库之前,必须经过数据加工和集成,统一原始数据中的矛盾之处,确保命名约定、编码、结构、属性度量、冲突键码等的一致性

非易失

指数据存入数据仓库后基本上不再改变

时变的

指数据项与时间点有关,两层涵义:

数据仓库是不同时间的数据集合,它要求数据仓库中的数据保存时限能满足进行决策分析的需要(例如:过去的510年),而且数据仓库中的数据都要标明该数据的历史时期。









本文转自 牛海彬 51CTO博客,原文链接:http://blog.51cto.com/newhappy/77052,如需转载请自行联系原作者
上一篇:携程基于Flink的实时特征平台


下一篇:CRM中间件里的发布-订阅者模式