(CDA数据分析师学习笔记)第五章多维数据透视分析一

  • DW:数据仓库(data warehouse),企业的数据存储集合。可以有多种用途,如做报表、BI报告、其他的分析功能。可存储历史数据、可根据主题有不同的组织形式等。
  • OLAP和OLTP:OLAP是联机分析处理(On-Line Analytical Processing),OLTP是联机事务处理(on-line transaction processing)。OLTP是传统的关系型数据库的主要应用,主要是基本的、日常的事务处理,例如银行交易。OLAP是数据仓库系统的主要应用,支持复杂的分析操作,侧重决策支持,并且提供直观易懂的查询结果。 
  • 建立一个BI报表需要经过ETL、DW、OLAP及数据可视化4个阶段。
  • OLAP技术是关键,包含两步:1 创建多维数据模型,2 创建针对度量的汇总规则。
  • 多维数据模型中的维度在分析过程中代表业务角度。
  • 多维数据模型又称多维数据集或立方体,将DW中的多源数据连接到一起,解决“信息孤岛”问题。
  • 数据分析领域有两种类型建模:一是搭建多维数据模型,二是建立分析所需的数学模型。
  • 创建多维数据模型的过程就是在多个不同的数据表间进行连接的过程。连接使用公共字段。连接时星号(*)代表多表,1代表一表。连接线中的箭头代表筛选器,双向箭头代表双向筛选。影响连接汇总结果的因素:筛选器的方向、对应关系、汇总角色。
  • 透视分析的本质就是维度字段对度量字段的的汇总计算。汇总的时候通过1表出维度字段,多表出度量字段,如果相反会造成汇总错误。
  • 上一篇:【MATLAB源码-第41期】基于压缩感知算法的OFDM系统信道估计和LS算法对比仿真。-1、算法描述