本节书摘来自华章出版社《数据分析实战
基于EXCEL和SPSS系列工具的实践》一书中的第1章,第1.2节,纪贺元 著,更多章节内容可以访问云栖社区“华章计算机”公众号查看。
1.2 数据分析能给我们带来什么
数据分析是有成本的,这种成本包括时间精力、金钱,以及情感上的烦恼等。既然有成本付出,那人们自然关心,我能够从数据分析中得到什么?
1.2.1 了解数据的整体状况
曾有人在培训时提出,我公司的业务状况,我非常清楚,还用得着分析吗?可是,事实真的是这样吗?你真的对公司的数据了如指掌?对它所体现的特征一清二楚?如果公司的数据量比较大、比较复杂,那么它就有可能存在潜在的价值,就有分析的必要。
数据的整体状况包括如下内容:
(1)总体状况
总体销量是多少?质量问题的总计是多少?研发团队目前有多少人?研发费用是多少?
(2)结构状况
在关注总量之余,我们也关心结构情况,例如销售在各产品、各区域的分布是怎么样的?哪些设备、哪些机床有质量问题?
(3)异常情况
曾经有客户问过我这个问题:“老师,我们希望把产品销售增速放缓的品线找出来,可以吗?”这里先解释一下客户的需求,就是假如客户一月份的销售增速是3%,二月份的增速是3.4%,三月份的增速是4.5%,如果四月份的增速是3.9%,那么4月份的增速就放缓了,就属于异常值。
什么是异常值?简单地讲,就是根据客户的想法感觉有些异样的值,这些值是我们要重点关注的东西,并且会试图分析其背后的原因。后面会成体系地详细讲解。
(4)其他一些数据特征
我们有时候也会关心数据的稳定性、对称性等特征,后续都会详细讲解。
1.2.2 快速查询数据
数据分析的第二个好处是我们可以快速地查询数据,在数据分析领域中,筛选查询是一个宽泛的课题,涉及很多技术,从简单的筛选数据到动态筛选再到ACCESS的数据查询,内容非常丰富。
我曾经碰到一个企业的老总,他跟我说,企业里面的数据,他不可能都记得很清楚,但是他时常需要了解某个数据,例如某个产品在某个时间段里的返修率是怎么样的,这个时候他会去问秘书,秘书找到数据后再告诉他。“有的时候查一个数据,要一个小时”,这位老总觉得效率不高。
碰到这种情况,如果企业的规模比较大,则需要建立数据库;对于小规模的企业来说,用VB控件把企业的重要数据全部整合起来放在一个EXCEL文件中,是一个高效而且切合实际的做法。后面会详细讲解VB控件的具体安装和应用。
1.2.3 数据之间关系的探索
这部分内容应该是数据分析中最像“数据分析”的部分,例如以下的问题:
产品价格中的成本占比是多少?
如果成本上升了,价格怎样调整才是最优的?
影响产品质量的因素有很多个,假如这些数据都是能量化的,那么哪些因素对产品质量是有影响的?
肥胖和饮食习惯对冠心病有影响吗?
这些都是“正规”的数据分析的内容,需要运用一些统计分析的模型算法等进行分析。
1.2.4 业务预测
这里把业务预测放在数据分析收益的最后,并不代表数据预测的重要性是排在最后的。在我和企业接触的过程中,发现很多企业都有数据预测的需求,即使我告知他们预测未必很准确,但是一些企业也坚持要做一些预测,他们认为科学预测过的数据,对他们的生产经营等能有一个比较科学的指导。