第1章 初识数据挖掘
随着计算机技术、网络技术、通信技术和Internet技术的发展,以及各行各业业务操作流程的自动化,企业内积累了大量业务数据,这些数据动辄以TB计算。这些数据和由此产生的信息是企业的财富,它如实地记录着企业运作的状况。面对大量的数据,迫使人们不断寻找新的工具,来对企业的运营规律进行探索,为商业决策提供有价值的信息,使企业获得利润。能满足企业这一迫切需求的有力工具就是数据挖掘。对于企业而言,数据挖掘有助于发现业务的趋势,揭示已知的事实,预测未知的结果。从这个意义上讲,知识是力量,数据挖掘是财富。
1.1 什么是数据挖掘
数据挖掘(Data Mining,DM):就是从大量数据(包括文本)中挖掘出隐含的、未知的、对决策有潜在价值的关系、模式和趋势,并用这些知识和规则建立用于决策支持的模型,提供预测性决策支持的方法、工具和过程;是利用各种分析工具在海量数据中发现模型和数据之间关系的过程。这些模型和关系可以被企业用来分析风险、进行预测。
数据挖掘的目的就是从数据中“淘金”,就是从数据中获取智能的过程。
Gartner Group提出:“数据挖掘是通过仔细分析大量数据来揭示有意义的新的关系、模式和趋势的过程。它使用模式认知技术、统计技术和数学技术。”
The META Group的Aaron Zornes表示:“数据挖掘是一个从大型数据库中提取以前不知道的可操作性信息的知识挖掘过程。”
总之,由于企业内产生了大量的业务数据,这些数据和由此产生的信息是企业的财富,它如实记录了企业运作的状况。通过数据挖掘分析,能帮助企业发现业务的趋势,揭示已知的事实,预测未知的结果。数据挖掘已成为企业保持竞争力的必要方法。