本节书摘来自华章出版社《R语言数据挖掘:实用项目解析》一书中的第1章,第1.14节什么是数据挖掘,作者[印度]普拉迪帕塔·米什拉(Pradeepta Mishra),更多章节内容可以访问云栖社区“华章计算机”公众号查看
小结
通过之前的讨论可以得出这样的结论:数据处理和数据管理是很多实际数据挖掘项目执行中的重要一环。由于R语言提供了较好的统计编程平台和可视化,因此用R语言来向读者解释很多数据挖掘原理也是很有意义的。本章介绍了初步的数据挖掘和R语言原理、编程基础、R数据类型等,还介绍了使用R语言导入和导出多种格式的外部文件的方法,以及缺失值的处理方法。
下一章将深入介绍如何使用R语言进行数据探索以及如何理解一元、二元和多元数据集。读者应先了解原理,然后理解实际阐释,再通过R实现掌握与探索性数据分析相关的内容。