《R语言数据挖掘》----1.15 结果可视化

本节书摘来自华章出版社《R语言数据挖掘》一书中的第1章,第1.15节,作者[哈萨克斯坦]贝特·麦克哈贝尔(Bater Makhabel),李洪成 许金炜 段力辉 译,更多章节内容可以访问云栖社区“华章计算机”公众号查看。

1.15 结果可视化

可视化是数据描述的图形表示,以便一目了然地揭示复杂的信息,包括所有类型的结构化信息表示。它包括图形、图表、图解、地图、故事板以及其他结构化的图示。

好的可视化结果使你有机会通过专家的眼光来查看数据。可视化结果很美,不仅因为它们的美学设计,而且因为它们有效地生成见解和新理解的优雅的细节层。

数据挖掘的每个结果都可以通过使用算法进行可视化说明。可视化在数据挖掘过程中起着重要的作用。

创建最佳的可视化有4个主要特征:

新颖的:可视化不能只作为一个信息渠道,而且还要提供一些新意,以新的风格呈现信息。

信息化的:对这些因素和数据本身的注意将形成一个有效的、成功的且漂亮的可视化结果。

有效的:好的可视化结果有明确的目标、清晰定义的信息或者用于表达信息的特殊视角。它必须尽可能简单明了,但不应该丢失必要的、相关的复杂性。这里无关的数据可以看作噪声。可视化应该反映它们所代表的数据的质量,揭示数据源中内在的和隐含的性质与关系,以便给最终使用者带来新的知识、见解和乐趣。

美感:图形必须为呈现信息的主要目标服务,不仅仅是坐标轴、布局、形状、线条和排版,而且还要恰当使用这些工具。

可视化与R语言

R语言提供了具有出版质量的图表和图形的制作。R语言中包含图形设备,还有一些设备不属于标准R语言安装的一部分,可以通过命令行使用R语言中的图形。

R语言图形设置的最重要特征就是在R中存在两种截然不同的图形系统。

传统的图形系统

网格图形系统

将对最合适的设施进行评估并将它们应用于本书列出的所有算法的每一个结果的可视化中。

R图形系统和添加包中的函数可以分为如下几种类型:

生成完整图形的高级函数

给现有图形添加进一步输出的低级函数

与图形输出交互运行的函数

可以以多种图形格式产生R的图形输出,比如PNG、JPEG、BMP、TIFF、SVG、PDF和PS。

为了加强你对本章知识的理解,这里有一些练习用于你检查相关的概念。

上一篇:为何图片经过OSS缩略之后尺寸变大了?——影响不同格式图片文件大小的一些因素和实际示例


下一篇:(转)并发场景下HashMap死循环导致CPU100%的问题