R语言用相关网络图可视化分析汽车配置和饮酒习惯

2024-02-21 16:22:28

原文链接：http://tecdat.cn/?p=22772

我们经常使用的一个关系性指标是相关性。通过可以利用数据框架和绘图来帮助探索相关关系。

本文先创建了相关关系的关系数据框，然后绘制了关系结构。

我们将使用以下库。

给定一个由数字变量组成的数据框d，我们想在网络中绘制其相关性，这里有一个基本方法。

让我们按照这个方法来处理MTCars数据集。默认情况下，所有的变量都是数字的，所以我们不需要做任何预处理。

我们首先创建一个相关性数据框，并将其转换为一个图形对象。

接下来，我们将这些值转换为一个无向图对象。该图是不定向的，因为相关关系没有方向。相关关系没有因果关系。

因为，我们通常不希望看到所有的相关关系，我们首先过滤（）出绝对值小于某个阈值的任何相关关系。例如，让我们包括0.3或更强的相关关系（正或负）。

我们绘制这个对象。下面是一个基本图。

plot(cors)

改进之后的。

plot(cors,width = abs(r), color = r,title="汽车变量之间的相关关系")

这个例子需要进行一些数据预处理，我们只看强正相关。

让我们来看一个关于世界各国的啤酒、葡萄酒饮用量的数据。

我想找出欧洲和美洲的哪些国家有类似的啤酒、葡萄酒和烈酒饮用习惯，以及澳大利亚在其中的地位。绑定地理信息并找到我感兴趣的国家，把这些数据变成相关数据的形状。

这个数据包括每个国家喝的啤酒、葡萄酒和烈酒数量的Z-scores。

我们现在可以继续使用我们的标准方法。因为我只对哪些国家真正相似感兴趣，我们过滤相关系数低的数据。（r>0.9）

plot(cors,alpha = r, color = r,title = "哪些国家有类似的饮酒习惯？")

这些国家的饮酒行为分为三个群组。

例如澳大利亚与许多西欧和北欧国家如英国、法国、荷兰、挪威和瑞典一起出现在左上方的集群中。

最受欢迎的见解