数据可视化:就是使用图形图表等方式来呈现数据,图形图表能够高效清晰地表达数据包含的信息。
Seaborn是基于matplotlib,在matplotlib的基础上进行了更高级的API封装,便于用户可以更加简便地做出各种有吸引力的统计图表。
可以说,seaborn是matplotlib的很好补充,而且能够高度兼容numpy与pandas数据结构以及scipy与statsmodels等统计模式。
安装:pip install seaborn
Seaborn是一个在Python中制作有吸引力和信息丰富的统计图形的库。它建立在matplotlib之上,并与PyData堆栈紧密集成,包括支持来自scipy和statsmodels的numpy和pandas数据结构和统计例程。 Seaborn旨在将可视化作为探索和理解数据的核心部分。绘图函数对包含整个数据集的数据框和数组进行操作,并在内部执行必要的聚合和统计模型拟合以生成信息图。如果matplotlib“试图让事情变得简单容易和难以实现”,seaborn会试图使一套明确的方案让事情变得容易。 Seaborn可以认为是对matplotlib的补充,而不是它的替代品。在数据可视化方面能够很好的表现。
分类统计图
(1)统计柱状图barplot(均值和置信区间)
(2)灰度柱状图countplot
(3)点图pointplot(均值和置信区间)
分类散点图
当有一维数据是分类数据时,散点图成为了条带形状:
(1)航线图stripplot,设置参数添加抖动方法jitter=True(点的直接展示)
(2)生成蜂群图swarmplot,避免散点重叠(点的直接展示)
分类分布图
(1)箱式图boxplot:上下边缘、上下四分位数、中位数(近似分布)
(2.1)提琴图violinplot:箱式图 + KDE((近似分布))
(2.2)非对称提琴图:violinplot里的split=True参数
分类统计子图
(1)单分类标准的子图factorplot
(2)多分类标准的子图PairGrid