seaborn绘图包的使用(持续更新中)

Seaborn概述

Seaborn是基于matplotlib的Python数据可视化库,并与pandas数据结构紧密集成。它提供了一个高级界面,用于绘制引人入胜且内容丰富的统计图形。它相对matplotlib用起来很简单,只需要简单几行代码就能绘制出比较好的图。

seaborn提供的一些功能

  1. 面向数据集的API,用于检查多个变量之间的关系
  2. 专门支持使用分类变量显示观察结果或汇总统计信息
  3. 可视化单变量或双变量分布以及在数据子集之间进行比较的选项
  4. 不同种类因变量的线性回归模型的自动估计和绘图
  5. 方便查看复杂数据集的整体结构
  6. 用于构造多图网格的高级抽象,可让您轻松构建复杂的可视化
  7. 带有几个内置主题的 matplotlib图形样式的精确控制
  8. 选择能够忠实显示数据中图案的调色板的工具
  9. 提供一些内置数据集

下面我会通过一些简单绘图,以及一些可视化的应用来介绍部分功能,由于Seaborn这个包相对还是比较多,我提到的只是一个片面,最好的学习资料永远是官方文档

内置数据集

seaborn自带了一些数据,方便我们学习使用,这几个数据集也是很好的数据可视化案例分析对象,我们可以查看一下相应自带的那些数据集。但首先我们要做好准备工作,这个是不能忘的。

准备工作

首先查看一下我们电脑上安装的seaborn版本是什么样,因为不同版本号存在图形和功能差异,这个小编踩过坑,同样的代码在不同版本的运行结果不同,有可能还会报错,希望大家可以和我的版本一致,至于怎么查看自己安装的包对应的版本号和如何升级,这个我就不介绍了。

import seaborn as sns
sns.__version__

运行结果:

'0.9.0'

我们方便后面的进行,最好还做一下这些准备,注意我用的jupyter notebook环境编辑的,有些存在差异,自己修正就行了。

#准备工作
import matplotlib.pyplot as plt
%matplotlib inline
import numpy as np
import pandas as pd
plt.rcParams['font.sans-serif'] = ['SimHei']# 支持中文显示
plt.rcParams['axes.unicode_minus'] = False #用来正常正负符号
sns.set_style('darkgrid',{'font.sans-serif':['SimHei','Arial']})
import warnings #去除部分警告信息
warnings.filterwarnings('ignore')

调用在线数据集

seaborn提供了一些在线数据集,方便我们入门学习使用,我们首先可以看看有哪些数据集:

names = sns.get_dataset_names()#查看seaborn自带的数据集名称
names

运行结果:

['anscombe',
 'attention',
 'brain_networks',
 'car_crashes',
 'diamonds',
 'dots',
 'exercise',
 'flights',
 'fmri',
 'gammas',
 'iris',
 'mpg',
 'planets',
 'tips',
 'titanic']

我们可能好奇这些数据集分别是什么类型的数据集,具体是什么,这个我们可以去github上面看这个链接
看到这里我们就想知道怎么调用这些数据了,主要利用seaborn.load_dataset()函数。我们可以看看这个函数的相关参数:

#Seaborn内置数据集
# seaborn.load_dataset(name,cache=True,data_home=None,**kws)
# Seaborn内置数据集可以通过load_dataset函数加载数据集,返回dataframe对象
# name 参数是数据集名字,https://github. com/mwaskom/seaborn-data定义数据集名。
# cache参数是否提供缓存。
# data_home参数是指定缓存路径,默认当前用户home下的seaborn-
# data 目录中。
# sns. get_dataset_names ()获得数据集名字

下面我以泰坦尼克号的数据为例,给大家看看怎么使用:

titanic=sns.load_dataset('titanic',cache=True)#导入泰坦尼克号数据集,以数据框的形式

当我们导入之后可以看看数据:

titanic.head(10)#显示前十条数据,默认五条

运行结果:
seaborn绘图包的使用(持续更新中)

上一篇:seaborn系列 (5) | 柱状图countplot()


下一篇:python库之seaborn库