前言
Hello,各位小伙伴,今天开始我们来学习数据分析、处理
相关的知识。有一部分读者知道我主要学习的语言是Java,但是Python也是我最感兴趣的语言之一,Python在平时当中更多的是给我一种辅助。所以这个系列的知识,我打算用最简单、轻松
的方式来讲解相关的知识。
在前面我写过很多的爬虫类的文章,我自己也帮别人做过几个爬虫类的项目,所以数据的重要性以及价值是非常高的
。很多时候,你获取了数据,但是你并不知道如何利用起来,这就说明了我们数据分析的能力还需要提升。我并不觉得数据分析是一门课,我更偏向于是我们的一种能力
,我们只不过通过编程来实现它。
学习数据分析有什么用?
不管学什么之前,我都会问自己学这个东西有什么用,其次才是如何去学。
数据,我相信每个人都对它并不陌生。数据分析就是通过大量数据进行分析,得出某种规律,以帮助我们来作出一系列的判断,从而采取一些相应的措施。
上面可能会有些拗口,举个简单的例子,如果我们想去淘宝上开个商铺,到底卖什么好呢?如果我们此时有淘宝每类商品的售卖情况数据,通过简单的分析,我们就可以列出排名前几的商品了,然后卖啥,你懂的~
matplotlib
matplotlib这个库相信大家听说过,这个库能够帮我们通过图形的形式来可视化数据。有些人会说,数据分析不应该先学分析吗?为什么先学可视化呢?
这其实是我自己的习惯,如果一上来就去学一些枯燥的分析方法,那必定会放弃,如果开始就来学习一些可视化的东西,会让我的兴趣更大(兴趣是最好的老师)。
废话不多说(上面也不完全是废话,不管学什么都需要的必备步骤),我们直接开干!
matplotlib: 目前比较流行的Python底层绘图库,主要做数据可视化图表,从名字上看与我们的MATLAB很像,其实它就是模仿MATLAB构建的。
matplotlib基础绘图
我们首先来画个简单的图形
# 导入相关库 import matplotlib.pyplot as plt # 设置x轴上的值 x = [1, 2, 3] # 设置y轴上的值 y = [1, 2, 3] # 画出折线图 plt.plot(x, y) # 展示折线图 plt.show()
效果:
在上面的代码中可以看到我们创建了两个列表x,y ,其实这两个列表一一对应就是一个一个的坐标,例如上面的坐标就是 (1,1) (2,2) (3,3)
我们可以简单的进行修改
# 设置x轴上的值 x = [4, 1, 5] # 设置y轴上的值 y = [2, 3, 4]
效果:
对应的坐标就是(4,2) (1,3) (5,4)
设置图片大小以及保存图片
有时我们需要将图片的大小设置成我们需要的大小,并且更多时候想把我们可视化的图片给下载下来,怎么操作呢?
只需通过下面一行代码即可:
# figsize设置图片大小(20为长,8位宽),dpi像素点 fig = plt.figure(figsize=(20, 8), dpi=80)
未修改之前
修改之后
可以看到我们的图片大小产生了变化。
除此之外,我们也需要知道保存自己分析后的图片方法。同样,只需一行代码就能够简单实现:
# 保存图片,可以保存为svg矢量图格式 plt.savefig("t1.png")
生成后的图片
这里的svg矢量图就是比较适合网页上面的图片,具体的大家可以百度一下。
改变横纵坐标的刻度
很多时候我们都需要来修改我们的坐标轴刻度以满足我们的数据分析要求,如何修改,其实也非常的简单。
# 将 x轴 的刻度调整为 0-9 , 每一个刻度之间间距为1 x_list = range(0, 10, 1) _x = x_list plt.xticks(_x) y_list = range(0, 10, 1) _y = y_list plt.yticks(_y)
效果:
我们将其简单的修改一下
# 将 x轴 的刻度调整为 0-9 , 每一个刻度之间间距为2 x_list = range(0, 10, 2) _x = x_list plt.xticks(_x) y_list = range(0, 10, 2) _y = y_list plt.yticks(_y)
效果:
到目前,基本的折线图我们能够完成了,为了保证每篇文章的篇幅以及大家的阅读体验,这里就不多写了,下一篇文章我们将继续来研究matplotlib。
总结
这篇文章主要是用来开篇,看看大家的反响如何,如果你正在学习这方面的知识,或者你在工作中需要这方面的知识,希望能够继续阅读数据分析
这个系列的文章,麻烦各位老铁点点右下角的在看
!